Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA CURSOS DE GRADUAÇÃO – EAD Probabilidade e Estatística – Prof. Ms. Carlos Alberto Marinheiro e Prof. Ms. Cláudio Pereira Bidurin Meu nome é Carlos Alberto Marinheiro, sou mestre em Bioengenharia, pela Interunidades Escola de Engenharia de São Paulo, Instituto de Química de São Carlos e Faculdade de Medicina de Ribeirão Preto, da Universidade de São Paulo. Tenho formação em Matemática (licenciatura plena), Pedagogia e Engenharia Civil, com especializações em: Geometria Analítica (Matemática), Métodos de Procedimentos Didáticos (Educação) e Metodologia e Técnicas de Ensino (Educação) e pós-graduação lato sensu em Metodologia do Ensino de Matemática. Atuo como docente nas áreas de Metodologia da Pesquisa Científica, Administração de Produção, Estatística Aplicada à Administração, Desenho Geométrico e Geometria Descritiva, Tópicos de Educação Matemática e Biofísica em diversos cursos de Graduação, e com Metodologia da Pesquisa Científica nos cursos de Pós-graduação. Além disso, sou coordenador da CPA (Comissão Própria de Avaliação) e membro do CEP (Comitê de Ética em Pesquisa) no Centro Universitário Claretiano de Batatais. E-mail: marinheiro@claretiano.edu.br Olá! Meu nome é Cláudio Pereira Bidurin. Sou bacharel e mestre em Estatística pela Universidade Federal de São Carlos (UFSCar). Já atuei como estatístico em indústrias e no setor público, no período de 2001 a 2007. Atualmente, sou consultor e assessor em desenvolvimento de análises e modelagem estatística em empresas e no departamento de pesquisas da USP e da UFSCar. Sou professor de Estatística no Ensino Superior há mais de 15 anos e, no Centro Universitário Claretiano, atuo há mais de dez anos, tanto em cursos presenciais quanto em cursos a distância. Coloco-me à disposição para contribuir com você, aluno EaD, por uma aprendizagem significativa. E-mail: bidurin@claretiano.edu.br Fazemos parte do Claretiano - Rede de Educação PROBABILIDADE E ESTATÍSTICA Carlos Alberto Marinheiro Cláudio Pereira Bidurin Batatais Claretiano 2013 Fazemos parte do Claretiano - Rede de Educação © Ação Educacional Claretiana, 2012 – Batatais (SP) Versão: dez./2013 519 M289p Marinheiro, Carlos Alberto Probabilidade e estatística / Carlos Alberto Marinheiro, Cláudio Pereira Bidurin – Batatais, SP : Claretiano, 2013. 240 p. ISBN: 978-85-8377-042-8 1. Conjuntos. 2. Análise combinatória. 3. Probabilidade. 4. Gráficos. 5. Medidas. I. Bidurin, Cláudio Pereira. II. Probabilidade e estatística. CDD 519 Corpo Técnico Editorial do Material Didático Mediacional Coordenador de Material Didático Mediacional: J. Alves Preparação Aline de Fátima Guedes Camila Maria Nardi Matos Carolina de Andrade Baviera Cátia Aparecida Ribeiro Dandara Louise Vieira Matavelli Elaine Aparecida de Lima Moraes Josiane Marchiori Martins Lidiane Maria Magalini Luciana A. Mani Adami Luciana dos Santos Sançana de Melo Luis Henrique de Souza Patrícia Alves Veronez Montera Rita Cristina Bartolomeu Rosemeire Cristina Astolphi Buzzelli Simone Rodrigues de Oliveira Bibliotecária Ana Carolina Guimarães – CRB7: 64/11 Revisão Cecília Beatriz Alves Teixeira Felipe Aleixo Filipi Andrade de Deus Silveira Paulo Roberto F. M. Sposati Ortiz Rodrigo Ferreira Daverni Sônia Galindo Melo Talita Cristina Bartolomeu Vanessa Vergani Machado Projeto gráfico, diagramação e capa Eduardo de Oliveira Azevedo Joice Cristina Micai Lúcia Maria de Sousa Ferrão Luis Antônio Guimarães Toloi Raphael Fantacini de Oliveira Tamires Botta Murakami de Souza Wagner Segato dos Santos Todos os direitos reservados. É proibida a reprodução, a transmissão total ou parcial por qualquer forma e/ou qualquer meio (eletrônico ou mecânico, incluindo fotocópia, gravação e distribuição na web), ou o arquivamento em qualquer sistema de banco de dados sem a permissão por escrito do autor e da Ação Educacional Claretiana. Claretiano - Centro Universitário Rua Dom Bosco, 466 - Bairro: Castelo – Batatais SP – CEP 14.300-000 cead@claretiano.edu.br Fone: (16) 3660-1777 – Fax: (16) 3660-1780 – 0800 941 0006 www.claretianobt.com.br SUMÁRIO CADERNO DE REFERÊNCIA DE CONTEÚDO 1 INTRODUÇÃO ................................................................................................... 9 2 ORIENTAÇÕES PARA ESTUDO .......................................................................... 10 3 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 28 4 E-REFERÊNCIAS ................................................................................................ 28 UNIdAdE 1 – A NATUREZA DOS DADOS ESTATÍSTICOS 1 OBJETIVOS ........................................................................................................ 29 2 CONTEÚDOS ..................................................................................................... 29 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 30 4 INTRODUÇÃO À UNIDADE ............................................................................... 30 5 ORIGEM E HISTÓRIA DA ESTATÍSTICA ............................................................. 31 6 CONCEITOS IMPORTANTES EM ESTATÍSTICA ................................................. 33 7 POPULAÇÃO VERSUS AMOSTRA ..................................................................... 35 8 MÉTODOS DE AMOSTRAGEM ......................................................................... 37 9 A COLETA DE DADOS ........................................................................................ 42 10 TRABALHANDO EM SALA DE AULA ................................................................. 43 11 QUESTÕES AUTOAVALIATIVAS ........................................................................ 45 12 CONSIDERAÇÕES .............................................................................................. 45 13 E-REFERÊNCIAS ................................................................................................ 46 14 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 46 UNIdAdE 2 – TABULAÇÃO DE DADOS 1 OBJETIVOS ........................................................................................................ 47 2 CONTEÚDOS ..................................................................................................... 47 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 48 4 INTRODUÇÃO À UNIDADE ............................................................................... 48 5 OS DADOS BRUTOS ......................................................................................... 48 6 TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS ................................................ 51 7 GRÁFICOS DE FREQUÊNCIAS ........................................................................... 57 8 GRÁFICOS DE FREQUÊNCIAS NO EXCEL 2003 ................................................ 59 9 GRÁFICOS DE FREQUÊNCIAS NO EXCEL 2007 OU 2010 ................................. 65 10 GRÁFICOS DE SÉRIES ........................................................................................ 77 11 TRABALHANDO EM SALA DE AULA ................................................................. 87 12 QUESTÃO AUTOAVALIATIVA ............................................................................ 88 13 CONSIDERAÇÕES .............................................................................................. 92 14 E-REFERÊNCIAS ................................................................................................ 92 15 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 93 UNIdAdE 3 – MEDIDASESTATÍSTICAS DE POSIÇÃO 1 OBJETIVOS ........................................................................................................ 95 2 CONTEÚDOS ..................................................................................................... 95 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 95 4 INTRODUÇÃO À UNIDADE ............................................................................... 96 5 MEDIDAS ESTATÍSTICAS DE TENDÊNCIA CENTRAL ........................................ 97 6 RELAÇÃO ENTRE AS MEDIDAS DE TENDÊNCIA CENTRAL ............................. 122 7 MEDIDAS SEPARATRIZES.................................................................................. 124 8 TRABALHANDO EM SALA DE AULA ................................................................. 127 9 QUESTÕES AUTOAVALIATIVAS ........................................................................ 132 10 CONSIDERAÇÕES .............................................................................................. 134 11 E-REFERÊNCIAS ................................................................................................ 134 12 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 134 UNIdAdE 4 – MEDIDAS ESTATÍSTICAS DE DISPERSÃO 1 OBJETIVOS ........................................................................................................ 137 2 CONTEÚDOS ..................................................................................................... 137 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 138 4 INTRODUÇÃO À UNIDADE ............................................................................... 138 5 MEDIDAS DE DISPERSÃO ................................................................................. 139 6 APLICAÇÕES DO DESVIO PADRÃO .................................................................. 145 7 RECURSOS TECNOLÓGICOS ............................................................................. 152 8 EXEMPLOS DE APLICAÇÃO DAS MEDIDAS DE VARIABILIDADE .................... 158 9 QUESTÕES AUTOAVALIATIVAS ........................................................................ 170 10 CONSIDERAÇÕES .............................................................................................. 172 11 E-REFERÊNCIAS ................................................................................................ 173 12 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 173 UNIdAdE 5 – TEORIA ELEMENTAR DE PROBABILIDADE 1 OBJETIVOS ........................................................................................................ 175 2 CONTEÚDOS ..................................................................................................... 175 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 176 4 INTRODUÇÃO À UNIDADE ............................................................................... 176 5 UM POUCO DA HISTÓRIA DA PROBABILIDADE ............................................. 177 6 CONCEITOS IMPORTANTES EM PROBABILIDADE .......................................... 178 7 PROBABILIDADE FREQUENTISTA .................................................................... 184 8 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA ..................................... 207 9 O ENSINO DAS PROBABILIDADES ................................................................... 219 10 QUESTÕES AUTOAVALIATIVAS ........................................................................ 234 11 CONSIDERAÇÕES .............................................................................................. 240 12 E-REFERÊNCIAS ................................................................................................ 240 13 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 240 CRC Caderno de Referência de Conteúdo Ementa ––––––––––––––––––––––––––––––––––––––––––––– Noções de teoria de conjuntos. Técnicas de contagem e análise combinatória. Probabilidade frequentista. Probabilidade condicional e independência. Popula- ção e amostra. Distribuições e gráficos de frequências. Medidas de tendência central. Medidas de posição e de ordem. Medidas de dispersão. Excel e calcu- ladoras científicas. –––––––––––––––––––––––––––––––––––––––––––––––––––– 1. INTRODUÇÃO O Caderno de Referência de Conteúdo Probabilidade e Esta- tística é subdividido em quatro partes, apesar de ser constituído por cinco unidades. A primeira destina-se a uma visão conceitual sobre Estatística; a segunda está focada no estudo das técnicas e ferramentas de tabulação de dados; as Unidades 3 e 4 tratam das medidas de Estatística Descritiva; e a Unidade 5 aborda estudos de probabilidades. Os estudos realizados sobre o que chamamos de "Estatísti- ca Descritiva" são de fundamental importância em qualquer área © Probabilidade e Estatística10 de atuação profissional, já que todos nós somos levados a decidir sobre uma diversidade de situações, sempre tomadas com base em informações e análises. A Estatística Descritiva ajuda na ca- racterização das informações coletadas na amostra, mas ela não possibilita análises mais avançadas, que chamamos de "Estatística Inferencial". Além das estatísticas, outro importante campo de es- tudo, o qual está presente nos Parâmetros Curriculares Nacionais (PCNs) de Matemática, são as probabilidades baseadas na visão frequentista e, também, as probabilidades condicionais. Após esta breve introdução aos conceitos principais que ve- remos apresentamos, a seguir, no Tópico Orientações para estudo, algumas orientações de caráter motivacional, como também dicas e estratégias de aprendizagem, que poderão facilitar o seu estudo. 2. ORIENTAÇÕES PARA ESTUDO Abordagem Geral Aqui, você entrará em contato com os assuntos principais deste conteúdo de forma breve e geral e terá a oportunidade de aprofundar essas questões no estudo de cada unidade. Desse modo, esta Abordagem Geral visa fornecer-lhe o conhecimento básico necessário a partir do qual você possa construir um referencial teórico com base sólida – científica e cultural – para que, no futuro exercício de sua profissão, você a exerça com competência cognitiva, ética e responsabilidade social. Você pode estar pensando: Estatística serve para quê? Quais são os motivos para estudá-la? Considerando os cenários administrativos e gerenciais; situações de análises contábeis; problemas de gestão de pessoas e de materiais; casos de logística e de transportes; análise de cenários econômicos; experimentos médicos, biológicos e agronômicos em geral; entrevistas; estudos sociológicos; enfim, situações relacionadas com a prática de quase 11 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo todas as profissões e mercados, o que podemos detectar de comum em tudo isso? Entre essas similaridades, vamos destacar uma que nos interessa mais. Em todos os casos citados, existe um momento importante, chamado "tomada de decisão", em que o analista ou pesquisador decide qual o caminho a ser tomado, qual a decisão que levará ao atingimento de seus objetivos e/ou suas metas. Se concordarmos que o processo de tomada de decisões é, de fato, inerente aos cenários descritos, cabe uma nova pergunta: O que é importante para uma tomada de decisão? O mais importante é dispor de informações que propiciem que essa decisão seja feita com embasamento e critérios. Mas, então, temos, novamente, outra questão a responder: Como as informações devem ser analisadas para propiciar uma decisão acertada? Temos vários caminhos para analisar as informações. Um desses caminhos, que contribui de forma decisiva para a tomada de decisão, é a análise estatística dos dados. Assim, temos de estudar Estatística, pois é natural a sua utilizaçãono dia a dia sob diversas formas. Além disso, veremos que, em muitos casos, não basta conhecermos as ferramentas de análise; devemos, também, possuir um olhar crítico para saber utilizar os resultados. Nosso objetivo, então, é propiciar a você um conjunto de ferramentas para a análise de conjuntos de dados sob a ótica da Estatística, trabalhando o ferramental matemático e o processo de cálculo associado à necessidade de compreensão da aplicabilidade de cada ferramenta apresentada. A Estatística nasceu como uma ferramenta destinada apenas à coleta e descrição de dados, como veremos na Unidade 1, mas, com o tempo, transformou-se em uma importante ferramenta de análise, quando utilizada em conjunto com as probabilidades. Todas as áreas do conhecimento fazem uso da Estatística, seja para o planejamento de pesquisas e experimentos, seja para a representação de dados, isto é, para a análise inferencial das informações. © Probabilidade e Estatística12 Contudo, como a Estatística lida com a análise de dados, é importante que esses dados ou informações sejam produzidos, coletados ou pesquisados com critérios técnicos, de forma a resultarem em dados pertinentes e confiáveis. Pensemos um pouco: se vamos analisar um conjunto de dados, é necessário que esses dados possam de fato representar o fenômeno de interesse. Isso ocorre quando utilizamos metodologias adequadas para a coleta dos dados. Assim, quando elaboramos os procedimentos e metodologias que serão utilizados para a coleta e pesquisa dos dados, devemos seguir padrões rigorosos e científicos, para que os dados não sejam distorcidos e ou manipulados. Para tal rigor, podemos nos valer dos procedimentos discutidos em Metodologia Científica, que sugere etapas a serem seguidas para permitir-se uma pesquisa de dados adequada, isto é, definir os objetivos que desejamos atingir e as hipóteses; definir as fontes a serem utilizadas e de onde serão retirados os dados; e definir os instrumentos de coleta de dados ou questionários utilizados, que devem estar diretamente relacionados com os objetivos e estabelecer as técnicas apropriadas para a coleta efetiva das informações, ou seja, um processo de amostragem que seja o mais recomendável para aquela situação. Um detalhamento sobre esse assunto será abordado na Unidade 1, bem como a conceituação de população estatística e amostra. Quando definimos as fontes de dados, podemos trabalhar com todas as fontes existentes, como, por exemplo, em uma pesquisa de mercado, utilizar todos os possíveis consumidores, ou, em uma análise de qualidade, verificar 100% dos itens produzidos, ou, ainda, em uma avaliação financeira de uma franquia, analisar todos os franqueados do Brasil. Contudo, você deve refletir sobre a viabilidade de analisar 100% das fontes existentes e pensar que isso, na maioria dos casos, não será prudente ou será, até mesmo, impossível de ser feito. Assim, podemos trabalhar com uma amostra das fontes ou uma amostra dos dados e utilizar 13 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo apenas uma parte representativa das informações, o que, embora possa gerar um erro de análise, é muito mais coerente em termos práticos. É justamente nesse cenário de utilização de amostras que a Estatística tem maior importância – em primeiro lugar, para possibilitar uma análise que faça o erro gerado ser minimizado, e, em segundo lugar, para viabilizar uma generalização dos resultados obtidos na amostra para toda a população. Considerando a realização da amostragem, o profissional depara-se com a seguinte situação: a partir da coleta de dados realizada, dispõe-se de um conjunto de dados (informações) que devem ser analisados, a fim de permitir uma interpretação e uma decisão, isto é, uma conclusão final. Discutiremos, portanto, na Unidade 2, as formas de análise de dados chamadas de "tabulação", que nada mais são do que a disposição dos dados em forma de tabelas e/ou gráficos construídos com base no conceito de frequência. É natural supor que, na coleta de dados, exista certa repetição de algumas informações ou dados (qualitativos ou quantitativos). Essa repetição de alguns resultados é o início do processo investigativo sobre os dados, e a função da frequência é justamente mostrar e descrever como ocorrem essas repetições. Estudaremos as duas frequências principais: a primeira, chamada de Frequência Absoluta (ou Frequência Simples), é a contagem do número de vezes que cada informação se repete nos dados coletados e possui a capacidade de ilustrar qual resultado é mais expressivo em relação aos demais, indicando um início de análise por incidência. Contudo, a Frequência Absoluta não permite comparações entre períodos ou cenários e, por isso, é transformada no segundo tipo de frequência, chamado de Frequência Relativa (ou Frequência Percentual), que tem como principal função permitir análises comparativas entre as informações originárias de períodos ou cenários diferentes. © Probabilidade e Estatística14 A transformação de uma Frequência Absoluta em uma Frequência Relativa segue a mesma mecânica dos cálculos percentuais tradicionais, isto é, dividindo-se uma Frequência Absoluta pelo total e multiplicando-se o resultado por 100, obtemos a Frequência Percentual, ou Relativa. Durante os estudos da Unidade 2, mais detalhes serão fornecidos e exemplos trabalhos. O uso das frequências pode ser feito por meio de tabelas ou gráficos de frequências. As tabelas de frequências diferenciam- se de acordo com o tipo de informação coletada, a qual pode ser qualitativa (não é expressa numericamente), quantitativa inteira (é expressa numericamente, mas sempre por números inteiros) e quantitativa fracionária (é expressa numericamente e pode apresentar casas decimais). Já os gráficos de frequências podem ser, geralmente, de colunas (apresentados na vertical), de barras (apresentados na horizontal) e de setores, ou de "pizza", (apresentado em formato de círculo fatiado). Tanto as tabelas quanto os gráficos de frequências são ferramentas descritivas dos dados, ou seja, não possuem intenção de permitir uma análise aprofundada dos dados, mas apenas de apresentar as informações de forma ordenada, a fim de facilitar a análise posterior. É muito comum encontrarmos tabelas e gráficos em artigos de jornais e revistas e mesmo em matérias de jornais televisivos, pois seu impacto visual é muito favorável à transmissão da ideia sobre os resultados. Além dos gráficos de frequências, vamos abordar os gráficos de séries estatísticas, muito utilizados para caracterizar variáveis que oscilam no tempo. Quando trabalhamos com dados qualitativos, a representação descritiva das tabelas e gráficos é muito eficiente. Contudo, quando trabalhamos com dados quantitativos, essa representação não é suficiente para uma plena compreensão dos resultados. Para aprimorar a descrição dos dados quando estes são originários de variáveis quantitativas (expressas numericamente, como preço, quantidade produzida, lucro, taxas, peso, número de funcionários 15 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo etc.), fazemos uso das medidas estatísticas. Assim, nas Unidades 3 e 4, estudaremos um conjunto de medidas que tem como objetivo descrever de forma mais completa o comportamento de variáveis quantitativas. Iniciaremos nossos estudos com as medidas estatísticas de posição, cuja função é resumir as informações coletadas em apenas um único valor representativo. Dentre as medidas existentes, veremos como trabalhar com as médias. Em especial, trataremos da: • Média Aritmética Simples, que é definida pela divisão entre a soma dos valores e o número de elementos; • Média Aritmética Ponderada, que é definida pela divisão entre a soma ponderada dos valores e o peso total atribu- ído aos dados; • Média Geométrica, que é definida como uma média arit- mética na escala logarítmica dos dados. Essas três médiaspossuem características similares, mas são calculadas de modos diferentes. Estudaremos detalhadamente cada uma delas na Unidade 3, desde a formalização dos cálculos até suas aplicações. As médias caracterizam-se por utilizar todos os dados disponíveis e, portanto, são sensíveis ao comportamento deles. Quando temos valores muito altos ou muito baixos nos dados, as médias podem oscilar para cima ou para baixo, resultando, em alguns momentos, em análises que não representam a realidade. Assim, nossos estudos não se limitarão à utilização de fórmulas; ao contrário, faremos uma avaliação criteriosa sobre a utilização prática das médias. Em muitos casos, a aplicação de uma média pode mais prejudicar a análise do que colaborar com o analista. Para complementar a análise via médias, estudaremos, também, a Mediana, a Moda e as medidas separatrizes, que possuem características bem distintas das médias e que, em muitas situações, permitem uma análise mais coerente. É importante © Probabilidade e Estatística16 reforçar que cabe ao analista a seleção adequada das ferramentas que serão utilizadas, e, para isso, é muito mais importante conhecer as propriedades de cada uma do que sua forma de cálculo, pois, se sabemos calcular, mas não sabemos aplicar o resultado, de que adianta o cálculo? Devido a alguns problemas na utilização das médias, estudaremos, na Unidade 4, as medidas estatísticas de dispersão (ou medidas estatísticas de variabilidade). A dispersão nada mais é do que o grau de variação que existe dentro de um conjunto de dados numéricos. Quando esse grau de variação é alto, a análise pelas médias fica prejudicada. Assim, é importante saber mensurar, isto é, medir o grau de variação dos dados. E faremos isso por meio das seguintes medidas: • Variância Amostral: é uma medida de variabilidade abso- luta definida como a diferença, ao quadrado, entre cada valor existente no conjunto de dados e a média aritmética do conjunto. • Desvio Padrão Amostral: é uma medida de variabilida- de absoluta definida como a raiz quadrada da Variância Amostral. • Coeficiente de Variação: é uma medida de variabilidade relativa definida pela divisão entre o desvio padrão e a média aritmética dos dados. A variância é uma medida que serve para determinar o grau de variação dos dados. Assim, quanto maior o valor da medida variância, maior é o grau de variação, e, consequentemente, a média perde a capacidade de mostrar uma informação pertinente. Como a variância tem a característica de trabalhar com as diferenças tomadas ao quadrado, pode, muitas vezes, gerar resultados inconsistentes, na prática, utilizamos outra medida, que, de certa forma, anula o efeito dos expoentes quadráticos. Essa medida é o desvio padrão, que, de tão importante no segmento de análise de dados, aparece em todas as calculadoras científicas e financeiras. Durante nossos 17 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo estudos, vamos abordar, também, o uso dos recursos tecnológicos para o cálculo de algumas medidas estatísticas. O desvio padrão permitirá uma série de análises importantes, como, por exemplo, o cálculo de uma medida de variabilidade relativa que chamamos de "Coeficiente de Variação". Por ser uma medida de variabilidade relativa, o Coeficiente de Variação permite compararmos o grau de variação entre dois ou mais cenários, o que pode ser de fundamental importância na análise de decisão. Outra medida que estudaremos na Unidade 4 é o Índice de Assimetria dos dados, que é o resultado de uma relação entre a média aritmética, a Mediana e o Desvio Padrão Amostral. A assimetria dos dados está diretamente relacionada com a aplicabilidade da média. Dados simétricos permitem uma análise mais criteriosa da média, enquanto dados assimétricos podem resultar em uma representação não significativa pela média. Note que não estamos falando apenas de cálculos, mas, sim, de cálculos que permitem uma análise crítica sobre os dados e, por assim dizer, sobre a possibilidade efetiva de avaliar esses dados a fim de tomar decisões. Nas Unidades 2, 3 e 4, discutiremos as ferramentas descritas anteriormente, em especial as medidas de posição e as medidas de dispersão, que correspondem à chamada "Estatística Descritiva". Como o próprio nome menciona, a principal função dessas ferramentas é apresentar e descrever os dados que foram coletados na amostragem. Na forma mais completa da análise estatística, tais medidas descritivas devem ser transformadas em medidas chamadas de "inferenciais", as quais conseguem generalizar os resultados amostrais em populacionais. No entanto, esse assunto não será estudado neste Caderno de Referência de Conteúdo, pois nosso objetivo está focado na formação do professor de Matemática, que deverá trabalhar a Estatística na Educação Básica, abordando assuntos similares aos tratados aqui. © Probabilidade e Estatística18 Apesar de não termos o objetivo de abordar a Estatística Inferencial, estudar as probabilidades é muito importante, pois esse é um assunto amplamente utilizado na Educação Básica, assim como em concursos dos mais variados tipos. Na Unidade 5, portanto, faremos um estudo bem detalhado dos principais conceitos e resultados da teorias frequentistas de probabilidades. Veremos que o conceito de Probabilidade Frequentista nada mais é do que o relacionamento entre conjuntos de dados – um que determina os resultados de interesse e outro que determina o conjunto total de resultados possíveis, chamado de "Espaço Amostral", sempre considerando que esses conjuntos são resultados de uma ação ou cenário aleatório, isto é, com um certo grau de incerteza sobre os resultados. As probabilidades, que surgiram para atribuir chances em jogos de azar, evoluíram de forma acelerada no campo das ciências, com muitas aplicações importantes. Vamos iniciar nosso estudo sobre elas discutindo a visão frequentista, seus principais axiomas e teoremas, e, do estudo dos teoremas e axiomas, algumas fórmulas de cálculo serão construídas e permitirão diversas aplicações das probabilidades. No entanto, como você verá ao estudar a Unidade 5, a aplicação direta das fórmulas conhecidas de Probabilidade algumas vezes apresenta certas limitações de ordem prática, e, nesses casos, pelo menos quando possível, podemos recorrer a técnicas de contagem e regras geométricas para permitir os cálculos. Veremos com detalhes essas limitações e como efetuar os cálculos por outros caminhos. Vamos abordar os casos de eventos dependentes no final de nossos estudos, com a Fórmula da Probabilidade Condicional e do Produto das Probabilidades, que possuem uma aplicação muito ampla nos mais variados cenários práticos. Depois, ampliaremos o estudo com os eventos independentes, conseguindo, assim, reunir, neste material, os principais conceitos e resultados para um bom entendimento das probabilidades. 19 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo Glossário de Conceitos O Glossário de Conceitos permite a você uma consulta rá- pida e precisa das definições conceituais, possibilitando-lhe um bom domínio dos termos técnico-científicos utilizados na área de conhecimento dos temas tratados em Probabilidade e Estatística. Veja, a seguir, a definição dos principais conceitos: 1) Amostra: subconjunto da população. Por possuir um número reduzido de elementos, é mais viável de ser pesquisada do que a população, mas, em compensação, gera um erro maior na análise. Deve satisfazer algumas propriedades, e a principal delas é ser aleatória. 2) Ciência: conjunto de conhecimentos exatos e racionais relativos às causas das realizações deduzidas pela de- monstração. 3) Coeficiente de Variação: ferramenta que permite anali- sar comparativamente a variabilidade entre dois ou mais conjuntos. É, também, referência para avaliar o grau de variabilidade de uma variável. 4) Conjunto: união de elementos que possuem, pelo me- nos,uma característica em comum. Em Probabilidade, toda teoria e aplicações são definidas pela utilização de conjuntos e subconjuntos, e um importante conjunto utilizado nessa área é o chamado "espaço amostral". 5) Distribuição de frequências: ferramenta de tabulação de dados que corresponde a uma ordenação dos dados segundo um agrupamento por frequência de ocorrên- cia, que pode ser absoluta ou relativa. 6) Espaço Amostral: conjunto formado por todos os possí- veis resultados de um fenômeno aleatório. 7) Evento Aleatório: resultado particular do espaço amos- tral; representa o resultado de interesse sobre o qual se quer calcular a probabilidade de ocorrência. 8) Eventos complementares: eventos que, além de serem mutuamente exclusivos, se unidos, reproduzem exata- mente os resultados do espaço amostral. © Probabilidade e Estatística20 9) Eventos dependentes: eventos que possuem um grau de dependência, de forma que a ocorrência de um deles modifica a probabilidade de ocorrência do outro. 10) Eventos independentes: eventos que não possuem um grau de dependência, de forma que a ocorrência de um deles não altera em nada a probabilidade de ocorrência do outro. 11) Eventos mutuamente exclusivos: eventos que nunca podem ocorrer simultaneamente, ou seja, não possuem intersecção. Também são chamados de "eventos disjun- tos". 12) Eventos não mutuamente exclusivos: eventos que po- dem ocorrer simultaneamente, ou seja, possuem inter- secção. Também são chamados de "eventos não disjun- tos". 13) Fenômeno Aleatório: situação ou ação cotidiana cujo resultado ou consequência é marcado pela incerteza, ou seja, não se pode afirmar com certeza o resultado final do fenômeno. Os resultados amostrais advindos da Esta- tística são todos aleatórios. 14) Ferramenta: ordem ou conjunto de processos que de- vem ser estabelecidos para, mediante investigação, se atingir determinado objetivo. Quando definimos um procedimento que já se mostrou válido para vários ex- perimentos, temos o método científico. 15) Gráfico de frequência: representação gráfica da tabela que permite uma transmissão, visualização e análise de dados mais facilitada. 16) Gráfico de série: utilizado para a análise de séries histó- ricas ou temporais. 17) Índice de Assimetria: medida que visa contabilizar o fe- nômeno da simetria ou assimetria da variável. 18) Medidas de dispersão: utilizadas para mensurar o grau de variabilidade no conjunto de dados, considerando a representação dos dados por meio da média aritmética. 19) Medida estatística de ordem: ferramenta que visa re- presentar os dados de um conjunto ordenado por me- 21 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo didas que subdividam esse conjunto em subconjuntos, contendo um percentual estipulado de elementos. 20) Medida estatística de tendência central: ferramenta que visa representar um conjunto de dados numéricos em apenas um único valor representativo, com tendên- cia a se localizar no centro dos dados. 21) Medidas de posição: ferramentas de análise descritiva dos dados que podem ser classificadas como de tendên- cia central (Médias, Mediana e Moda) e de ordem (quar- til, decil e percentil). 22) Metodologia de pesquisa: como as análises estatísticas são feitas com base em amostragem, é importante que a metodologia empregada na coleta dos dados seja a mais adequada possível, a fim de garantir a representativida- de dos dados da amostra, ou seja, possibilitar que a aná- lise dos dados amostrais permita uma extrapolação para a população. 23) Operações entre conjuntos: como as probabilidades são baseadas em conjuntos, as operações realizadas com as probabilidades são baseadas nas operações entre con- juntos. Podemos destacar a União entre Conjuntos, de- notada por ∪, e a Intersecção entre Conjuntos, denota- da por ∪ , a qual representa os elementos em comum entre os conjuntos. 24) População estatística: conjunto que contém todas as fontes de dados (elementos ou indivíduos) de interes- se para a realização de uma pesquisa. Em geral, é muito grande e inviável de ser pesquisada completamente. 25) Probabilidade: ferramenta que possibilita associar uma chance de ocorrência a um determinado fenômeno ale- atório. 26) Relações entre conjuntos: como as probabilidades são baseadas em conjuntos, as relações existentes nas pro- babilidades são baseadas nas relações entre conjuntos. Podemos destacar as relações de exclusividade entre conjuntos, ou seja, quando não possuem elementos em comum, ou não exclusivos, quando possuem elementos em comum. © Probabilidade e Estatística22 27) Simetria: comportamento típico dos dados numéricos e que pode ser verificado utilizando-se das medidas es- tatísticas de tendência central. A análise desse compor- tamento tem diversas aplicações práticas e é de grande importância no estudo da Estatística. 28) Tabela de frequência: instrumento de tabulação de da- dos. Organiza as informações em formato de tabela, re- lacionando cada resposta obtida nos dados brutos com a sua ocorrência por meio da Frequência Absoluta e da Frequência Relativa. 29) Tabulação: processo utilizado para ordenar um conjunto de dados brutos obtidos em uma coleta de dados. 30) Técnicas de contagem: procedimentos da Matemática Discreta úteis para contabilizar de quantas formas uma determinada ação pode ser feita. Basicamente, temos a regra da soma, a regra do produto, as permutações, os arranjos e as combinações. Esquema dos Conceitos-chave Para que você tenha uma visão geral dos conceitos mais importantes deste estudo, apresentamos, a seguir (Figura 1), um Esquema dos Conceitos-chave. O mais aconselhável é que você mesmo faça o seu esquema de conceitos-chave ou até mesmo o seu mapa mental. Esse exercício é uma forma de você construir o seu conhecimento, ressignificando as informações a partir de suas próprias percepções. É importante ressaltar que o propósito desse Esquema dos Conceitos-chave é representar, de maneira gráfica, as relações entre os conceitos por meio de palavras-chave, partindo dos mais com- plexos para os mais simples. Esse recurso pode auxiliar você na or- denação e na sequenciação hierarquizada dos conteúdos de ensino. Com base na teoria de aprendizagem significativa, entende- -se que, por meio da organização das ideias e dos princípios em esquemas e mapas mentais, o indivíduo pode construir o seu co- nhecimento de maneira mais produtiva e obter, assim, ganhos pe- 23 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo dagógicos significativos no seu processo de ensino e aprendizagem. Aplicado a diversas áreas do ensino e da aprendizagem es- colar (tais como planejamentos de currículo, sistemas e pesquisas em Educação), o Esquema dos Conceitos-chave baseia-se, ainda, na ideia fundamental da Psicologia Cognitiva de Ausubel, que es- tabelece que a aprendizagem ocorre pela assimilação de novos conceitos e de proposições na estrutura cognitiva do aluno. Assim, novas ideias e informações são aprendidas, uma vez que existem pontos de ancoragem. Tem-se de destacar que "aprendizagem" não significa, ape- nas, realizar acréscimos na estrutura cognitiva do aluno; é preci- so, sobretudo, estabelecer modificações para que ela se configure como uma aprendizagem significativa. Para isso, é importante con- siderar as entradas de conhecimento e organizar bem os materiais de aprendizagem. Além disso, as novas ideias e os novos concei- tos devem ser potencialmente significativos para o aluno, uma vez que, ao fixar esses conceitos nas suas já existentes estruturas cog- nitivas, outros serão também relembrados. Nessa perspectiva, partindo-se do pressuposto de que é você o principal agente da construção do próprio conhecimento, por meio de sua predisposição afetiva e de suas motivações internas e externas, o Esquema dos Conceitos-chave tem por objetivo tornar significativa a sua aprendizagem, transformando o seu conhecimento sistematizado em conteúdocurricular, ou seja, estabelecendo uma relação entre aquilo que você acabou de conhecer com o que já fazia parte do seu conhecimento de mundo (adaptado do site disponível em: <http://penta2.ufrgs. br/edutools/mapasconceituais/utilizamapasconceituais.html>. Acesso em: 11 mar. 2010). Como poderá observar, esse esquema oferecerá a você, como dissemos anteriormente, uma visão geral dos conceitos mais importantes deste estudo. Ao segui-lo, será possível transitar entre os principais conceitos e descobrir o caminho para construir © Probabilidade e Estatística24 o seu processo de ensino-aprendizagem. Por exemplo, antes de estudar os conceitos de medidas de dispersão, você deverá estu- dar os conceitos básicos de Estatística e as medidas de tendência central. 25 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo Figura 1 Esquema dos Conceitos-chave do Caderno de Referência de Conteúdo Probabilidade e Estatística. O Esquema dos Conceitos-chave é mais um dos recursos de aprendizagem que vem se somar àqueles disponíveis no ambien- te virtual, por meio de suas ferramentas interativas, bem como àqueles relacionados às atividades didático-pedagógicas realiza- das presencialmente no polo. Lembre-se de que você, aluno EaD, deve valer-se da sua autonomia na construção de seu próprio co- nhecimento. © Probabilidade e Estatística26 Questões Autoavaliativas No final de cada unidade, você encontrará algumas questões autoavaliativas sobre os conteúdos ali tratados, as quais podem ser de múltipla escolha, abertas objetivas ou abertas dissertativas. Responder, discutir e comentar essas questões, bem como relacioná-las com a prática da Probabilidade e da Estatística, pode ser uma forma de você avaliar o seu conhecimento. Assim, me- diante a resolução de questões pertinentes ao assunto tratado, você estará se preparando para a avaliação final, que será disser- tativa. Além disso, essa é uma maneira privilegiada de você testar seus conhecimentos e adquirir uma formação sólida para a sua prática profissional. Você encontrará, ainda, no final de cada unidade, um gabari- to, que lhe permitirá conferir as suas respostas sobre as questões autoavaliativas de múltipla escolha. As questões de múltipla escolha são as que têm como resposta apenas uma alternativa correta. Por sua vez, entendem-se por questões abertas objetivas as que se referem aos conteúdos matemáticos ou àqueles que exigem uma resposta determinada, inalterada. Já as questões abertas dissertativas obtêm por resposta uma interpretação pessoal sobre o tema tratado; por isso, normalmente, não há nada relacionado a elas no Tópico Gabarito. Você pode comentar suas respostas com o seu tutor ou com seus colegas de turma. Bibliografia Básica É fundamental que você use a Bibliografia Básica em seus estudos, mas não se prenda só a ela. Consulte, também, as biblio- grafias complementares. 27 Claretiano - Centro Universitário © Caderno de Referência de Conteúdo Figuras (ilustrações, quadros...) Neste material instrucional, as ilustrações fazem parte inte- grante dos conteúdos, ou seja, elas não são meramente ilustra- tivas, pois esquematizam e resumem conteúdos explicitados no texto. Não deixe de observar a relação dessas figuras com os con- teúdos deste Caderno de Referência de Conteúdo, pois relacionar aquilo que está no campo visual com o conceitual faz parte de uma boa formação intelectual. Dicas (motivacionais) O estudo deste Caderno de Referência de Conteúdo convida você a olhar, de forma mais apurada, a Educação como processo de emancipação do ser humano. É importante que você se atente às explicações teóricas, práticas e científicas que estão presentes nos meios de comunicação, bem como partilhe suas descobertas com seus colegas, pois, ao compartilhar com outras pessoas aqui- lo que você observa, permite-se descobrir algo que ainda não se conhece, aprendendo a ver e a notar o que não havia sido perce- bido antes. Observar é, portanto, uma capacidade que nos impele à maturidade. Você, como aluno do curso de Graduação na modalidade EaD, necessita de uma formação conceitual sólida e consistente. Para isso, você contará com a ajuda do tutor a distância, do tutor presencial e, sobretudo, da interação com seus colegas. Sugeri- mos, pois, que organize bem o seu tempo e realize as atividades nas datas estipuladas. É importante, ainda, que você anote as suas reflexões em seu caderno ou no Bloco de Anotações, pois, no futuro, elas pode- rão ser utilizadas na elaboração de sua monografia ou de produ- ções científicas. Leia os livros da bibliografia indicada, para que você amplie seus horizontes teóricos. Coteje-os com o material didático, discuta a unidade com seus colegas e com o tutor e assista às videoaulas. © Probabilidade e Estatística28 No final de cada unidade, você encontrará algumas questões autoavaliativas, que são importantes para a sua análise sobre os conteúdos desenvolvidos e para saber se estes foram significativos para sua formação. Indague, reflita, conteste e construa resenhas, pois esses procedimentos serão importantes para o seu amadurecimento intelectual. Lembre-se de que o segredo do sucesso em um curso na modalidade a distância é participar, ou seja, interagir, procurando sempre cooperar e colaborar com seus colegas e tutores. Caso precise de auxílio sobre algum assunto relacionado aos conteúdos estudados, entre em contato com seu tutor. Ele estará pronto para ajudar você. 3. REFERÊNCIAS BIBLIOGRÁFICAS BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009. TOLEDO, G. Estatística básica. 2. ed. São Paulo: Atlas, 2008. TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008. 4. E-REFERÊNCIAS SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www. ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em: 13 fev. 2012. TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/ uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>. Acesso em: 13 fev. 2012. EA D A Natureza dos Dados Estatísticos 1 1. OBJETIVOS • Conhecer a origem e a história da Estatística. • Entender o que é população e amostra, bem como as suas relações. • Aplicar as fases de desenvolvimento de um trabalho es- tatístico. • Compreender a metodologia da coleta de dados. 2. CONTEÚDOS • Origem e história da Estatística. • População e amostra. • Fases de um trabalho estatístico. • Coleta, crítica, apuração e exposição de dados. © Probabilidade e Estatística30 3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE Antes de iniciar o estudo desta unidade, é importante que você leia as orientações a seguir: 1) Tenha sempre à mão o significado dos termos e expres- sões explicitados no Glossário de Conceitos e suas liga- ções pelo Esquema dos Conceitos-chave para o estudo de não apenas esta, mas todas as unidades deste CRC. Isso facilitará sua aprendizagem e seu desempenho. 2) Procure desenvolver as atividades e interatividades den- tro do cronograma previsto para não prejudicar o anda- mento de seus estudos. 3) Leia os livros da bibliografia indicada para ampliar seus estudos em relação aos conceitos básicos de Estatística e coteje-os com o material didático, discutindo a unidade com seus colegas e com o tutor. Pesquise novas fontes e troque experiências com eles, pois todo conhecimento é bem-vindo e ajudará no seu aprendizado. 4. INTRODUÇÃO À UNIDADE Nesta unidade, vamos estudar um pouco sobre a origem e a evolução da Estatística. Além disso, compreenderemos a inclusão dos tratamentos da informação nos Parâmetros Curriculares Nacionais (PCNs), bem como sua importância. Ainda, abordaremos a Fundação IBGE, que é a responsável por todas as estatísticas no Brasil, fornecendo dados importantes para as tomadas de decisão de nossos governantes. Além de tratar do aspecto histórico, veremos nessa unidade que a Estatística,na grande maioria dos casos, trabalha com dados originários de pesquisas e coleta de dados. Desse modo, discutiremos um pouco sobre a metodologia envolvida nesses eventos e como se processa a análise estatística dos dados, pensando nas principais fases, de coleta, crítica, apuração e exposição dos resultados. Vamos lá. 31 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos 5. ORIGEM E HISTÓRIA DA ESTATÍSTICA A origem da palavra "estatística" está diretamente associada à palavra latina status (Estado). Desde a Antiguidade, realizavam- -se coletas de informações com finalidades tributárias, e existem indícios, também, de que há 3.000a.C. já se faziam coletas de da- dos na Babilônia, China e Egito. De acordo com Moreira (1981), a Estatística pode ser dividi- da em três grandes períodos para caracterização de sua história e evolução. Vamos conhecê-los a seguir. Período focado na obtenção de fatos O primeiro período, focado na obtenção de fatos, abrange a Idade Antiga, a Idade Média e parte da Idade Moderna. Pelos registros encontrados, a Estatística era conhecida como "Estatísti- ca Administrativa", tendo em vista o interesse estatal dos dados. Vejamos alguns destaques: • Por meio do livro sacro Chou king, de Confúcio, têm-se notícias da preparação dos estados da China, no ano 2.238a.C. • Na Idade Média, no ano 721d.C., os árabes fizeram uma coleta numérica das cidades dominadas, computando a população e a produção para controle das conquistas ter- ritoriais. • Guilherme, o Conquistador, ordenou a elaboração de um cadastro da divisão do solo da Inglaterra das várias classes sociais existentes, para fins de arrecadação de impostos. Notemos que a origem da palavra faz jus às suas origens. A evolução no processo de coleta e armazenamento dos da- dos e informações acabou por promover uma grande quantidade de estudos e pesquisas, no sentido de desenvolver técnicas mais apuradas para a análise dos dados. © Probabilidade e Estatística32 Período de evolução das teorias estatísticas No segundo período, surge a denominação "Estatística", que passa a ser uma disciplina autônoma. Vamos observar alguns des- taques desse período: • Na Inglaterra, no século 17, John Grant inicia as investi- gações sobre a Estatística Demográfica e estabelece algu- mas relações entre os nascimentos e as mortes. • Blaise Pascal e Pierre de Fermat descobrem os cálculos das probabilidades, instrumento muito útil hoje em dia para análise de fenômenos aleatórios. • Adolphe Quetelet, no século 18, aplica a Lei dos Grandes Números no estudo demográfico e social. Com a evolução das técnicas de análise e a junção da Estatís- tica com a Probabilidade, abriu-se caminho para a aplicação desses conhecimentos na análise de dados de muitas ciências naturais. Período do aperfeiçoamento técnico-científico O terceiro período é caracterizado pela aplicação dos concei- tos estatísticos na ciência. Vejamos os destaques desse período: • Em 1853, ocorre o Primeiro Congresso de Estatística. • Francis Galton emprega a Estatística Metodológica nos problemas de hereditariedade. • James Maxwell emprega a Estatística na Teoria Cinética dos Gases. Além da Europa e dos Estados Unidos, outras regiões apre- sentaram grande avanço na aplicação da Estatística nos mais diver- sos campos e instituíram a criação de cursos específicos na área, inclusive no Brasil. 33 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos Instituto Brasileiro de Geografia e Estatística (IBGE) No Brasil, a Estatística tem sua história associada à história do Instituto Brasileiro de Geografia e Estatística (IBGE), cujas raízes remontam ao Império. É claro que a evolução da Estatística como ciência foi promo- vida devido às suas aplicações nas mais diversas áreas do conheci- mento. Assim como as ciências naturais e as ciências da saúde, as ciências sociais foram aprofundando-se; as metodologias de aná- lise estatística foram estruturando-se e evoluindo naturalmente, especialmente após a utilização mais eficiente dos recursos com- putacionais. É importante esclarecermos que, independentemente do cenário de aplicação da Estatística, os conceitos básicos e os prin- cípios analíticos são os mesmos. Algumas ferramentas servem para determinados propósitos, mas, para outros, não, embora a concepção da análise estatística seja a mesma. Veremos, a seguir, alguns desses importantes conceitos. 6. CONCEITOS IMPORTANTES EM ESTATÍSTICA Para entendermos a extensão da aplicação da Estatística, é importante que tenhamos claros os principais conceitos que nela são aplicados. Conforme Moreira (1981), podemos dar à Estatística diversas definições, seja como ciência, seja como ferramenta. Para efeito da disciplina Estatística como área de aplicação, podemos entender que ela é um conjunto de técnicas relacionadas com a coleta, representação, interpretação e análise de dados obtidos em processos investigativos referentes a experimentos de laboratório, experimentos de campo, simulações, pesquisas de mercado, pesquisas de opinião etc., ou seja, qualquer procedimento cuja finalidade seja coletar dados para análise. © Probabilidade e Estatística34 Para entender de fato quais são os objetivos da Estatística, considere, por exemplo, que você retirou uma fatia de um bolo inteiro. Ao experimentá-la, uma pessoa pede sua opinião sobre o bolo, perguntando se ele está bom. Em geral, a tendência das pessoas é responder algo do tipo: "o bolo está bom" ou, então, "o bolo não está bom". É claro que as respostas apresentadas não estão totalmente de acordo com a situação, pois não temos como afirmar se o bolo está ou não está bom, uma vez que conhecemos apenas uma pequena parte dele. Então, por que as pessoas respondem dessa forma? É simples: nós temos a tendência de generalizar o pedaço imediatamente para o bolo. Mas a generalização só tem sentido se o bolo for totalmente homogêneo, o que já não podemos afirmar. Avaliemos, portanto, da seguinte forma: quando você se serve de um pedaço de bolo, costuma optar pelos pedaços dos cantos ou prefere os pedaços que estão na região mais central? Se sua resposta para qualquer uma das opções for "sim", você acaba de oferecer argumentos contrários à homogeneidade do bolo. Se o bolo for homogêneo, a generalização será imediata, já que o pedaço veio do bolo, e, se o pedaço está bom, então, o bolo também está. Como não podemos afirmar se o bolo é ou não é homogêneo, não podemos afirmar se está bom ou não. Se pudéssemos comer o bolo todo, certamente o nível de precisão da análise seria maior, já que, quanto mais informação, menor a chance de erro. Contudo, como o bolo não é homogêneo, mesmo se comêssemos todo ele, cada parte apresentaria um sabor diferente, não sendo possível, portanto, afirmar algo sobre ele, e o erro ainda ocorreria, em razão da heterogeneidade. Nesse sentido, temos situações práticas em que a informação de interesse não é total, mas, sim, apenas uma parte dos dados, e ainda existe um fator de mudança não totalmente controlável. Em casos como esse, todas as conclusões não são totalmente corretas. 35 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos Desse modo, podemos dizer que a Estatística é uma ciência que analisa e caracteriza variáveis, considerando a presença de alterações e resultados parciais. Essas alterações presentes nas variáveis são naturais, visto que, no processo de coleta de qualquer tipo de variável, ocorre a particularidade de cada elemento estudado, mesmo em situações de alto controle. Sempre existirão componentes não controláveis e que acarretarão variações nos resultados, gerando, assim, probabilidades de acerto ou de erro nas análises. 7. POPULAÇÃO VERSUS AMOSTRA A amostra é definida como um subconjunto da população, isto é, uma parte representativa do todo, que necessariamente deve conservar todas as características dos elementos da população.Em geral, deve ser definida de forma finita e bem delineada para que consiga viabilizar a coleta dos dados. É por meio da amostra que chegamos ao conhecimento da população, e seu uso gera redução nos custos da coleta, redução no tempo de execução da coleta, maior facilidade na coleta, porém erros nas análises. A população estatística é o conjunto total de elementos disponíveis com, pelo menos, uma característica em comum e de interesse, contendo N elementos (tendendo a ser muito grande). A população pode ser classificada como: • finita ou infinita, em relação ao número de elementos; • discreta ou contínua, em relação ao tipo de elemento. Para não confundirmos o conceito de população estatística com o de população humana, vale esclarecer que a população estatística deve ser entendida como qualquer tipo de agrupamento, não só de pessoas, mas também de objetos, empresas, espécimes animais e vegetais, entre outros. Quanto à parcialidade dos resultados, podemos melhorar o conceito, pensando o seguinte: em um processo de pesquisa ou de © Probabilidade e Estatística36 investigação, sempre temos um conjunto de fontes de informações, contendo, em geral, um grande número de elementos. Certamente, você já ouviu falar em pesquisas eleitorais; então, por exemplo, imagine uma pesquisa sobre candidatos ao cargo de prefeito de uma cidade que possua, aproximadamente, 42 mil eleitores. Poderíamos pesquisar todos eles? Se pesquisarmos todas as fontes, teremos três problemas: o tempo e o custo gastos para a coleta, que tendem a ser significativos e podem inviabilizar a coleta, e a possibilidade do desconhecimento de parte dos elementos. Nesse sentido, torna- se inviável o estudo de toda a população de elementos. Utilizando a população, garantimos benefícios importantes para a precisão dos resultados finais, já que toda informação disponível passa a ser conhecida. Contudo, permanece o problema da variação natural dos dados, que pode ser mais bem entendido com 100% da informação à disposição. Quando a inviabilidade do estudo populacional se faz presente, a coleta de dados é feita com apenas uma parte representativa da população, conhecida como "amostra". Como não temos todos os elementos, existirá uma chance de os resultados não serem significativos a ponto de representarem a população. Assim, é fundamental estruturar corretamente a amostragem, a fim de minimizar a margem de erro dos dados. Nem toda amostra é útil para análises estatísticas. A amostra deve ser representativa, ou seja, deve ser um retrato em miniatura da população. Garantindo-se um procedimento correto de amostragem, podemos analisar o comportamento das variáveis, por meio da análise estatística descritiva, e construir estimativas confiáveis e precisas a respeito das variáveis, por meio da análise estatística inferencial, que é o processo pelo qual tiramos conclusões sobre o comportamento populacional de uma variável, baseando-se no comportamento particular observado e estudado na amostra. 37 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos A composição de uma amostra deve considerar critérios rigorosos para possibilitar resultados mais confiáveis. Em Estatística, lidamos com amostras probabilísticas, que permitem trabalhar com estimativas e determinar de forma correta o erro amostral. Para você fortalecer os conceitos estudados neste tópico, responda à nossa primeira questão autoavaliativa, disposta ao final desta unidade. 8. MÉTODOS DE AMOSTRAGEM Para cada pesquisa realizada, devemos utilizar métodos científicos adequados, pois o pesquisador tem como principal preocupação verificar se os elementos da amostra são suficientemente representativos de toda a população, de forma a generalizá-la. Assim, cada elemento da população deve ter uma probabilidade conhecida para fazer parte da amostra, sendo esta denominada "amostra aleatória", ou "amostra probabilística". Amostra aleatória, ou amostra probabilística O uso de amostragem probabilística, ou amostragem aleató- ria, permite a generalização dos resultados amostrais para a popu- lação, adotando medidas probabilísticas para o dimensionamento do erro amostral. No entanto, por questões de conveniência e falta de interes- se em estabelecer resultados populacionais, em alguns casos, são utilizadas amostragens não aleatórias, ou não probabilísticas, ou por cotas, que, na prática, não permitem uma análise estatística inferencial. Sendo assim, não detalharemos esse tipo de amostra- gem. Nosso foco ficará apenas em torno das amostras aleatórias, que são mais adequadas às análises estatísticas. © Probabilidade e Estatística38 Como a amostra aleatória (ou probabilística) deve garantir que todos os elementos da população de origem tenham uma probabilidade diferente de zero de serem selecionados, a fim de tornar a amostra o mais representativa possível da população, podemos questionar como isso pode ser feito? Existem diversas formas de se obter uma amostra aleatória, de acordo com os objetivos da coleta de dados e das características da população. Um tipo básico de amostra aleatória muito utilizada é a técnica de Amostragem Aleatória Simples, que possui como característica básica uma metodologia baseada em sorteio ou na utilização de tabelas de números aleatórios. A Tabela 1 de números aleatórios permite uma simulação bastante prática de um sorteio. Utilizando essa tabela, vamos simular o sorteio de uma amostra de 10 elementos de uma população, que, por exemplo, possua 500 elementos. Para iniciar o sorteio, devemos sortear separadamente uma linha e uma coluna da tabela. 39 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos Tabela 1 Tabela de números aleatórios. C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 L1 7 0 3 0 2 0 1 1 5 0 0 0 3 4 5 7 2 3 4 1 L2 1 6 5 8 1 5 2 0 2 8 5 0 9 6 6 1 7 5 4 4 L3 9 4 5 4 0 9 2 5 2 9 5 8 4 0 5 3 2 9 3 8 L4 8 7 9 0 4 4 9 8 8 3 9 3 2 6 8 6 1 2 8 0 L5 4 9 3 9 3 5 7 5 8 1 3 1 9 9 1 3 0 6 2 0 L6 4 6 1 4 9 6 5 7 7 9 0 7 9 8 4 0 8 7 3 2 L7 3 7 1 3 6 4 7 5 8 1 5 3 3 8 3 7 8 5 4 8 L8 0 2 0 5 5 5 3 5 9 7 9 5 0 2 2 3 0 1 1 9 L9 4 7 6 7 9 5 1 1 0 9 0 0 0 8 8 5 5 3 3 3 L10 3 0 0 2 7 1 9 2 7 5 3 8 2 7 1 2 2 8 4 2 L11 0 5 4 4 0 6 4 3 3 9 8 9 9 1 1 1 4 7 4 1 L12 6 0 9 5 7 8 7 5 5 8 0 6 1 1 4 7 1 0 5 4 L13 3 4 6 6 5 3 3 9 5 2 5 8 6 7 3 4 3 1 9 2 L14 9 9 6 8 2 5 8 9 8 4 4 4 4 7 5 9 6 7 3 8 L15 8 5 7 2 8 6 2 4 1 8 0 5 7 9 8 4 3 6 6 4 L16 1 4 4 3 4 0 3 3 9 3 7 3 3 4 6 6 8 0 8 6 L17 6 7 5 1 6 8 6 7 7 3 3 7 0 4 9 2 4 9 3 0 L18 5 2 7 6 5 2 8 4 8 5 2 6 7 3 1 4 0 2 1 7 L19 5 9 6 8 4 9 7 5 3 1 5 6 7 5 1 4 6 0 1 0 L20 9 7 8 5 7 4 5 5 7 8 6 9 6 4 0 7 5 7 5 9 L21 3 8 5 0 8 4 3 2 5 4 6 5 4 9 0 7 5 5 4 4 L22 3 5 4 3 8 4 7 6 5 4 2 1 9 5 0 2 1 9 4 1 L23 2 7 1 0 7 9 2 6 9 9 4 6 8 3 2 3 7 2 0 6 L24 6 1 5 1 5 8 9 7 9 3 6 8 1 6 8 8 9 4 1 8 L25 3 3 8 6 8 0 4 2 2 5 9 8 3 7 5 9 2 3 9 9 L26 5 1 5 3 6 5 8 2 3 4 9 7 2 5 3 9 9 5 2 2 L27 6 7 6 4 1 3 9 7 0 6 5 7 5 4 7 9 7 4 1 7 L28 2 2 5 8 9 4 7 9 1 5 5 7 2 6 6 6 2 0 6 5 L29 9 4 8 2 9 6 9 8 5 9 5 9 9 6 8 3 6 9 4 9 L30 6 0 2 3 1 7 4 9 5 1 8 7 0 3 0 6 8 1 4 6 L31 6 2 1 6 9 4 0 5 8 7 2 7 9 9 5 3 2 3 6 1 L32 6 7 2 9 7 4 6 7 1 2 0 1 1 7 1 6 9 1 5 0 L33 0 4 6 0 4 8 2 8 1 9 9 7 4 9 0 0 2 6 7 3 L34 4 2 5 2 6 8 0 6 7 3 7 4 5 7 1 2 6 4 4 0 L35 3 1 1 6 2 1 2 2 0 4 3 3 4 9 7 0 3 9 5 3 L36 9 5 2 1 7 5 5 8 6 7 5 1 7 9 8 2 8 0 8 7 L37 2 3 0 6 1 5 5 5 4 3 0 9 3 1 4 9 2 5 9 8 L38 8 9 2 7 6 6 8 3 1 9 7 9 4 9 3 8 4 3 8 6 L39 6 7 1 6 5 0 2 1 1 2 0 9 1 2 0 2 6 7 0 5 L40 2 2 1 2 2 2 3 4 7 1 1 9 0 0 5 6 0 2 1 1 L41 7 6 2 8 1 3 4 1 9 6 4 4 1 0 1 4 1 2 0 1 L42 9 6 1 5 8 6 6 2 9 6 4 6 7 4 7 8 5 9 3 5 L43 6 4 4 6 8 7 5 3 6 0 6 1 6 5 8 6 3 6 8 7 L44 3 5 6 6 9 7 0 0 6 3 3 6 9 7 9 6 7 8 8 0 L45 4 6 3 0 8 0 0 7 2 6 1 5 8 8 4 1 5 4 3 1 © Probabilidade e Estatística40 Por exemplo, suponhamos que foram selecionadas a linha 10 e a coluna 8. Veja que, na intersecção delas, encontramoso número 2. Partindo desse número e caminhando para a direita, consideraremos, para esse exemplo, três algarismos, já que a po- pulação possui 500 elementos. O primeiro número a se formar é o 275; assim, o primeiro elemento sorteado é o 275º. Proceden- do dessa forma, seguindo a direita e continuando nas linhas logo abaixo, montaremos números com três algarismos, considerando apenas os que forem menores do que 500 e sem repetição. Assim, prosseguindo com a seleção, acharemos os 10 a serem conside- rados na amostra, que são os seguintes: 275º, 382º, 284º, 205º, 440º, 398º, 114º, 466º, 319º e 399º. O procedimento de Amostragem Aleatória Simples é a base para a definição de diversos tipos de amostragens probabilísticas. Uma das mais utilizadas também é a chamada Amostragem Alea- tória Estratificada, que deve ser usada sempre que a informação de interesse na população tenha relação com características da po- pulação. Por exemplo, ao realizar uma pesquisa de mercado com consumidores de uma população para verificar a aceitação de um novo modelo de aparelho celular, devemos considerar que a acei- tação pode ser influenciada pelo gênero do consumidor, pela sua renda, pela sua condição profissional, entre outras características. Assim, ao selecionar aleatoriamente os consumidores, deve- mos manter uma proporcionalidade dentro de cada característica (estrato) para garantir a representatividade. Trabalhando dentro dos estratos, facilita-se o processo de seleção ou sorteio. Note que a diferença entre uma amostra estratificada (pro- babilística) e uma amostra por cotas (não probabilística) está na forma de seleção dos sujeitos. Outra maneira de selecionar aleatoriamente os sujeitos da população é adotar a Amostragem Aleatória Sistemática, útil quando os elementos da população são definidos com base em lis- tas, como, por exemplo, uma lista telefônica, um cadastro de clien- tes ou fornecedores, uma lista de endereços de e-mail etc. Com 41 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos base em uma lista, podemos, em vez de proceder a um sorteio completo, subdividir a lista em listas menores e sortear apenas um sujeito de cada lista, sistematizando para as demais. Por exemplo, suponhamos que a lista da população conte- nha 10.000 sujeitos e que nós necessitemos sortear 500 sujeitos. Dividindo 10.000 por 500, chegamos a 20; então, podemos imagi- nar 500 listas com 20 sujeitos cada. Assim, sorteamos um número de 1 a 20, como, por exemplo, o número 12, e, dessa forma, esco- lhemos o 12º elemento de cada uma das 500 listas. Certamente, é bem mais simples do que sortear, diretamente, dos 10.000. Independentemente do método utilizado, os três casos cita- dos procedem da escolha aleatória (sortida) dos elementos, o que pode ser, em alguns casos, algo trabalhoso. Para minimizar esse trabalho, podemos utilizar a Amostragem por Conglomerados, útil quando temos uma população que pode ser subdividida geo- graficamente ou segundo algum critério de localidade. Assim, em vez de sortearmos sujeitos, utilizamos o sorteio das localidades. Esse tipo de amostragem é muito comum nas pesquisas popula- cionais, nas quais podemos identificar bairros com diversidades de pessoas (variabilidade dentro do bairro), mas não muito diferentes de outros bairros da mesma cidade. Assim, podemos simplesmen- te sortear um bairro e pesquisar toda a sua população. Independentemente do método a ser utilizado na con- strução da amostra aleatória, uma coisa é certa: a presença do erro amostral. Assim, devemos considerar que a amostra possui uma chance de não gerar dados corretos sobre a população e, por esse motivo, devemos associar medidas probabilísticas nas amostras para dimensionar as chances de sucesso e fracasso da amostragem. Para concluir o estudo deste tópico, responda à segunda questão autoavaliativa proposta ao final desta unidade. © Probabilidade e Estatística42 9. A COLETA DE DADOS Como todas as análises serão feitas com base nos dados co- letados, é importante que a metodologia utilizada na coleta seja cientificamente correta e que os instrumentos ou questionários utilizados sejam eficientes. Assim, é fundamental que se conheça com detalhes os obje- tivos da pesquisa ou o objetivo que se deseja atingir com os dados, quais as hipóteses de interesse e o que se deseja testar e investigar. Com base nos objetivos definidos, podemos pensar, de for- ma geral, nos seguintes procedimentos metodológicos: • Identificar a população de interesse e estruturar como será o procedimento amostral. • Construir os instrumentos para a coleta dos dados (ques- tionários, formulários, roteiros etc.). Para a elaboração dos instrumentos de coleta dos dados, de- vemos considerar os aspectos a seguir: 1) Questionário de dados: essa fase é a "espinha dorsal" de qualquer levantamento. Trata-se de reunir as infor- mações necessárias para avaliar os objetivos definidos, utilizando uma linguagem adequada e de fácil compre- ensão, sem induzir a uma resposta. Podem-se mesclar questões abertas (dissertativas) e questões fechadas (múltipla escolha). 2) Pré-pesquisa de dados: nessa fase, realiza-se uma pré- -pesquisa, tendo como propósito avaliar a eficácia dos instrumentos de coleta ou mesmo do processo amostral. Feita a pré-pesquisa, os resultados nela obtidos devem ser utilizados para efetuar as correções necessárias tan- to nos instrumentos quanto no perfil da amostragem. 3) Coleta de dados: essa é a fase da obtenção de dados e deverá ser feita com muito cuidado, pois dela depende- rá a veracidade dos resultados obtidos. Basicamente, é a aplicação dos instrumentos, já revisados, nos elementos selecionados na amostragem, que deve ser probabilísti- 43 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos ca. Assim, o procedimento a ser aplicado para se efetivar a coleta dos dados deve respeitar as características pro- babilísticas da amostra. 4) Crítica de dados: essa fase tem por objetivo verificar possíveis ocorrências de dados equivocados tanto na co- leta direta dos dados quanto na fase de digitação ou de registro dos dados. 5) Tabulação dos dados: é a fase de organização dos dados obtidos na amostragem. A tabulação, que pode ser feita com tabelas ou gráficos, permite uma visão inicial dos resultados e também serve para uma divulgação inicial dos dados. 6) Análise dos dados: é a fase em que de fato utilizamos os recursos da análise estatística, por meio das medidas descritivas e inferenciais, que permitirão a determinação das estimativas e dos testes das hipóteses de interesse. O sucesso no processo metodológico representa o sucesso na coleta dos dados, ou seja, significa que teremos dados repre- sentativos para analisar e, assim, obtermos respostas significativas para avaliar os interesses estipulados no objetivo inicial. 10. TRABALHANDO EM SALA DE AULA É importante que os conceitos trabalhados nesta unidade sejam bem compreendidos para garantia de uma discussão mais completa em sala de aula, mesmo no Ensino Fundamental. É in- teressante que você, futuro professor de Matemática, discuta tais conceitos, de forma a permitir aos seus alunos que construam as concepções e relacionamentos entre eles. Em vez de definir diretamente o que é população, amostra, amostragem e os métodos envolvidos, é interessante que você elabore uma prática para ser aplicada em sala de aula que permita aos alunos a dedução direta ou indireta dos conceitos estudados. © Probabilidade e Estatística44 Por exemplo, com o objetivo de fazer os alunos pensarem so- bre um problema, a fim de definir, inicialmente, o conceito de po- pulação de dados e, na sequência, a amostra envolvida, utilizando apenas o processo de construção do exemplo, podemos imaginar o diálogo do professor com a sua turma da maneira demonstrada a seguir. Acompanhe. Apresentação do problema para a sala de aula –––––––––––– Professor: — Bom dia, turma! Tudo bem? Queropropor uma atividade para vocês. Como estamos nos preparando para sediar uma copa do mundo de futebol [ou outra situação], seria interessante descobrirmos se os alunos estão confiantes ou não em um bom desempenho da seleção e se eles acompanharão os jogos. O que vocês acham? Vamos pensar numa forma de descobrir isso? Ao iniciar a atividade, o professor deverá direcionar a discussão para a seguinte questão: — Como podemos ou o que temos de fazer para descobrir se os alunos estão confiantes e se acompanharão os jogos? Com um pouco de paciência e insistência, é natural que alguém diga o seguinte: — Professor, vamos ter de perguntar para os alunos o que queremos saber! Nesse momento, o professor interfere e inicia o caminho para a definição da população. — Sim, é verdade, devemos perguntar para os alunos. Mas para quais alunos devemos perguntar? Será que todos os alunos podem participar e responder às nossas perguntas? O professor deve agora deixar um tempo para os alunos refletirem e, logo em seguida, direcionar a questão. Professor: — O que vocês acham? Todos os alunos podem participar, não é mesmo? Continuando, o professor deve, nessa hora, utilizar-se do bom senso dos alunos e argumentar da seguinte forma: — Mas turma, se pegarmos todos os alunos, um a um, não vamos demorar muito para terminar a atividade? Será que dará tempo de terminá-la até o final da aula? Assim, o professor conduz os alunos a pensarem na inviabilidade prática de coletar todos os alunos (a população), e esse é o momento certo para intervir e perguntar, caso algum aluno já não tenha se adiantado e definido o que fazer: Professor: — Se não dá para pegar todos os alunos, como vamos resolver o problema? Naturalmente, alguém responderá que deverá pegar uma parte dos alunos, por um critério que não necessariamente será muito científico, pois os alunos ainda não conhecem os conceitos da amostragem, mas, intuitivamente, vale a partici- pação, pois o aparecimento da amostra é o mais importante. Nessa hora, o professor pode ir até o quadro e escrever as duas ações previstas: • pesquisar os alunos da escola (população); • escolher uma parte dos alunos da escola (amostra). 45 Claretiano - Centro Universitário © U1 – A Natureza dos Dados Estatísticos A partir de então, ele poderá colocar os conceitos e propriedades que julgar pertinentes. –––––––––––––––––––––––––––––––––––––––––––––––––––– A partir desse exemplo, podemos conceituar situações após um entendimento real destas e, o mais importante, situações que podem ser implementadas realmente, que fazem parte do cotidia- no do aluno e que podem instigá-lo a compreender os conceitos. 11. QUESTÕES AUTOAVALIATIVAS Sugerimos que você procure responder, discutir e comentar as questões a seguir que tratam da temática desenvolvida nesta unidade. A autoavaliação pode ser uma ferramenta importante para você testar o seu desempenho. Se você encontrar dificuldades em responder a essas questões, procure revisar os conteúdos estuda- dos para sanar as suas dúvidas. Esse é o momento ideal para que você faça uma revisão desta unidade. Lembre-se de que, na Edu- cação a Distância, a construção do conhecimento ocorre de forma cooperativa e colaborativa; compartilhe, portanto, as suas desco- bertas com os seus colegas. Confira, a seguir, as questões propostas para verificar o seu desempenho no estudo desta unidade: 1) Pense em um exemplo que ilustre suas considerações a respeito dos motivos que tornam inviável a coleta de toda a população estatística, bem como as vantagens e desvantagens em utilizar uma amostra ao invés da população. 2) Na realização de uma pesquisa de mercado para avaliar a potencialidade de venda de uma determinada marca de bebida energética, a qual será realizada por amostragem, qual o procedimento amostral mais indicado? Reflita. 12. CONSIDERAÇÕES Estudamos, nesta primeira unidade, alguns conceitos im- portantes para o bom entendimento da Estatística. Vimos que, em geral, trabalhamos com uma amostra dos dados e que, para © Probabilidade e Estatística46 gerar uma amostragem com dados representativos, devemos uti- lizar uma metodologia adequada aos objetivos que pretendemos alcançar. Com base nos dados coletados, ou seja, na amostra obtida, passamos para as fases de tabulação e análise dos dados, as quais serão discutidas nas unidades seguintes. Bons estudos. 13. E-REFERÊNCIAS IBGE – INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Home page. Disponível em: <http://www.ibge.gov.br/home/>. Acesso em: 7 fev. 2012. SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www. ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em: 13 fev. 2012. TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/ uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>. Acesso em: 13 fev. 2012. 14. REFERÊNCIAS BIBLIOGRÁFICAS BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009. FREUND, J. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre: Bookman, 2007. LARSON, R.; FARBER, E. Estatística aplicada. 4. ed. São Paulo: Pearson, 2010. LEVIN, J.; FOX, J. Estatística para ciências humanas. 4. ed. São Paulo: Pearson, 2004. MCCLAVE, J. et al. Estatística para administração e economia. 10. ed. São Paulo: Pearson, 2009. MOREIRA, J. S. Elementos de estatística. São Paulo: Atlas, 1981. NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pearson Prentice Hall, 2003. SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo: Atlas, 2002. SPIEGEL, M. Estatística. 4. ed. Porto Alegre: Bookman, 2009. SPIEGEL, M.; SCHILLER, J.; SRINIVASAN, R. Teoria e problemas de probabilidade e estatística. 2. ed. Porto Alegre: Bookman, 2004. TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008. WALPOLE, R. et al. Probabilidade e estatística: para engenharia e ciências. 8. ed. São Paulo: Pearson, 2008. EA D Tabulação de Dados 2 1. OBJETIVOS • Representar os dados coletados em tabelas e gráficos. • Conhecer e compreender a construção das tabelas e grá- ficos. • Analisar e interpretar os resultados. 2. CONTEÚDOS • Tabelas de frequências simples. • Tabelas de frequências em intervalos. • Gráficos de frequências. • Gráficos de séries. © Probabilidade e Estatística48 3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE Antes de iniciar o estudo desta unidade, é importante que você leia as orientações a seguir: 1) As dicas que serão apresentadas nesta unidade não pre- tenderão esgotar as possibilidades de uso da ferramenta de construção de gráficos do Excel, mas apenas apresen- tar, de forma mais simples, como iniciar sua utilização. 2) Para reforçar e aprofundar seus estudos em relação às tabelas e gráficos, faça pesquisas em sites confiáveis e, especialmente, na Biblioteca Virtual Pearson. 4. INTRODUÇÃO À UNIDADE Nesta segunda unidade, vamos compreender como pode- mos descrever e analisar os dados estatísticos resultantes de variá- veis qualitativas (não numéricas) e quantitativas (números inteiros ou fracionários) por meio da construção de tabelas e gráficos de frequências. Para conceituarmos os dados brutos (ou tabela primitiva), o ROL, bem como as tabelas e os gráficos de frequências, nos servi- remos de exemplos de coletas de dados já realizadas, relacionadas a um determinado contexto. Para a construção dos gráficos de fre- quências, adotaremos a planilha eletrônica do Excel. 5. OS DADOS BRUTOS De acordo com Toledo (2008), os dados brutos, ou tabela primitiva, podem ser definidos como a relação inicial, o resultado da coleta dos dados de interesse de uma determinada pesquisa, sejam eles numéricos, sejam não numéricos. Lembre-se de que, quando realizamos uma coleta de dados, as questões ou variáveis devem se relacionar com os objetivos da pesquisa. Assim, às ve- zes, teremos variáveis qualitativas (não numéricas) e/ou
Compartilhar