Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA CURSOS DE GRADUAÇÃO – EAD Esta s ca – Prof. Ms. Carlos Alberto Marinheiro e Prof. Ms. Cláudio Pereira Bidurin Meu nome é Carlos Alberto Marinheiro, sou mestre em Bioengenharia, pela Interunidades Escola de Engenharia de São Paulo, Instituto de Química de São Carlos e Faculdade de Medicina de Ribeirão Preto, da Universidade de São Paulo. Tenho formação em Matemática (licenciatura plena), Pedagogia e Engenharia Civil, com especializações em: Geometria Analítica (Matemática), Métodos de Procedimentos Didáticos (Educação) e Metodologia e Técnicas de Ensino (Educação) e pós-graduação lato sensu em Metodologia do Ensino de Matemática. Atuo como docente nas áreas de Metodologia da Pesquisa Científica, Administração de Produção, Estatística Aplicada à Administração, Desenho Geométrico e Geometria Descritiva, Tópicos de Educação Matemática e Biofísica em diversos cursos de Graduação, e com Metodologia da Pesquisa Científica nos cursos de Pós-graduação. Além disso, sou coordenador da CPA (Comissão Própria de Avaliação) e membro do CEP (Comitê de Ética em Pesquisa) no Centro Universitário Claretiano de Batatais. E-mail: marinheiro@claretiano.edu.br Olá! Meu nome é Cláudio Pereira Bidurin, sou bacharel e mes- tre em Esta s ca pela Universidade Federal de São Carlos (UFS- Car). Já atuei como esta s co em indústrias e no setor público. Atualmente, sou consultor e assessor em desenvolvimento de análises e modelagem esta s ca. Sou professor de Esta s ca no ensino superior há mais de 15 anos. No Centro Universitário Clare ano, atuo há 10 anos, tanto em cursos presenciais quan- to em EaD. Coloco-me à disposição para contribuir com você para uma aprendizagem signifi ca va. E-mail: bidurin@claretiano.edu.br Fazemos parte do Claretiano - Rede de Educação ESTATÍSTICA Caderno de Referência de Conteúdo Carlos Alberto Marinheiro Cláudio Pereira Bidurin Batatais Claretiano 2013 Fazemos parte do Claretiano - Rede de Educação © Ação Educacional Clare ana, 2011 – Batatais (SP) Versão: dez./2013 519.5 S713e Marinheiro, Carlos Alberto Estatística / Carlos Alberto Marinheiro, Cláudio Pereira Bidurin – Batatais, SP : Claretiano, 2013. 242 p. ISBN: 978-85-67425-08-5 1. Síntese histórica e organização da estatística brasileira. 2.Dados estatísticos. 3. Distribuição de freqüências. 4. Medidas de tendência central. 5. Medidas de dispersão. 6. Teoria elementar de probabilidade. 7. Distribuições de probabilidade. 8. Teoria da amostragem. 9. Estimação. 10. Testes de hipóteses. I. Bidurin, Cláudio Pereira. II. Estatística. CDD 519.5 Corpo Técnico Editorial do Material Didático Mediacional Coordenador de Material Didá co Mediacional: J. Alves Preparação Aline de Fátima Guedes Camila Maria Nardi Matos Carolina de Andrade Baviera Cá a Aparecida Ribeiro Dandara Louise Vieira Matavelli Elaine Aparecida de Lima Moraes Josiane Marchiori Mar ns Lidiane Maria Magalini Luciana A. Mani Adami Luciana dos Santos Sançana de Melo Luis Henrique de Souza Patrícia Alves Veronez Montera Rita Cristina Bartolomeu Rosemeire Cristina Astolphi Buzzelli Simone Rodrigues de Oliveira Bibliotecária Ana Carolina Guimarães – CRB7: 64/11 Revisão Cecília Beatriz Alves Teixeira Felipe Aleixo Filipi Andrade de Deus Silveira Paulo Roberto F. M. Sposati Ortiz Rodrigo Ferreira Daverni Sônia Galindo Melo Talita Cristina Bartolomeu Vanessa Vergani Machado Projeto gráfico, diagramação e capa Eduardo de Oliveira Azevedo Joice Cristina Micai Lúcia Maria de Sousa Ferrão Luis Antônio Guimarães Toloi Raphael Fantacini de Oliveira Tamires Botta Murakami de Souza Wagner Segato dos Santos Todos os direitos reservados. É proibida a reprodução, a transmissão total ou parcial por qualquer forma e/ou qualquer meio (eletrônico ou mecânico, incluindo fotocópia, gravação e distribuição na web), ou o arquivamento em qualquer sistema de banco de dados sem a permissão por escrito do autor e da Ação Educacional Claretiana. Claretiano - Centro Universitário Rua Dom Bosco, 466 - Bairro: Castelo – Batatais SP – CEP 14.300-000 cead@claretiano.edu.br Fone: (16) 3660-1777 – Fax: (16) 3660-1780 – 0800 941 0006 www.claretianobt.com.br SUMÁRIO CADERNO DE REFERÊNCIA DE CONTEÚDO 1 INTRODUÇÃO ................................................................................................... 9 2 ORIENTAÇÕES PARA ESTUDO .......................................................................... 10 UNIDADE 1 A NATUREZA DOS DADOS ESTATÍSTICOS 1 OBJETIVOS ........................................................................................................ 33 2 CONTEÚDOS ..................................................................................................... 33 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 34 4 INTRODUÇÃO À UNIDADE ............................................................................... 35 5 UM POUCO DE HISTÓRIA................................................................................. 35 6 CONCEITOS IMPORTANTES ............................................................................. 37 7 POPULAÇÃO VERSUS AMOSTRA ..................................................................... 39 8 QUESTÕES AUTOAVALIATIVAS ........................................................................ 42 9 CONSIDERAÇÕES .............................................................................................. 43 10 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 44 UNIDADE 2 TABULAÇÃO DE DADOS 1 OBJETIVOS ........................................................................................................ 45 2 CONTEÚDOS ..................................................................................................... 45 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 46 4 INTRODUÇÃO À UNIDADE ............................................................................... 46 5 DADOS BRUTOS ................................................................................................ 47 6 TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS ................................................ 49 7 TABELA DE FREQUÊNCIAS SIMPLIFICADA ...................................................... 50 8 TABELA DE FREQUÊNCIAS POR INTERVALOS ................................................. 53 9 GRÁFICOS DE FREQUÊNCIAS ........................................................................... 55 10 GRÁFICOS DE FREQUÊNCIAS NO EXCEL 2003 ................................................ 57 11 QUESTÕES AUTOAVALIATIVAS ........................................................................ 63 12 CONSIDERAÇÕES .............................................................................................. 66 13 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 67 UNIDADE 3 MEDIDAS ESTATÍSTICAS DE POSIÇÃO 1 OBJETIVOS ........................................................................................................ 69 2 CONTEÚDOS ..................................................................................................... 69 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 69 4 INTRODUÇÃO À UNIDADE ............................................................................... 70 5 MEDIDAS ESTATÍSTICAS DE TENDÊNCIA CENTRAL ........................................ 716 RELAÇÃO ENTRE AS MEDIDAS DE TENDÊNCIA CENTRAL ............................. 88 7 MEDIDAS SEPARATRIZES.................................................................................. 90 8 QUESTÕES AUTOAVALIATIVAS ........................................................................ 93 9 CONSIDERAÇÕES .............................................................................................. 95 10 REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 96 UNIDADE 4 MEDIDAS ESTATÍSTICAS DE DISPERSÃO 1 OBJETIVOS ........................................................................................................ 97 2 CONTEÚDOS ..................................................................................................... 97 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE .............................................. 98 4 INTRODUÇÃO À UNIDADE ............................................................................... 98 5 MEDIDAS DE DISPERSÃO ................................................................................. 99 6 APLICAÇÕES DO DESVIO PADRÃO .................................................................. 105 7 USO DE RECURSOS TECNOLÓGICOS PARA O CÁLCULO DA MÉDIA E DO DESVIO PADRÃO ......................................................................................... 110 8 QUESTÕES AUTOAVALIATIVAS ........................................................................ 115 9 CONSIDERAÇÕES .............................................................................................. 117 10 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 118 UNIDADE 5 TEORIA ELEMENTAR DE PROBABILIDADE 1 OBJETIVOS ........................................................................................................ 119 2 CONTEÚDOS ..................................................................................................... 119 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 119 4 INTRODUÇÃO À UNIDADE ............................................................................... 120 5 CONCEITOS IMPORTANTES ............................................................................. 121 6 A PROBABILIDADE FREQUENTISTA ................................................................. 123 7 RELAÇÕES ENTRE EVENTOS ALEATÓRIOS ...................................................... 127 8 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA ..................................... 130 9 NOTAÇÃO DE PROBABILIDADE CONDICIONAL .............................................. 131 10 QUESTÕES AUTOAVALIATIVAS ........................................................................ 134 11 CONSIDERAÇÕES .............................................................................................. 135 12 REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 135 UNIDADE 6 DISTRIBUIÇÕES DE PROBABILIDADES 1 OBJETIVOS ........................................................................................................ 137 2 CONTEÚDOS ..................................................................................................... 137 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 138 4 INTRODUÇÃO À UNIDADE ............................................................................... 138 5 DISTRIBUIÇÕES DE PROBABILIDADE .............................................................. 139 6 A CURVA NORMAL COMO UMA DISTRIBUIÇÃO DE PROBABILIDADES ....... 143 7 A CURVA NORMAL PADRONIZADA ................................................................. 145 8 QUESTÕES AUTOAVALIATIVAS ........................................................................ 163 9 CONSIDERAÇÕES .............................................................................................. 164 10 REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 164 UNIDADE 7 TEORIA DA AMOSTRAGEM 1 OBJETIVOS ........................................................................................................ 167 2 CONTEÚDOS ..................................................................................................... 167 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 167 4 INTRODUÇÃO À UNIDADE ............................................................................... 168 5 MÉTODOS DE AMOSTRAGEM ......................................................................... 169 6 DISTRIBUIÇÕES DE PROBABILIDADES AMOSTRAIS ....................................... 173 7 DISTRIBUIÇÃO AMOSTRAL DA MÉDIA ........................................................... 174 8 DISTRIBUIÇÕES DE PROBABILIDADE AMOSTRAL DA PROPORÇÃO ............. 184 9 QUESTÕES AUTOAVALIATIVAS ........................................................................ 187 10 CONSIDERAÇÕES .............................................................................................. 188 11 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 188 UNIDADE 8 ESTIMAÇÃO 1 OBJETIVOS ........................................................................................................ 189 2 CONTEÚDOS ..................................................................................................... 189 3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE ............................................... 190 4 INTRODUÇÃO À UNIDADE ............................................................................... 190 5 ESTIMAÇÃO PONTUAL ..................................................................................... 191 6 ESTIMAÇÃO POR INTERVALOS ........................................................................ 192 7 DETERMINAÇÃO DO TAMANHO DA AMOSTRA ............................................. 205 8 ESTIMATIVAS PARA PEQUENAS AMOSTRAS OU PARA DESCONHECIDO ........ 207 9 FATOR DE CORREÇÃO PARA POPULAÇÃO FINITA .......................................... 216 10 QUESTÕES AUTOAVALIATIVAS ........................................................................ 218 11 CONSIDERAÇÕES .............................................................................................. 220 12 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 220 UNIDADE 9 TESTES DE HIPÓTESES 1 OBJETIVOS ........................................................................................................ 221 2 CONTEÚDOS ..................................................................................................... 221 3 SUGESTÕES PARA O ESTUDO DA UNIDADE ................................................... 222 4 INTRODUÇÃO À UNIDADE ............................................................................... 222 5 TESTES PARA A MÉDIA POPULACIONAL COM GRANDES AMOSTRAS E DESVIO PADRÃO POPULACIONAL CONHECIDO .......................................... 225 6 TESTES PARA A PROPORÇÃO POPULACIONAL COM GRANDES AMOSTRAS ....... 231 7 TESTES PARA A MÉDIA POPULACIONAL COM PEQUENAS AMOSTRAS OU DESVIO PADRÃO POPULACIONAL DESCONHECIDO .......................................235 8 TESTES PARA A PROPORÇÃO POPULACIONAL COM PEQUENAS AMOSTRAS ........238 9 QUESTÕES AUTOAVALIATIVAS ........................................................................ 240 10 CONSIDERAÇÕES .............................................................................................. 241 11 REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 242 EA D CRC Caderno de Referência de Conteúdo Ementa ––––––––––––––––––––––––––––––––––––––––––––– Síntese histórica e organização da Estatística brasileira. Dados estatísticos. Dis- tribuição de frequências. Medidas de tendência central. Medidas de dispersão. Teoria elementarde probabilidade. Distribuições de probabilidade. Teoria da amostragem. Estimação. Testes de hipóteses. –––––––––––––––––––––––––––––––––––––––––––––––––––– 1. INTRODUÇÃO A Estatística é subdividida em quatro partes: a Unidade 1 é destinada a uma visão mais conceitual sobre Estatística; as Unida- des 2, 3 e 4 são destinadas aos estudos da Estatística Descritiva; as Unidades 5, 6 e 7 são destinadas aos estudos de probabilidades; e as Unidades 8 e 9 são destinadas aos estudos de Estatística Infe- rencial. Os estudos realizados sobre o que chamamos Estatística Descritiva são de fundamental importância em qualquer área de atuação profissional, já que todos nós somos levados a decidir so- © Estatística10 bre uma diversidade de situações, e essas decisões sempre são tomadas com base em informações. Assim, de posse das informa- ções, análises são feitas e decisões tomadas. A Estatística Descriti- va ajuda na caracterização das informações, mas como é restrita a amostra, não é capaz de ajudar no processo decisório. Todo processo decisório envolvendo o uso de medidas esta- tísticas é estudado no campo da Estatística Inferencial, que é o as- sunto desse Caderno de Referência de Conteúdo. O que chamamos Estatística Aplicada é a transformação das medidas descritivas em medidas inferenciais, ou medidas de decisão. É claro que a composição das medidas inferenciais levará em consideração a presença do erro da análise, já que lidamos com dados amostrais. Para trabalhar com o erro da análise, vamos in- troduzir no campo da Estatística as medidas de probabilidade, que permitirão configurar de forma bem clara o erro dos dados e ge- neralizar os dados amostrais para todo o universo de interesse, possibilitando, assim, a tomada de decisões. Após esta introdução aos conceitos principais, apresenta- mos a seguir, no tópico Sugestões para Estudo, algumas orienta- ções de caráter motivacional, dicas e estratégias de aprendizagem que poderão facilitar o seu estudo. 2. ORIENTAÇÕES PARA ESTUDO Abordagem Geral Prof. Ms. Cláudio Pereira Bidurin Neste tópico, apresenta-se uma visão geral do que será estu- dado neste Caderno de Referência de Conteúdo. Aqui, você entrará em contato com os assuntos principais deste conteúdo de forma breve e geral e terá a oportunidade de aprofundar essas questões no estudo de cada unidade. Desse modo, essa Abordagem Geral visa fornecer-lhe o conhecimento básico necessário a partir do Claretiano - Centro Universitário 11© Caderno de Referência de Conteúdo qual você possa construir um referencial teórico com base sólida – científica e cultural – para que, no futuro exercício de sua profis- são, você a exerça com competência cognitiva, ética e responsabi- lidade social. Nessa Abordagem Geral, temos como objetivo ilustrar as ideias conceituais deste Caderno de Referência de Conteúdo, tra- balhadas em cada unidade, bem como um direcionamento mais amplo dos objetivos. Vamos em frente. Para que serve a Estatística? Quais motivos temos para es- tudá-la? Se você considerar cenários administrativos e gerenciais, si- tuações de análises contábeis, problemas de gestão de pessoas e de materiais, casos de logística e de transportes, análise de cená- rios econômicos, enfim, toda uma sorte de situações relacionadas com a prática de empresas, o que podemos detectar de comum em todas elas? Dentre as similaridades, vamos destacar uma que nos inte- ressa mais. Em todas as situações citadas, existe um momento im- portante chamado de tomada de decisão, ou seja, o momento em que o analista decide qual o caminho a seguir, qual decisão levará a empresa a atingir suas metas. Se concordarmos que o processo de tomada de decisões é de fato inerente aos cenários descritos, cabe uma nova pergunta: O que é importante para uma tomada de decisão? O mais impor- tante é dispor de informações que propiciem que essa decisão seja feita com embasamento e critérios. Mas temos, então, uma nova questão a responder: Como as informações devem ser analisadas para propiciar uma decisão acertada? Temos vários caminhos para analisar as informações. Um desses caminhos, que contribui de forma decisiva para a tomada de decisão, é a Análise Estatística dos dados. Assim, temos de es- tudar Estatística, pois é natural sua utilização no dia a dia dos ce- © Estatística12 nários gerenciais. Além disso, veremos no decorrer deste estudo que em muitos casos não basta conhecermos as ferramentas de análise, devemos também possuir um olhar crítico para saber uti- lizar os resultados. Nosso objetivo, portanto, é propiciar a você um conjunto de ferramentas para a análise de conjuntos de dados, sob a ótica da Estatística, trabalhando o ferramental matemático, o processo de cálculo, associado à necessidade de compreensão da aplicabilida- de de cada ferramenta apresentada. A Estatística nasceu como uma ferramenta destinada apenas à coleta e descrição de dados, como veremos na Unidade 1, mas, com o tempo, se transformou em uma importante ferramenta de análise, quando utilizada em conjunto com as probabilidades. To- das as áreas do conhecimento fazem uso da Estatística, seja para o planejamento de pesquisas e experimentos, seja para a represen- tação de dados, ou seja, para a análise inferencial das informações. Contudo, como a Estatística lida com a análise de dados, é importante que eles sejam produzidos, coletados, pesquisados com critérios técnicos, de forma a produzir informações pertinen- tes e confiáveis. Se vamos analisar um conjunto de dados, é neces- sário que esses dados possam de fato representar o fenômeno de interesse. Isso ocorre quando utilizamos metodologias adequadas para a coleta dos dados. Assim, quando elaboramos os procedimentos e metodolo- gias que serão utilizados para a coleta e pesquisa dos dados, de- vemos seguir padrões rigorosos e científicos para que eles não sejam distorcidos e/ou manipulados. Para tal rigor, podemos nos valer dos procedimentos discutidos em Metodologia Científica, que sugere etapas a serem seguidas para permitir uma pesquisa de dados adequada, ou seja: definir os objetivos e hipótese que desejamos atingir, nossas metas; definir as fontes a serem utiliza- das, de onde serão retirados os dados; definir os instrumentos de coleta de dados ou questionários, que devem estar diretamente relacionados com os objetivos e estabelecer as técnicas apropria- Claretiano - Centro Universitário 13© Caderno de Referência de Conteúdo das para a coleta efetiva das informações, ou seja, um processo de amostragem que seja o mais recomendável para aquela situação. Algum detalhamento sobre esse assunto será dado na Unidade 1, bem como a conceituação de População Estatística e Amostra. Quando definimos as fontes de dados, podemos trabalhar com todas as fontes existentes, como, por exemplo, em uma pes- quisa de mercado utilizar todos os possíveis consumidores, ou em uma análise de qualidade, verificar 100% dos itens produzidos ou ainda, em uma avaliação financeira de uma franquia, analisar to- dos os franqueados do Brasil. Contudo, você deve refletir sobre a viabilidade de analisar 100% das fontes existentes e pensar que isso, na maioria dos casos, não será prudente ou até mesmo im- possível de ser feito. Assim, podemos trabalhar então com uma Amostra das fontes, uma Amostra dos dados, utilizar apenas uma parte representativa das informações, que, apesar de gerar um erro de análise, é muito mais coerente em termos práticos. É justamente nesse cenário de utilização de amostras que a Estatística tem maior importância, em primeiro lugar para pos- sibilitar uma análise que faça o erro gerado ser minimizado e, em segundo lugar, para viabilizar uma generalização dos resultados obtidos na amostra, para toda a população. Considerando a realização da amostragem, o profissional se depara com a seguinte situação: a partir da coleta de dados realizada, dispõe de um conjunto de dados (de informações) que devem ser analisadas a fim de permitiruma interpretação e uma decisão, conclusão final. Na Unidade 2, discutiremos as formas de análise de dados chamadas de Tabulação, que nada mais são do que a disposição dos dados em forma de tabelas e/ou gráficos, construídos com base no conceito de frequência. É natural supor que ao coletar os dados, exista certa repeti- ção de algumas informações (qualitativas ou quantitativas). Essa repetição de alguns resultados é o início do processo investigativo © Estatística14 sobre os dados e a função da frequência é justamente mostrar, descrever, como ocorrem essas repetições. Estudaremos duas fre- quências principais: a frequência absoluta (ou frequência simples) que é a contagem do número de vezes que cada informação se re- pete nos dados coletados, que possui a capacidade de ilustrar qual resultado é mais expressivo em relação aos demais, indicando um início de análise por incidência. Contudo, a frequência absoluta não permite comparações entre períodos ou cenários, e, portan- to será transformada em uma Frequência Relativa (ou frequência percentual) que tem como principal função permitir análises com- parativas entre as informações originárias de períodos diferentes ou grupos e cenários diferentes. A transformação de uma frequência absoluta em uma fre- quência relativa segue a mesma mecânica dos cálculos percentu- ais tradicionais, isto é, dividindo-se uma frequência absoluta pelo total e multiplicando-se por 100 obtemos a frequência percentual ou relativa. O uso das frequências pode ser feito por meio de tabelas de frequências, que se diferenciam de acordo com o tipo de informa- ção coletada, que pode ser qualitativa (não são expressas numeri- camente), ou quantitativa inteira (expressas numericamente, mas sempre por números inteiros) e quantitativa fracionária (expressas numericamente e podem apresentar casas decimais). Além das tabelas, as frequências também podem ser repre- sentadas por meio de gráficos de frequências, cujos principais são o gráfico de colunas, o gráfico de barras e o gráfico de setores (ou de pizza). Tanto a tabela quanto os gráficos de frequências são ferra- mentas descritivas dos dados, ou seja, não possuem intenção de permitir uma análise mais aprofundada dos dados, apenas apre- sentar de forma ordenada as informações a fim de facilitar a aná- lise posterior. É muito comum encontrarmos tabelas e gráficos em artigos de jornais e revistas e mesmo em matérias de jornais tele- Claretiano - Centro Universitário 15© Caderno de Referência de Conteúdo visivos, pois o impacto visual é muito favorável à transmissão da ideia sobre os resultados. Quando trabalhamos com dados qualitativos, a representa- ção descritiva das tabelas e gráficos é muito eficiente. Contudo, quando trabalhamos com dados quantitativos, essa representação não é suficiente para uma plena compreensão dos resultados. Para aprimorar a descrição dos dados, quando esses são originários de variáveis quantitativas (expressas numericamente, como preço, quantidade produzida, lucro, taxas, peso, número de funcionários etc.) fazemos uso das Medidas Estatísticas. Nas Uni- dades 3 e 4, estudaremos um conjunto de medidas que tem como objetivo descrever de forma mais completa o comportamento de variáveis quantitativas. Iniciaremos nossos estudos com as Medi- das Estatísticas de Posição, cuja função é resumir as informações coletadas em apenas um único valor representativo. Dentre as medidas existentes, veremos como trabalhar com as médias, em especial trataremos de: • média aritmética simples: que é definida pela divisão en- tre a soma dos valores e o número de elementos; • média aritmética ponderada: que é definida pela divisão entre a soma ponderada dos valores e o peso total atribu- ído aos dados; • média geométrica: que é definida como uma média arit- mética na escala logarítmica dos dados. Essas três médias possuem características similares, mas são calculadas por meios diferentes. Estudaremos detalhadamente cada uma delas, desde a formalização dos cálculos até suas apli- cações. As médias se caracterizam por utilizar todos os dados dis- poníveis e, portanto, são sensíveis ao comportamento dos dados. Quando temos valores muito altos (ou muito baixos) nos dados, as médias podem oscilar para cima (ou para baixo) resultando, em © Estatística16 alguns momentos, em análises que não representam a realidade. Assim, nossos estudos não se limitarão à utilização de fórmulas, mas a uma visão criteriosa sobre a utilização prática das médias. Em muitos casos a aplicação de uma média pode prejudicar a aná- lise em vez de colaborar com ela. Para complementar a análise via médias, estudaremos tam- bém a mediana, a moda e as medidas separatrizes, que possuem características bem distintas das médias, e que, em muitas situa- ções, permitem uma análise mais coerente. É importante refor- çar que cabe ao analista a seleção adequada das ferramentas que serão utilizadas. Para isso, é muito mais importante conhecer as propriedades de cada uma do que sua forma de cálculo, pois, se soubermos calcular, mas não soubermos aplicar o resultado, de que adianta o cálculo? Devido a alguns problemas na utilização das médias, estu- daremos, na Unidade 4, as Medidas Estatísticas de Dispersão (ou medidas estatísticas de variabilidade). A dispersão nada mais é do que o grau de variação que existe dentro de um conjunto de dados numéricos. Quando esse grau de variação é alto, a análise pelas médias fica prejudicada. Assim, é importante saber mensurar, me- dir o grau de variação dos dados. Faremos isso por meio das seguintes medidas: • Variância amostral: é uma medida de variabilidade ab- soluta definida como a diferença ao quadrado entre cada valor existente no conjunto de dados e a média aritmética do conjunto. • Desvio Padrão Amostral: é uma medida de variabilida- de absoluta definida como a raiz quadrada da variância amostral. • Coeficiente de Variação: é uma medida de variabilidade relativa definida pela divisão entre o desvio padrão e a média aritmética dos dados. Claretiano - Centro Universitário 17© Caderno de Referência de Conteúdo A variância é uma medida que serve para determinar o grau de variação dos dados. Assim, quanto maior o valor da medida va- riância, maior é o grau de variação e, consequentemente, a média perde a capacidade de mostrar uma informação pertinente. Como a variância tem uma característica de trabalhar com as diferenças tomadas ao quadrado, ela pode, muitas vezes, gerar resultados inconsistentes com a prática. Por essa razão, utilizamos outra me- dida que, de certa forma, anula o efeito dos expoentes quadrá- ticos. Essa medida é o desvio padrão que, de tão importante no segmento de análise de dados, aparece em todas as calculadoras científicas e financeiras. Durante nossos estudos vamos abordar o uso dos recursos tecnológicos para o cálculo de algumas medidas estatísticas. O desvio padrão permitirá uma série de análises importan- tes, como, por exemplo, o cálculo de uma medida de variabilidade relativa, que chamamos de coeficiente de variação. Por ser uma medida de variabilidade relativa, o coeficiente de variação permite compararmos o grau de variação entre dois ou mais cenários, o que pode ser de fundamental importância na tomada de decisão. Outra medida que estudaremos na Unidade 4 é o Índice de Assimetria dos dados, que é o resultado de uma relação entre a média aritmética, a mediana e o desvio padrão amostral. A assime- tria dos dados está diretamente relacionada com a aplicabilidade da média. Dados simétricos permitem uma análise mais criteriosa da média, enquanto que dados assimétricos podem resultar em uma representação não significativa pela média. Note que não es- tamos falando apenas de cálculos, mas de cálculos que permitem uma análise crítica sobre os dados e, por assim dizer, sobre a pos- sibilidade efetiva de avaliar esses dados a fim de tomar decisões. Nas unidades 2, 3 e 4, discutiremos as ferramentasdescritas anteriormente e que correspondem à chamada Estatística Descri- tiva. Como o próprio nome cita, a principal função dessas ferra- mentas é apresentar, descrever os dados que foram coletados na amostragem. © Estatística18 Contudo, devemos lembrar que a amostragem foi realizada para representar uma determinada população. Por exemplo, uma amostra de 1 000 clientes de uma empresa será avaliada para se ter uma ideia do que pensam todos os clientes da empresa (a po- pulação de clientes). Dessa forma, não podemos simplesmente nos limitar a ava- liar apenas os dados na amostra. Com base na informação obtida com os dados amostrais, devemos obrigatoriamente procurar ge- neralizar os resultados para toda a população, que, afinal, é o que interessa ao analista. Essa tarefa de generalizar os dados amostrais será incumbida às ferramentas de Estatística Inferencial. Para iniciar os estudos de inferência, necessitamos discutir um pouco sobre Probabilidades. Na Unidade 5, faremos uma breve revisão das teorias da pro- babilidade frequentista. Essa revisão é importante, pois será de uso constante a partir da Unidade 6. Veremos que o conceito de probabilidade frequentista nada mais é do que o relacionamento entre conjuntos de dados: um que determina os resultados de interesse e outro que determina o conjunto total de resultados possíveis, que é chamado de espaço amostral, sempre considerando que esses conjuntos são resultado de uma ação ou cenário aleatório, isto é, com certo grau de incer- teza sobre os resultados. As probabilidades, que se originaram para atribuir chances em jogos de azar, evoluíram de forma acelerada no campo das ci- ências com muitas aplicações importantes. Em conjunto com as medidas estatísticas, as probabilidades são capazes de propiciar a generalização dos dados amostrais para dados populacionais. No entanto, como você verá ao estudar a Unidade 5, a apli- cação direta das fórmulas conhecidas de probabilidade, apresenta algumas limitações de ordem prática, isto é, dependendo do cená- rio envolvido com os dados, não é possível avaliar as probabilida- des pelas fórmulas que estudamos na Educação Básica. Claretiano - Centro Universitário 19© Caderno de Referência de Conteúdo Assim, na Unidade 6 estenderemos os estudos das teorias frequentistas de probabilidades para as Distribuições de Probabi- lidades. Temos muitas formas de determinar uma distribuição de probabilidades, mas nos limitaremos a estudar aquela que apre- senta uma gama maior de possibilidades práticas. Essa distribuição de probabilidade é chamada distribuição normal de probabilidades, ou distribuição de Gauss, que é repre- sentada e avaliada por meio de um gráfico em forma de sino, cha- mado de Curva Normal ou Curva de Gauss. Devido à complexidade de se trabalhar com essa curva, que exigiria um conhecimento mais apurado em Cálculo Integral, va- mos conceituar alguns elementos que nos permitirão uma análise mais direta da Curva: • Curva Normal Padronizada: apresenta uma média fixa igual a zero e um desvio padrão fixo igual a um. • Fórmula da Padronização: permite trabalhar em qual- quer cenário prático, com uma média e desvio padrão qualquer, e transformar esse cenário de acordo com a curva normal. • Tabela da Normal Padronizada: é utilizada para calcular efetivamente as probabilidades. É importante salientar que todos os cálculos envolvendo pro- babilidades dependerão da tabela normal padronizada. Na Unida- de 6, você encontrará uma tabela completa de fácil utilização para subsidiar os cálculos. Contudo, existem diversos outros modelos de tabelas, que se diferenciam na forma de utilização (não no re- sultado final). Após estudar como utilizar a curva e a tabela normal padro- nizada, vamos relacionar essa medida de probabilidade com nos- sos problemas em Estatística, ou seja, atrelar as probabilidades ao estudo de amostras. Para isso, devemos inicialmente pensar sobre o comportamento das amostras. © Estatística20 Já dissemos que as probabilidades devem estar relaciona- das com fenômenos aleatórios e cabe uma questão: Toda amostra coletada na avaliação de um cenário será aleatória? A resposta é: depende de como foram selecionados os elementos da amostra. Dessa forma, no início da Unidade 7, estudaremos meios de garantir que a amostra seja Aleatória, ou também chamada de Amostra Probabilística. Em particular, estudaremos as amostras aleatórias simples (que são resultados de procedimentos de sor- teio), as amostras aleatórias sistemáticas e as amostras aleatórias estratificadas. Cada um dos tipos de amostra aleatória tem sua fi- nalidade e situação típica de uso. O mais importante é lembrar que: o uso de um procedimento de amostragem aleatória garante a aplicação das medidas de probabilidades sobre os resultados ori- ginários da amostra, como as médias ou uma porcentagem qual- quer. É isso que possibilita generalizar os dados amostrais para a população. Em cenários onde a amostra é coletada por conveni- ência (não aleatória ou não probabilística), as inferências não são possíveis de serem efetuadas e ficamos apenas com a descrição dos dados, insuficiente para uma boa decisão. Ainda na Unidade 7, veremos como fazer a articulação entre a amostra e a Curva Normal, definindo a Fórmula da Padroniza- ção para dados amostrais. Nesse sentido, vamos diferenciar essa padronização de acordo com o tipo de informação que foi utiliza- da na amostra. Lembre-se de que em uma coleta de dados pode- mos utilizar dados qualitativos (a preferência do cliente, o tipo de ação mais negociada na bolsa, os bens declarados no IRPF etc.) ou quantitativos (o salário de uma pessoa, o número de funcionários de uma empresa etc.), de forma que teremos uma fórmula para padronizar e medir probabilidades quando lidamos com uma mé- dia (dados quantitativos, numéricos) e outra fórmula para padro- nizar e medir probabilidades quando lidamos com uma proporção (dados qualitativos, não numéricos). Claretiano - Centro Universitário 21© Caderno de Referência de Conteúdo Por meio das fórmulas de padronização, na Unidade 8, dare- mos início ao estudo de Estatística Inferencial, por intermédio da montagem das Estimativas por Intervalos de confiança. A finalida- de da construção dessas estimativas por intervalos é justamente realizar a generalização dos dados amostrais. Por exemplo, se em uma análise de uma amostra de 50 empresas encontramos um passivo médio de um determinado valor em reais, qual será a es- timativa do passivo médio para a população de empresas? A res- posta é obtida por meio dessas estimativas. Você deve direcionar seus estudos na Unidade 8 em duas frentes: a primeira é no enten- dimento da montagem do intervalo, que levará em consideração o cálculo da Margem de Erro da estimativa; a segunda é na com- preensão do que é a margem de erro, que estará relacionada com três componentes: o tamanho da amostra utilizada, uma medida do grau de variação dos dados amostrais e uma medida de proba- bilidade (que chamamos de grau de confiabilidade da estimativa). Cada um dos componentes gera um impacto nessa margem de erro e permite encontrarmos estimativas confiáveis e precisas ao mesmo tempo. Será importante você associar essa margem de erro como uma medida do erro de análise que citamos no início dessa abor- dagem. Quando trabalhamos com amostras é natural supor que temos um erro envolvido já que não utilizamos todos os dados disponíveis. Assim, a margem de erro representa esse erro e, com- binando os componentes citados anteriormente, podemos fazer o tal erro se tornar tão pequeno quanto necessário. No cenário das estimativas, vamos discutir a construção das estimativas para médias (quando temos dados quantitativos) e para proporções (quando temos dados qualitativos), utilizando as fórmulas geradas na Unidade 7. Contudo, um alerta deve ser fei- to. Conforme a discussão a respeito das probabilidades (Unidade 6), a curva e a tabela normal padronizada exigem algumascondi- ções para seu uso (o tamanho da amostra deve ser superior a 30 © Estatística22 elementos e o desvio padrão dos dados deve ser populacional). Quando tais condições não ocorrem, devemos mudar de distribui- ção de probabilidades. Na Unidade 8, falaremos de outro tipo de distribuição de probabilidades conhecida como Distribuição t-Student, que tam- bém é utilizada sob a forma de uma tabela de valores, que está presente na unidade. Toda a discussão realizada em relação à cur- va e à tabela normal padronizada vale, também, para a curva e a tabela t-Student. Com as duas tabelas, podemos construir estima- tivas para qualquer situação prática. Para finalizar nossos estudos, na Unidade 9, conheceremos as técnicas de testes de hipóteses, que efetivamente é um proces- so de análise de decisão. Da mesma forma que os intervalos de confiança, os testes são importantes para abordar os resultados populacionais com base nos dados amostrais. A principal diferença entre as duas técnicas é que as estimativas procuram encontrar um intervalo para descobrir os resultados da população, enquanto os testes procuram avaliar se hipóteses iniciais sobre o cenário po- pulacional são verdadeiras ou falsas. Por exemplo: ao suspeitar que os clientes de determinada empresa estão reduzindo suas compras (uma hipótese), um analis- ta avaliou uma amostra de 200 desses clientes, determinou o con- sumo médio atual e comparou-o com o consumo médio de meses atrás. Se na amostra coletada não for verificada uma queda, pode- mos admitir que a hipótese inicial está correta (verdadeira). Veri- ficações como essa podem ser implementadas com o ferramental que discutiremos na Unidade 9. Com as estimativas e os testes de hipóteses, temos uma con- dição inicial de análise Estatística Inferencial. Nessas condições, estaremos preparados para executar cole- ta de dados (Unidade 1), representar os dados amostrais (estatís- tica descritiva, Unidades 2, 3 e 4), determinar probabilidades para os dados amostrais (Unidades 5, 6 e 7) e realizar inferências popu- lacionais (Unidades 8 e 9). Claretiano - Centro Universitário 23© Caderno de Referência de Conteúdo É claro que o conteúdo aqui estudado, não esgota a Estatísti- ca Básica. Temos outras ferramentas que não foram consideradas neste Caderno de Referência de Conteúdo e que podem ser úteis na análise de cenários gerenciais. Portanto, vale a pena você pes- quisar sobre esses assuntos na bibliografia indicada. Sugerimos, nesse sentido, um estudo sobre os modelos de regressão e cor- relação linear e, também, outros testes de hipóteses, como para diferença entre médias. Com base nessa descrição do conteúdo e pequeno direcio- namento sobre o que será estudado, esperamos que você desen- volva seus estudos de uma forma tranquila e natural, lembrando que os tutores estarão à disposição para auxiliar sua caminhada. Bons estudos! Glossário de Conceitos O Glossário de Conceitos permite a você uma consulta rá- pida e precisa das definições conceituais, possibilitando-lhe um bom domínio dos termos técnico-científicos utilizados na área de conhecimento dos temas tratados no Caderno de Referência de Conteúdo Estatística. Veja, a seguir, a definição dos principais con- ceitos: 1) Amostra: subconjunto da população. Por possuir um nú- mero reduzido de elementos, a amostra é mais viável de ser pesquisada do que a população, mas em compensa- ção gera possibilidade de erro maior na análise. 2) Amostras aleatórias: caso particular de amostragem que visa garantir a todos os elementos da população uma chance real de ser selecionado para a amostra e, ainda, visa garantir a representatividade de todas as ca- racterísticas importantes da população na amostra. São também chamadas amostras probabilísticas e permitem análises inferenciais de decisão. 3) Distribuição amostral: aplicação dos conceitos de distri- buição de probabilidade dentro de uma amostra, con- siderando que todos os resultados obtidos em amos- © Estatística24 tras são aleatórios e sujeitos a incerteza ou erro. Assim, podemos associar uma medida de probabilidade para todos os resultados amostrais. Com base nessas distri- buições amostrais são construídas as ferramentas de in- ferência estatística. 4) Distribuição de probabilidade: pode ser entendida como um comportamento típico e padronizado dos va- lores das probabilidades relacionadas com um particular fenômeno. Dentre as inúmeras distribuições de proba- bilidades existentes, veremos duas que possuem maior aplicabilidade, a normal e a t-Student. 5) Distribuições de frequências: ferramentas de tabulação de dados e correspondem a uma ordenação dos dados segundo um agrupamento por frequência de ocorrên- cia, que podem ser absolutas ou relativas. 6) Estimativa e estimador: estimativas são resultados atri- buídos a determinados parâmetros populacionais com base em informações amostrais, e estimador é a medida amostral que permite a construção das estimativas. Por exemplo, a média amostral é o estimador que permite construir estimativas para a média populacional. 7) Fenômenos aleatórios: situações ou ações cotidianas cujos resultados ou consequências são marcados pela incerteza, ou seja, não é possível prever afirmar com certeza seu resultado final. Os resultados amostrais ad- vindos da Estatística são todos aleatórios. 8) Gráficos de frequências: representações gráficas das ta- belas que permitem a transmissão e a análise dos dados mais facilitadas. 9) Hipóteses: condições ou resultados a priori que pode- mos estabelecer para os parâmetros populacionais, e que caracterizam, de forma ampla, o conceito de deci- são. Ao testar uma hipótese estamos automaticamente decidindo sobre os resultados populacionais. 10) Margem de erro: componente principal na construção das estimativas, pois fornece a dimensão real do erro da análise. Por meio dele, é possível estabelecer a precisão das estimativas. Quanto menor a margem de erro, me- Claretiano - Centro Universitário 25© Caderno de Referência de Conteúdo lhores serão os resultados obtidos e mais precisas serão as decisões. 11) Medidas de dispersão: são utilizadas para mensurar o grau de variabilidade no conjunto de dados, consideran- do a representação dos dados mediante a média aritmé- tica. 12) Medidas de posição: são ferramentas de análise descri- tiva dos dados e podem ser classificadas em de tendên- cia central (médias, mediana e moda) e de ordem (quar- til, decil e percentil). 13) Nível de confiabilidade: na construção da margem de erro, estabelecemos a probabilidade de acerto da es- timativa, ou seja, qual a probabilidade da estimativa construída de fato acertar o valor populacional. Essa probabilidade de acerto é o nível de confiança ou de confiabilidade da estimativa. 14) Nível de significância: podemos também tratar das esti- mativas do ponto de vista do erro. Como lidaremos com probabilidades, existe a chance de erro, ou seja, uma probabilidade da estimativa errar o valor populacional e essa probabilidade de erro é o nível de significância. 15) Notações importantes: neste caderno, trabalharemos simultaneamente com a amostra e com a população, en- tão, é importante estabelecer a notação para cada caso: a) N: tamanho da população. b) n: tamanho da amostra. c) fa: frequência absoluta. d) fr%: frequência relativa percentual. e) X : média aritmética simples. f) pX : média aritmética ponderada. g) G: média geométrica. h) Md: mediana. i) Mo: moda. j) Q1, Q2 e Q3: quartis. k) Var: variância amostral. © Estatística26 l) S: desvio padrão da amostra ou desvio padrão amostral. m) CV: coeficiente de variação. n) IA: índice de assimetria. o) : média da população ou média populacional. p) : desvio padrão da população ou desvio padrão populacional. q) : proporção da população ou proporção populacio- nal. r) p: proporção da população ou proporção popula- cional. s) Z: valor da tabela da distribuição normal padroni- zada. t) t: valor da tabela dadistribuição t-Student. u) : nível de significância. v) (1 – ): nível de confiança. 16) População estatística: conjunto que contém todas as fontes de dados de interesse; todos os dados e infor- mações sobre uma variável qualquer. Em geral, é muito grande e inviável de ser pesquisada completamente. 17) Probabilidade: ferramenta que possibilita associar uma chance de ocorrência a um determinado fenômeno ale- atório. 18) Simetria: particularidade de alguns conjuntos de dados, que possuem a média igual à mediana e à moda. Algu- mas distribuições de probabilidade, como a normal e a t-Student, apresentam um comportamento simétrico, que facilita os cálculos e gera menor variabilidade na in- formação. Esquema dos Conceitos-chave Para que você tenha uma visão geral dos conceitos mais importantes deste estudo, apresentamos, a seguir (Figura 1), um Esquema dos Conceitos-chave do Caderno de Referência de Conte- údo. O mais aconselhável é que você mesmo faça seu esquema de Claretiano - Centro Universitário 27© Caderno de Referência de Conteúdo conceitos-chave ou até mesmo seu mapa mental. Esse exercício é uma forma de você construir seu conhecimento, ressignificando as informações a partir de suas próprias percepções. É importante ressaltar que o propósito desse Esquema dos Conceitos-chave é representar, de maneira gráfica, as relações en- tre os conceitos por meio de palavras-chave, partindo dos mais complexos para os mais simples. Esse recurso pode auxiliar você na ordenação e na sequenciação hierarquizada dos conteúdos de ensino. Com base na teoria de aprendizagem significativa, entende- -se que, por meio da organização das ideias e dos princípios em esquemas e mapas mentais, o indivíduo pode construir seu conhe- cimento de maneira mais produtiva e obter, assim, ganhos peda- gógicos significativos no seu processo de ensino e aprendizagem. Aplicado a diversas áreas do ensino e da aprendizagem es- colar (tais como planejamentos de currículo, sistemas e pesquisas em Educação), o Esquema dos Conceitos-chave baseia-se, ainda, na ideia fundamental da Psicologia Cognitiva de Ausubel, que es- tabelece que a aprendizagem ocorre pela assimilação de novos conceitos e de proposições na estrutura cognitiva do aluno. Assim, novas ideias e informações são aprendidas, uma vez que existem pontos de ancoragem. Tem-se de destacar que “aprendizagem” não significa, ape- nas, realizar acréscimos na estrutura cognitiva do aluno; é preci- so, sobretudo, estabelecer modificações para que ela se configure como uma aprendizagem significativa. Para isso, é importante con- siderar as entradas de conhecimento e organizar bem os materiais de aprendizagem. Além disso, as novas ideias e os novos concei- tos devem ser potencialmente significativos para o aluno, uma vez que, ao fixar esses conceitos nas suas já existentes estruturas cog- nitivas, outros serão também relembrados. Nessa perspectiva, partindo-se do pressuposto de que é você o principal agente da construção do próprio conhecimento, por © Estatística28 meio de sua predisposição afetiva e de suas motivações internas e externas, o Esquema dos Conceitos-chave tem por objetivo tor- nar significativa a sua aprendizagem, transformando o seu conhe- cimento sistematizado em conteúdo curricular, ou seja, estabele- cendo uma relação entre aquilo que você acabou de conhecer com o que já fazia parte do seu conhecimento de mundo (adaptado do site disponível em: <http://penta2.ufrgs.br/edutools/mapascon- ceituais/utilizamapasconceituais.html>. Acesso em: 11 mar. 2010). Figura 1 Esquema dos conceitos-chave do Caderno de Referência de Conteúdo Estatística. Claretiano - Centro Universitário 29© Caderno de Referência de Conteúdo Como você pode observar, esse Esquema dá a você, como dissemos anteriormente, uma visão geral dos conceitos mais im- portantes deste estudo. Ao segui-lo, você poderá transitar entre um e outro conceito e descobrir o caminho para construir seu processo de ensino-aprendizagem. Por exemplo, o mapa indica para você que existe um roteiro predeterminado para uma melhor compreensão dos assuntos, assim, antes de estudar os conceitos de inferência, devemos estudar os conceitos de probabilidades e de distribuições de probabilidades. Pelo processo explicitado pelo mapa, pode-se ter uma visão clara do tratamento da temática da Estatística no CRC. O Esquema dos Conceitos-chave é mais um dos recursos de aprendizagem que vem se somar àqueles disponíveis no ambien- te virtual, por meio de suas ferramentas interativas, bem como àqueles relacionados às atividades didático-pedagógicas realiza- das presencialmente no polo. Lembre-se de que você, aluno EaD, deve valer-se da sua autonomia na construção de seu próprio co- nhecimento. Questões Autoavaliativas No final de cada unidade, você encontrará algumas questões autoavaliativas sobre os conteúdos ali tratados, as quais podem ser de múltipla escolha, abertas objetivas ou abertas dissertati- vas. Responder, discutir e comentar essas questões, bem como relacioná-las com a prática profissional pode ser uma forma de você avaliar seu conhecimento. Assim, mediante a resolução de questões pertinentes ao assunto tratado, você estará se preparan- do para a avaliação final, que será dissertativa. Além disso, essa é uma maneira privilegiada de você testar seus conhecimentos e adquirir uma formação sólida para sua prática profissional. Você encontrará, ainda, no final de cada unidade, um gaba- rito, que lhe permitirá conferir suas respostas sobre as questões autoavaliativas de múltipla escolha. © Estatística30 As questões de múltipla escolha são as que têm como resposta apenas uma alternativa correta. Por sua vez, entende-se por questões abertas objetivas as que se referem aos conteúdos matemáticos ou àqueles que exigem uma resposta determinada, inalterada. Já as questões abertas dissertativas obtêm por resposta uma interpretação pessoal sobre o tema tratado; por isso, normalmente, não há nada relacionado a elas no item Gabarito. Você pode comentar suas respostas com o seu tutor ou com seus colegas de turma. Bibliografia Básica É fundamental que você use a Bibliografia Básica em seus estudos, mas não se prenda só a ela. Consulte, também, as biblio- grafias complementares. Figuras (ilustrações, quadros...) Neste material instrucional, as ilustrações fazem parte inte- grante dos conteúdos, ou seja, elas não são meramente ilustra- tivas, pois esquematizam e resumem conteúdos explicitados no texto. Não deixe de observar a relação dessas figuras com os con- teúdos, pois relacionar aquilo que está no campo visual com o con- ceitual faz parte de uma boa formação intelectual. Dicas (motivacionais) O estudo deste Caderno de Referência de Conteúdo convida você a olhar, de forma mais apurada, a Educação como processo de emancipação do ser humano. É importante que você se atente às explicações teóricas, práticas e científicas que estão presentes nos meios de comunicação, bem como partilhe suas descobertas com seus colegas, pois, ao compartilhar com outras pessoas aqui- lo que você observa, permite-se descobrir algo que ainda não se conhece, aprendendo a ver e a notar o que não havia sido perce- bido antes. Observar é, portanto, uma capacidade que nos impele à maturidade. Claretiano - Centro Universitário 31© Caderno de Referência de Conteúdo Você, como aluno dos cursos de Graduação na modalidade EaD, necessita de uma formação conceitual sólida e consistente. Para isso, você contará com a ajuda do tutor a distância, do tutor presencial e, sobretudo, da interação com seus colegas. Sugeri- mos, pois, que organize bem o seu tempo e realize as atividades nas datas estipuladas. É importante, ainda, que você anote suas reflexões em seu caderno ou no Bloco de Anotações, pois, no futuro, elas poderão ser utilizadas na elaboração de sua monografia ou de produções científicas. Leia os livros da bibliografia indicada, para que você amplie seushorizontes teóricos. Coteje-os com o material didático, discu- ta a unidade com seus colegas e com o tutor e assista às videoau- las. No final de cada unidade, você encontrará algumas questões autoavaliativas, que são importantes para a sua análise sobre os conteúdos desenvolvidos e para saber se estes foram significativos para sua formação. Indague, reflita, conteste e construa resenhas, pois esses procedimentos serão importantes para o seu amadure- cimento intelectual. Lembre-se de que o segredo do sucesso em um curso na modalidade a distância é participar, ou seja, interagir, procurando sempre cooperar e colaborar com seus colegas e tutores. Caso precise de auxílio sobre algum assunto relacionado a este Caderno de Referência de Conteúdo, entre em contato com seu tutor. Ele estará pronto para ajudar você. Claretiano - Centro Universitário 1 EA D A natureza dos dados estatísticos 1. OBJETIVOS • Conhecer um pouco da história da Estatística. • Entender o que é população e amostra e suas relações. • Conhecer e aplicar as fases de desenvolvimento de um trabalho estatístico. • Compreender a metodologia da coleta dos dados. 2. CONTEÚDOS • Origem histórica da Estatística. • População e amostra. • Fases de um trabalho estatístico. Coleta, crítica, apuração e exposição de dados. © Estatística34 3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE Antes de iniciar o estudo desta unidade, é importante que você leia as orientações a seguir: 1) Tenha sempre a mão o significado dos conceitos expli- citados no Glossário e suas ligações pelo Esquema dos Conceitos-chave para o estudo de todas as unidades deste CRC. Isso poderá facilitar sua aprendizagem e seu desempenho. 2) Procure desenvolver as atividades e interatividades den- tro do cronograma previsto para não prejudicar o anda- mento de seus estudos. 3) Antes de iniciar os estudos desta unidade pode ser in- teressante refletir sobre alguns conceitos introdutórios importantes. Parte desses conceitos será discutida com mais detalhes durante o andamento deste caderno. • População estatística: é o conjunto que contêm todos os elementos ou indivíduos de interesse para a reali- zação de uma pesquisa. Em geral, a população estatís- tica é bem grande, sendo inviável a coleta ou estudo de todos os seus elementos. • Amostra: é um subconjunto, uma parte representati- va da população. Como é inviável estudar toda a po- pulação, em geral, faz-se uma amostragem para efeti- var as pesquisas e análises de dados. A amostra deve satisfazer algumas propriedades e a principal delas é ser aleatória. • Metodologia de pesquisa: como as análises estatísti- cas são feitas com base em amostragem, é importan- te que a metodologia empregada na coleta dos dados seja a mais adequada possível, a fim de garantir a re- presentatividade dos dados da amostra, ou seja, para permitir que a análise dos dados amostrais permita uma extrapolação para a população. Claretiano - Centro Universitário 35© U1 - A natureza dos dados estatísticos 4. INTRODUÇÃO À UNIDADE Nesta unidade, vamos conversar um pouco sobre a origem e a evolução da Estatística. Além disso, compreenderá a inclusão dos tratamentos da informação nos Parâmetros Curriculares Nacionais e sua importância. Abordaremos, também, a Fundação Instituto Brasileiro de Geografia e Estatística (IBGE), que é responsável por todas as esta- tísticas no Brasil, fornecendo dados importantes para a tomada de decisão de nossos governantes. 5. UM POUCO DE HISTÓRIA A origem da palavra “estatística” está associada diretamen- te ao termo latino status (estado) e ao termo latino sticas (conta- gem), portanto “estatística”, originalmente, significa “contagem do estado”. Desde a antiguidade, realizava-se coleta de informações com finalidades tributárias. Há indícios, também, de que 3000 a.C. já se realizavam coletas de dados na Babilônia, China e Egito. De acordo com Moreira (1983), a Estatística pode ser dividi- da em três grandes períodos para caracterização de sua história e evolução. São eles: período focado na obtenção de fatos, período de evolução das teorias estatísticas e período do aperfeiçoamento técnico-científico. Observemos cada um deles a seguir. Período focado na obtenção de fatos Esse período abrange a Idade Antiga, a Idade Média e parte da Idade Moderna. Pelos registros encontrados, a Estatística era conhecida como Estatística Administrativa, tendo em vista o inte- resse estatal dos dados. Vejamos alguns destaques: © Estatística36 • Por meio do livro sacro Chou king, de autoria atribuída a Confúcio, têm-se notícias da preparação dos estados da China, no ano 2238 a.C. • Na Idade Média, no ano de 721, os árabes fizeram uma coleta numérica das cidades dominadas, computando a população e a produção para controle das conquistas ter- ritoriais. • Guilherme, o Conquistador, ordenou a elaboração de um cadastro da divisão do solo da Inglaterra das várias classes sociais existentes, para fins de arrecadação de impostos. Período de evolução das teorias estatísticas No segundo período, surge a denominação Estatística, que passa a ser uma disciplina autônoma. Citaremos alguns destaques desse período: • Na Inglaterra, no século 17, John Grant inicia as investi- gações sobre a Estatística Demográfica e estabelece algu- mas relações entre nascimento e morte. • Blaise Pascal e Pierre Fermat descobrem os cálculos das probabilidades, instrumento muito útil hoje em dia para análise de fenômenos aleatórios. • Adolphe Quetelet, no século 18, aplica a lei dos grandes números no estudo demográfico e social. Período do aperfeiçoamento técnico científico O terceiro período foi caracterizado pela aplicação dos con- ceitos estatísticos na ciência. Vejamos os destaques deste período: • Em 1853, há o Primeiro Congresso de Estatística. • Francis Galton emprega a Estatística Metodológica nos problemas de hereditariedade. • James Maxwell emprega a Estatística na Teoria Cinética dos Gases. Claretiano - Centro Universitário 37© U1 - A natureza dos dados estatísticos No Brasil, a Estatística tem sua história associada à história do Instituto Brasileiro de Geografia e Estatística (IBGE), cujas raízes remontam ao Império. É claro que a evolução da Estatística como ciência foi promo- vida em virtude das aplicações nas mais diversas áreas do conhe- cimento. Conforme as ciências naturais, as ciências da saúde, as ciências sociais foram se aprofundando, as metodologias de aná- lise estatística foram se estruturando e evoluindo naturalmente, em especial, após a utilização mais eficiente dos recursos compu- tacionais. Inicialmente, para entender a extensão da aplicação da Es- tatística é importante entender claramente os principais conceitos desse Caderno de Referência de Conteúdo. 6. CONCEITOS IMPORTANTES Conforme Moreira (1983), podemos dar à Estatística diver- sas definições, seja como ciências, seja como ferramenta. • Ciência: é o conjunto de conhecimentos exatos e racio- nais, relativos às causas das realizações e deduzidas pela demonstração. • Ferramenta: é a ordem ou conjunto de processos que devem ser estabelecidos para, mediante a investigação, atingir determinado objetivo. Quando definimos um pro- cedimento que já se mostrou válido para vários experi- mentos, temos o método científico. Nas áreas de aplicação, podemos entender que a Estatística é um conjunto de técnicas relacionadas com a coleta, representa- ção, interpretação e análise de dados obtidos em processos inves- tigativos, sejam eles relacionados a experimentos de laboratório, experimentos de campo, simulações, pesquisas de mercado, pes- quisas de opinião, isto é, qualquer procedimento cuja finalidade seja coletar dados para análise. © Estatística38 Para uma melhor visualização e entender de fato os objeti- vos da Estatística, considere um exemplo bem simples. Suponha que você retire uma fatia de um bolo inteiro. Ao experimentá-la, uma pessoa pede sua opinião sobre o bolo, perguntando:“O bolo está bom?”. Em geral, a tendência é que você responda algo como: “O bolo está bom”, ou então “O bolo não está bom”. É claro que as respostas apresentadas não estão totalmente de acordo com a situação, pois não temos como afirmar se o bolo está ou não está bom, pois conhecemos apenas uma pequena parte dele. Então, por que as pessoas respondem dessa forma? Simples: nós temos a tendência de generalizar o todo pela parte. Porém, a generalização só tem sentido se o bolo for total- mente homogêneo, o que não podemos afirmar. Avalie: quando você se serve de um pedaço de bolo, costuma optar pelos pedaços dos cantos? Ou prefere os pedaços que estão na região central? Ao observar que há partes diferentes no bolo, você pode perceber argumentos contrários à homogeneidade dele. Se o bolo for homogêneo, a generalização seria imediata, já que o pedaço veio do bolo e se o pedaço está bom, então o bolo também estará. Como não podemos afirmar se o bolo é ou não homogêneo, não podemos afirmar se está bom ou não. Se pudéssemos comer o bolo todo, o nível de acerto da res- posta seria muito maior, mas ainda teríamos um problema. Como não podemos afirmar que o bolo é homogêneo, encontraríamos diferentes sabores no bolo, o que dificultaria afirmarmos algo so- bre o bolo. Nesse sentido, temos situações práticas em que a informa- ção de interesse não é total, é apenas uma parte dos dados, e ain- da tem um fator de variabilidade não totalmente controlável, e, nesses casos, todas as conclusões não são totalmente corretas. Estatística, então, é uma ciência que analisa e caracteriza variáveis, considerando a presença de variabilidade e resultados Claretiano - Centro Universitário 39© U1 - A natureza dos dados estatísticos parciais. A variabilidade presente nas variáveis é natural, visto que no processo de coleta de qualquer tipo de variável ocorre a parti- cularidade de cada elemento estudado, mesmo em situações de alto controle. Sempre existirão componentes não controláveis que acarretarão variabilidades nos resultados, gerando, assim, proba- bilidades de acerto ou não em nossas análises. 7. POPULAÇÃO VERSUS AMOSTRA Quanto à parcialidade dos resultados, podemos melhorar o conceito, pensando o seguinte: em um processo de pesquisa ou de investigação, sempre temos um conjunto de fontes de informa- ções, e, em geral, contendo um grande número de elementos. Por exemplo, certamente você já ouviu falar em pesquisas eleitorais. Então, imagine uma pesquisa sobre candidatos ao cargo de pre- feito de uma determinada cidade. Considerando que ela possui, aproximadamente, 42 mil eleitores, poderíamos pesquisar todos? Se pesquisarmos todas as fontes, teríamos três problemas: o tempo gasto para a coleta e o custo da coleta, tendendo a ser sig- nificativos, podendo inviabilizar a coleta e, por último, a possibili- dade de desconhecimento de parte dos elementos. Nesse sentido, torna-se inviável o estudo de toda a população de elementos. População estatística é o conjunto total de elementos dispo- níveis, com, pelo menos, uma característica em comum e de inte- resse, que contém n elementos (tendendo a ser muito grande). A população pode ser classificada como: finita ou infinita (em rela- ção ao número de elementos) e discreta ou contínua (em relação ao tipo de elementos). Não confundir o conceito de população es- tatística com o conceito de população humana. População estatística deve ser entendida como qualquer tipo de agrupamento, não só pessoas, mas também de objetos, empresas, espécimes animais e vegetais, entre outros. © Estatística40 Utilizando a população, garantimos benefícios importantes para a precisão dos resultados finais, já que toda a informação dis- ponível passa a ser conhecida. Contudo, permanece o problema da variabilidade natural dos dados, que pode ser mais bem enten- dido com 100% da informação à disposição. Quando a inviabilidade do estudo populacional se fizer pre- sente, a coleta de dados se faz com apenas uma parte representa- tiva da população, conhecida como amostra. Amostra é um subconjunto da população, uma parte repre- sentativa do todo, que deve necessariamente conservar todas as características dos elementos da população. Em geral, deve ser definida de forma finita e bem definida para viabilizar a coleta dos dados. É por meio da amostra que chegamos ao conhecimento da população. O uso de amostra gera redução nos custos da coleta, redu- ção no tempo de execução da coleta, maior facilidade na coleta e erros nas análises. Como não temos todos os elementos, existirá uma chance de os resultados não serem significativos a ponto de represen- tar a população. Assim, é fundamental estruturar corretamente a amostragem, a fim de minimizar a margem de erro dos dados. Nem toda amostra é útil para análises estatísticas. A amostra deve ser representativa, ou seja, deve ser um retrato em miniatura da população. Garantindo-se um procedimento correto de amostragem, podemos analisar o comportamento das variáveis mediante a aná- lise estatística descritiva e construir estimativas confiáveis e pre- cisas a respeito das variáveis por intermédio da análise estatística inferencial, que é o processo no qual tiramos conclusões sobre o comportamento populacional de uma variável, com base no com- portamento particular observado e estudado na amostra. Claretiano - Centro Universitário 41© U1 - A natureza dos dados estatísticos A composição de uma amostra deve considerar critérios ri- gorosos para possibilitar resultados mais confiáveis. Em Estatística lidamos com amostras probabilísticas, que permite trabalharmos com estimativas e determinar de forma correta o erro amostral. Mais detalhes sobre as amostras probabilísticas serão dados na Unidade 7. Como todas as análises serão feitas com base nos dados co- letados, é importante que a metodologia utilizada na coleta seja cientificamente correta e que os instrumentos ou questionários utilizados sejam eficientes. Assim, é importante que se conheça com detalhes os objeti- vos da pesquisa ou o objetivo que se deseja atingir com os dados, quais as hipóteses de interesse e o que desejamos testar e inves- tigar. Com os objetivos definidos, podemos pensar de uma forma geral no seguinte procedimento metodológico: 1) Identificação da população de interesse e estruturação de como será o procedimento amostral, caso seja ne- cessário. 2) Construção dos instrumentos para a coleta dos dados (questionários, formulários, roteiros etc.). Para a elabo- ração dos instrumentos de coleta dos dados, devemos considerar que esse item é a espinha dorsal de qualquer levantamento e precisa reunir as informações necessá- rias para avaliar os objetivos definidos, utilizando uma linguagem adequada e de fácil compreensão e que não induzam a resposta. Pode mesclar questões abertas (dis- sertativas) e questões fechadas (múltipla escolha). 3) Realização de uma pré-pesquisa, cujo propósito é ava- liar a eficácia dos instrumentos de coleta ou mesmo do processo amostral. Após a aplicação da pré-pesquisa, os resultados obtidos devem ser utilizados para efetuar as correções necessárias, tanto nos instrumentos quanto no perfil da amostragem. 4) Coleta de dados é a fase de obtenção de dados, e de- verá ser feita com muito cuidado, pois dela dependerá a veracidade dos resultados obtidos. Basicamente, é a © Estatística42 aplicação dos instrumentos, já revisados, nos elementos selecionados na amostragem, que deve ser probabilísti- ca (ou aleatória). Assim, o procedimento a ser aplicado para se efetivar a coleta dos dados deve respeitar as ca- racterísticas probabilísticas da amostra. 5) Crítica de dados é a fase que tem por objetivo verificar possíveis ocorrências de dados equivocados, tanto na coleta direta dos dados quanto na fase de digitação ou de registro dos dados. 6) Tabulação dos dados é a fase da organização dos dados obtidos na amostragem. A tabulação, que pode ser feita com tabelas ou com gráficos,permite uma visão inicial dos resultados e também serve para uma divulgação ini- cial dos dados. 7) Análise dos dados é a fase onde, de fato, utilizamos os recursos da análise estatística, mediante as medidas descritivas e inferenciais, que permitirão a determinação das estimativas e dos testes das hipóteses de interesse. O sucesso no processo metodológico representa o sucesso na coleta dos dados, ou seja, com ele teremos dados representati- vos para analisar, e assim poderemos obter respostas significativas para avaliar os interesses estipulados no objetivo inicial. 8. QUESTÕES AUTOAVALIATIVAS Sugerimos que você procure responder, discutir e comentar as questões a seguir que tratam da temática desenvolvida nesta unidade. A autoavaliação pode ser uma ferramenta importante para você testar seu desempenho. Se encontrar dificuldades para res- ponder a essas questões, procure revisar os conteúdos estudados para sanar suas dúvidas. Esse é o momento ideal para realizar uma revisão desta unidade. Lembre-se de que, na Educação a Distân- cia, a construção do conhecimento ocorre de forma cooperativa e colaborativa; compartilhe, portanto, suas descobertas com seus colegas. Claretiano - Centro Universitário 43© U1 - A natureza dos dados estatísticos Confira, a seguir, as questões propostas para verificar o seu desempenho no estudo desta unidade: 1) Quais motivos tornam inviável a coleta de toda a população estatística? Quais as vantagens e quais as desvantagens em utilizar uma amostra em vez de utilizar a população? 2) Na realização de uma pesquisa de mercado para avaliar a potencialidade de venda de uma determinada marca de bebida energética, que será realizada por amostragem, qual o procedimento amostral mais indicado? Gabarito Confira, a seguir, as respostas corretas para as questões au- toavaliativas propostas: 1) Em geral, a população representa uma quantidade muito grande, ou até mesmo infinita, de elementos; sendo assim, é difícil coletar todos os ele- mentos, além de gastar um tempo elevado, bem como um custo alto. Assim, coletar uma amostra é mais rápido e barato, bem como mais fácil, mas em compensação se a metodologia da amostragem não for bem executada o erro gerado pela mesma pode ser muito alto. Um exemplo prático são as pesquisas eleitorais, em que apenas parte dos eleitores são ouvidos pelos institutos de pesquisa. Quando bem feitas, essas pesquisas conseguem pre- ver com qualidade os resultados. 2) Em pesquisas de mercado onde o perfil do consumidor é importante, o me- lhor é a amostragem estratificada, pois assim podemos ter uma representa- ção proporcional de cada perfil na amostra. 9. CONSIDERAÇÕES Estudamos nessa primeira unidade alguns conceitos impor- tantes para um bom entendimento da Estatística. Vimos que, em geral, trabalhamos com uma amostra dos dados e que, para ge- rar uma amostragem com dados representativos, devemos utilizar uma metodologia adequada. Com base nos dados coletados, ou seja, com base na amos- tra obtida, passamos para as fases de tabulação e análise, que se- rão discutidas nas unidades seguintes. Bons estudos! © Estatística44 10. REFERÊNCIAS BIBLIOGRÁFICAS FONSECA, J. S. Curso de Estatística. 6. ed. São Paulo: Atlas, 1996. MARTINS, G. A. Estatística geral e aplicada. 2. ed. São Paulo: Atlas, 2002. MOREIRA, J. S. Elementos de Estatística. 9. ed. São Paulo: Atlas, 1983. OLIVEIRA, F. E. M. Estatística e probabilidade. 2. ed. São Paulo: Atlas, 1999. EA D 2 Tabulação de dados 1. OBJETIVOS • Representar os dados coletados utilizando tabelas e gráfi- cos de frequências. • Conhecer e compreender a construção das tabelas e grá- ficos de frequências. • Analisar e interpretar os resultados. 2. CONTEÚDOS • Tabelas de frequências simples. • Tabelas de frequências em intervalos. • Gráficos de frequências. © Estatística46 3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE Antes de iniciar o estudo desta unidade, é importante que você leia as orientações a seguir: 1) Leia os livros da bibliografia indicada, para que você am- plie seus horizontes teóricos. Pesquise novas fontes e troque informações com seus colegas e tutor, pois toda experiência é bem-vinda e ajudará no aprendizado. 2) Antes de iniciar os estudos desta unidade, é importante refletir sobre alguns conceitos introdutórios essenciais, os quais serão discutidos com mais detalhes durante o estudo deste Caderno de Referência de Conteúdo. • Tabulação: processo que se utiliza para ordenar e or- ganizar um conjunto de dados brutos, obtido por meio de coleta de dados. • Tabela de frequência: um dos instrumentos de tabula- ção de dados. Organiza as informações em um formato de tabela, relacionando cada resposta obtida nos da- dos brutos com sua ocorrência por meio da frequência absoluta e da frequência relativa. • Gráfico de frequência: forma alternativa de represen- tação dos dados, com maior apelo visual, facilitando a transmissão do conteúdo das tabelas. 4. INTRODUÇÃO À UNIDADE Nesta unidade, de forma muito prática, vamos compreender como podemos descrever e analisar os dados estatísticos resultan- tes de variáveis qualitativas (não numéricas) e quantitativas (nú- meros inteiros ou fracionários), mediante a construção de tabelas e gráficos de frequências. Vamos partir do pressuposto de que determinada coleta de dados foi realizada, relacionada a um determinado contexto, e a partir daí vamos conceituar os dados brutos, o rol (que é o arranjo Claretiano - Centro Universitário 47© U2 - Tabulação de dados dos dados brutos em uma ordem de grandeza crescente ou de- crescente), as tabelas de frequências e os gráficos de frequências. Para a construção dos gráficos de frequências, vamos adotar a uti- lização da planilha eletrônica Excel. 5. DADOS BRUTOS De acordo com Crespo (2002), a tabela primitiva ou dados brutos pode ser definida como a relação inicial, o resultado da co- leta dos dados de interesse de uma determinada pesquisa, sejam eles numéricos ou não numéricos. Lembre-se de que, quando re- alizamos uma coleta de dados, as questões ou variáveis devem se relacionar com os objetivos da pesquisa. Assim, às vezes teremos variáveis qualitativas (não numéricas) e/ou variáveis quantitativas (numéricas). Assim, os dados brutos correspondem aos dados iniciais da pesquisa, sem nenhum tipo de organização ou tratamento, daí o nome “brutos”. A função da tabulação é organizar esses dados. Uma primeira forma de organizar os dados é a construção de um rol, que nada mais é do que a ordenação dos dados brutos, em ordem crescente (para as quantitativas) ou alfabética (para as qualitativas). Para exemplificar, vamos considerar uma pesquisa que foi realizada com 20 consumidores de café, na qual o interesse era avaliar a preferência e o consumo quanto a três diferentes marcas. Foi perguntada a marca de preferência, o número de copos de café tomados diariamente e o preço julgado como justo pelo quilo do pó de café da marca de preferência. Os dados obtidos na pesquisa estão na Tabela 1. © Estatística48 Tabela 1 Dados brutos da pesquisa sobre preferência e consumo de café. Pessoa Marca Número de copos Preço (R$) Pessoa Marca Número de copos Preço 1 A 6 3,50 11 B 5 4,21 2 A 8 3,00 12 D 5 3,25 3 B 6 3,25 13 A 9 3,20 4 C 5 4,00 14 A 5 3,75 5 B 5 3,75 15 C 6 4,10 6 C 8 3,00 16 B 6 2,85 7 A 8 3,15 17 D 7 2,90 8 A 7 3,25 18 A 7 3,15 9 A 6 2,90 19 A 8 3,80 10 D 5 4,15 20 C 9 4,15 Note que as informações de cada uma das três questões de interesse estão sem nenhum tipo de organização, estão apenas lis- tadas na tabela. É o que chamamos de dados brutos. Para construir o rol de cada questão, basta ordenar os dados. Assim, na Tabela 2 são apresentados os conjuntos ordenados. Tabela 2 Rol para as variáveis da pesquisa sobre preferência e consumo de café. Marca Número de copos Preço A 5 2,85 A 5 2,90 A 5 2,90 A 5 3,00 A 5 3,00 A 5 3,15 A 6 3,15 A 6 3,20 Claretiano - Centro Universitário 49© U2 - Tabulação de dados
Compartilhar