Baixe o app para aproveitar ainda mais
Prévia do material em texto
Introdução à Estatística Ensino à Distância Universidade Pedagógica Rua Comandante Augusto Cardoso nº 135 Direitos do autor Este módulo não pode ser reproduzido para fins comerciais. Caso haja necessidade de reprodução deverá ser mantida a referência à Universidade Pedagógica e aos seus autores. Universidade Pedagógica Rua Comandante Augusto Cardoso, nº 135 Telefone: 21-320860/2 Telefone: 21 - 306720 Fax: +258 21-322113 Agradecimentos À COMMONWEALTH of LEARNING (COL) COL pela disponibilização do Template usado na produção dos Módulos. Ao Instituto Nacional de Educação a Distância (INED) pela orientação e apoio prestados. Ao Magnífico Reitor, Directores de Faculdade e Chefes de Departamento pelo apoio prestado em todo o processo. Ficha Técnica Autores: Celso Albino Desenho Instrucional: Lourenço Mavaieie Revisão Linguística: Orlanda Ngomane Maquetização: Anilda Ibrahimo Khan Edição: Anilda Ibrahimo Khan Introdução à Estatística Ensino à Distância i Índice Visão geral 1 Bem-vindo ao Módulo de Introdução à Estatística........................................................... 1 Objectivos do Módulo....................................................................................................... 1 Quem deve estudar este Módulo? ..................................................................................... 1 Como está estruturado este Módulo?................................................................................ 2 Ícones de actividade.......................................................................................................... 2 Acerca dos ícones........................................................................................... 3 Habilidades de estudo ....................................................................................................... 4 Precisa de apoio?............................................................................................................... 5 Tarefas (avaliação e auto-avaliação)................................................................................. 5 Avaliação .......................................................................................................................... 6 Unidade 1 7 Estatística Descritiva......................................................................................................... 7 Introdução................................................................................................................ 7 Lição 1 9 Estatística: Conceitos Básicos........................................................................................... 9 Introdução................................................................................................................ 9 Sumário ........................................................................................................................... 15 Exercícios........................................................................................................................ 16 Feedback ......................................................................................................................... 19 Lição nº 2 21 Tabelas e gráficos ........................................................................................................... 21 Introdução.............................................................................................................. 21 Sumário ........................................................................................................................... 30 Exercícios........................................................................................................................ 30 Feedback ......................................................................................................................... 35 Lição nº 3 37 Medidas de tendência central.......................................................................................... 37 Introdução.............................................................................................................. 37 Sumário ........................................................................................................................... 45 Exercícios........................................................................................................................ 45 Feedback ......................................................................................................................... 46 Lição nº 4 49 Quartis e percentis. Diagrama de extremos e quartis...................................................... 49 Introdução.............................................................................................................. 49 ii Índice Sumário ........................................................................................................................... 55 Exercícios........................................................................................................................ 56 Feedback ......................................................................................................................... 57 Lição nº 5 58 Medidas de Dispersão ..................................................................................................... 58 Introdução.............................................................................................................. 58 Sumário ........................................................................................................................... 64 Exercícios........................................................................................................................ 64 Feedback ......................................................................................................................... 66 Lição nº 6 71 Coeficiente de correlação................................................................................................ 71 Introdução.............................................................................................................. 71 Sumário ........................................................................................................................... 77 Exercícios........................................................................................................................ 78 Feedback ......................................................................................................................... 79 Lição nº 7 83 Regressão linear simples................................................................................................. 83 Introdução.............................................................................................................. 83 Sumário ........................................................................................................................... 86 Exercícios........................................................................................................................ 86 Feedback ......................................................................................................................... 88 Unidade 2 91 Noções de probabilidade................................................................................................. 91 Introdução.............................................................................................................. 91 Lição nº 1 93 Conceito de probabilidade .............................................................................................. 93 Introdução.............................................................................................................. 93 Sumário ...........................................................................................................................99 Exercícios...................................................................................................................... 100 Exercícios...................................................................................................................... 103 Lição nº 2 107 Arranjos e combinações................................................................................................ 107 Introdução............................................................................................................ 107 Introdução à Estatística Ensino à Distância iii Sumário ......................................................................................................................... 117 Exercícios...................................................................................................................... 117 Feedback ....................................................................................................................... 119 Lição nº 3 122 Reunião de acontecimentos........................................................................................... 122 Introdução............................................................................................................ 122 Feedback ....................................................................................................................... 124 Feedback ....................................................................................................................... 126 Sumário ......................................................................................................................... 127 Exercícios...................................................................................................................... 127 Feedback ....................................................................................................................... 130 Lição 4 135 Probabilidade condicional. Acontecimentos independentes......................................... 135 Introdução............................................................................................................ 135 Sumário ......................................................................................................................... 140 Exercícios...................................................................................................................... 141 Feedback ....................................................................................................................... 142 Lição nº 5 145 Probabilidade total e fórmula de Bayes ........................................................................ 145 Introdução............................................................................................................ 145 Feedback ....................................................................................................................... 146 Sumário ......................................................................................................................... 150 Exercícios...................................................................................................................... 150 Feedback ....................................................................................................................... 152 Unidade 3 158 Distribuição normal ...................................................................................................... 158 Introdução............................................................................................................ 158 Lição nº 1 159 Distribuição normal. Uso da tabela de distribuição normal.......................................... 159 Introdução............................................................................................................ 159 Sumário ......................................................................................................................... 165 Exercícios...................................................................................................................... 166 Feedback ....................................................................................................................... 166 Lição nº 2 169 Resolução de problemas envolvendo a distribuição normal......................................... 169 Introdução............................................................................................................ 169 iv Índice Feedback ....................................................................................................................... 170 Feedback ....................................................................................................................... 172 Sumário ......................................................................................................................... 173 Exercícios...................................................................................................................... 173 Média 175 Feedback ....................................................................................................................... 176 Unidade 4 181 Amostragem, distribuições amostrais e estimação por intervalos. ............................... 181 Introdução............................................................................................................ 181 Lição nº 1 183 Distribuição amostral e intervalos de confiança para a média da população ............... 183 Introdução............................................................................................................ 183 Sumário ......................................................................................................................... 189 Exercícios...................................................................................................................... 189 Feedback ....................................................................................................................... 190 Lição nº 2 194 Teorema do limite central ............................................................................................. 194 Introdução............................................................................................................ 194 Sumário ......................................................................................................................... 197 Exercícios...................................................................................................................... 198 Feedback ....................................................................................................................... 199 Lição nº 3 201 Determinação do tamanho da amostra.......................................................................... 201 Introdução............................................................................................................ 201 Sumário ......................................................................................................................... 202 Exercícios...................................................................................................................... 203 Feedback ....................................................................................................................... 203 Lição nº 4 205 Intervalos de confiança com a distribuição t de Student............................................... 205 Introdução............................................................................................................ 205 Sumário ......................................................................................................................... 211 Exercícios...................................................................................................................... 211 Feedback .......................................................................................................................212 Lição nº 5 215 Intervalo de confiança para proporções ........................................................................ 215 Introdução............................................................................................................ 215 Introdução à Estatística Ensino à Distância v Sumário ......................................................................................................................... 219 Exercícios...................................................................................................................... 219 Feedback ....................................................................................................................... 220 Unidade 5 223 Testes de Hipóteses....................................................................................................... 223 Introdução............................................................................................................ 223 Lição nº 1 225 Testes de hipótese para a média e proporção da população.......................................... 225 Introdução............................................................................................................ 225 Sumário ......................................................................................................................... 237 Exercícios...................................................................................................................... 238 Feedback ....................................................................................................................... 240 Lição nº 2 247 Teste de hipótese para diferença de médias. O caso de amostras independentes. ........ 247 Introdução............................................................................................................ 247 Sumário ......................................................................................................................... 251 Exercícios...................................................................................................................... 251 Feedback ....................................................................................................................... 254 Lição nº 3 263 Teste de hipótese para diferença de médias. Caso de amostras emparelhadas. ............ 263 Introdução............................................................................................................ 263 Sumário ......................................................................................................................... 268 Exercícios...................................................................................................................... 268 Feedback ....................................................................................................................... 270 Unidade 6 274 O teste de independência do Qui-quadrado.................................................................. 274 Introdução............................................................................................................ 274 Lição nº 1 275 Teste de independência do Qui-quadrado. ................................................................... 275 Introdução............................................................................................................ 275 vi Índice Feedback ....................................................................................................................... 280 Sumário ......................................................................................................................... 282 Exercícios...................................................................................................................... 282 Feedback ....................................................................................................................... 284 Anexos 290 Técnicas de Amostragem.............................................................................................. 290 Tabela da Distribuição Normal Padrão 295 P(Z<z) (área à esquerda do valor de Z indicado) 295 Bibliografia ................................................................................................................... 303 Introdução à Estatística Ensino à Distância 1 Visão geral Bem-Vindo ao Módulo de Introdução à Estatística O módulo de Introdução à Estatística apresenta uma visão geral dos conteúdos de estatística. Na unidade 1, estatística descritiva, vamos discutir os conceitos chave da disciplina, que serão frequentemente tratados ao longo do Manual. Discutiremos igualmente como fazer sumários de dados. A tabela de frequência, os gráficos e o cálculo de medidas estatísticas são tratados neste capítulo. Nas unidades 2, 3 e 4 iremos abordar alguns conceitos de probabilidade como alicerces da inferência estatística tratada nas unidades 5 e 6. Espero que você nos acompanhe ao longo de todo o módulo. Objectivos do Módulo Ao terminar o estudo do módulo de Introdução à Estatística você será capaz de: Objectivos Recolher, organizar, sumarizar e interpretar dados referentes a diversas variáveis através de tabelas de distribuição de frequências, representação gráfica e medidas estatísticas. Reconhecer e interpretar curvas de distribuição normal, student e qui-quadrado; Inferir sobre aspectos relacionados com variáveis, utilizando intervalos de confidência; Desenvolver capacidades de trabalhar em equipas realizando pesquisas de opinião que envolvam a definição da amostra, a elaboração de questionário, o processamento, a análise de dados e a elaboração de relatórios sobre os resultados. Quem deve estudar este Módulo? Este Módulo destina-se à formação de professores em exercício que possuem a 12a classe ou equivalente e inscritos no Curso à Distância, fornecido pela Universidade Pedagógica. 2 Visão geral Como está estruturado este Módulo? Todos os módulos dos cursos produzidos pela Universidade Pedagógica encontram-se estruturados da seguinte maneira: Páginas introdutórias Um índice completo. Uma visão geral detalhada do curso / módulo, resumindo os aspectos-chave que você precisa conhecer para completar o estudo. Recomendamos vivamente que leia esta secção com atenção antes de começar o seu estudo. Conteúdo do curso / módulo O curso está estruturado em unidades. Cada unidade incluirá uma introdução, objectivos, conteúdo, incluindo actividades de aprendizagem, um sumário e uma ou mais actividades para auto- avaliação. Outros recursos Se você está interessado em aprender mais, preste atenção a lista de recursos adicionais para e explore-os. Estes recursos podem incluir livros, artigos ou sites na Internet. Tarefas de avaliação e/ou Auto-avaliação As tarefas de avaliação para este módulo encontram-se no final de cada unidade. Sempre que necessário, dão-se folhas individuais para desenvolver as tarefas, assim como instruções para as completar. Estes elementos encontram-se no final do modulo. Comentários e sugestões Esta é a sua oportunidade para nos dar sugestões e fazer comentários sobre a estrutura e o conteúdo do módulo. Os seus comentários serão úteis para nos ajudar a avaliar e melhorar este módulo. Ícones de actividade Ao longo deste manual irá encontrar uma série de ícones nas margens das folhas. Estes ícones servem para identificar diferentes partes do processo de aprendizagem. Podem indicar uma parcela específica de texto, uma nova actividade ou tarefa, uma mudança de actividade, etc. Introdução à Estatística Ensino à Distância 3 Acerca dos ícones Os ícones usados neste manual são símbolos africanos, conhecidos por adrinka. Estes símbolos têm origem no povo Ashante de África Ocidental, datam do século 17 e ainda se usam hoje em dia. Os ícones incluídos neste manual são... (ícones a ser enviados - paraefeitos de testagem deste modelo, reproduziram-se os ícones adrinka, mas foi-lhes dada uma sombra amarela para os distinguir dos originais). Pode ver o conjunto completo de ícones deste manual já a seguir, cada um com uma descrição do seu significado e da forma como nós interpretámos esse significado para representar as várias actividades ao longo deste módulo. Comprometimento/ perseverança Actividade Resistência, perseverança Auto-avaliação “Qualidade do trabalho” (excelência/ autenticidade) Avaliação / Teste “Aprender através da experiência” Exemplo / Estudo de caso Paz/harmonia Debate Unidade/relações humanas Actividade de grupo Vigilância / preocupação Tome Nota! “Eu mudo ou transformo a minha vida” Objectivos [Ajuda-me] deixa- me ajudar-te” Leitura “Pronto a enfrentar as vicissitudes da vida” (fortitude / preparação) Reflexão “Nó da sabedoria” Terminologia Apoio / encorajamento Dica 4 Visão geral Habilidades de estudo Caro estudante! Para frequentar com sucesso este módulo recomendamo-lo a programar sessões de estudo diárias que podem variar de 1 hora 30 minutos a 2 horas de tempo. Não o aconselhamos a estudar mais do que duas horas porque o entusiasmo em querer completar o estudo pode frustrar-lhe. Realize com calma as tarefas propostas. É mais frutífero que estude continuamente durante curto tempo do que estudos semanais de longa duração. Estude as suas lições de preferência nas primeiras horas da manhã. Procure um lugar tranquilo, na sua casa, numa sala de uma escola perto da sua casa, ou outro lugar que disponha de espaço e iluminação apropriados. Tente estudar uma lição por dia! Adquira já um caderno de exercícios e uma calculadora científica, materiais indispensáveis para o acompanhamento do módulo. Todas as actividades propostas ao longo do manual incluindo as de auto avaliação deverão ser resolvidas no caderno de exercícios. Por fim, tente resolver todos os exemplos outra vez como forma de acompanhar adequadamente as lições. Passe para os exercícios quando tiver a certeza que entendeu o conteúdo e os procedimentos para a sua resolução. Programe devidamente o seu tempo para que o estudo seja uma experiência gratificante e excitante. Desejamos-lhe muitos sucessos! Introdução à Estatística Ensino à Distância 5 Precisa de apoio? Dúvidas e problemas são comuns ao longo de qualquer estudo. Em caso de dúvida numa matéria tente consultar os manuais sugeridos no fim da lição e disponíveis nos centros de ensino a distância (EAD) mais próximos. Se tiver dúvidas na resolução de algum exercício, procure estudar os exemplos semelhantes apresentados no manual. Se a dúvida persistir, consulte a orientação que aperece no fim dos exercícios. Se a dúvida persistir, veja a resolução do exercício. Sempre que julgar pertinente, pode consultar o tutor que está à sua disposição no centro de EAD mais próximo. Não se esqueça de consultar também colegas da escola que tenham feito a cadeira de Introdução à Estatística, vizinhos e até estudantes de universidades que vivam na sua zona e tenham ou estejam a fazer cadeiras relacionadas com estatística. Tarefas (avaliação e auto- avaliação) Ao longo deste módulo irá encontrar várias tarefas que acompanham o seu estudo. Tente sempre solucioná-las. Consulte a resolução para confrontar o seu método e a solução apresentada. Consulte manuais disponíveis e referenciados no fim de cada lição para obter mais informações acerca do conteúdo que esteja a estudar. Se usar livros de outros autores ou parte deles na elaboração de algum trabalho deverá citá- los e indicar estes livros na bibliografia. Não se esqueça que usar um conteúdo, livro ou parte do livro em algum trabalho, sem referenciá-lo é plágio e pode ser penalizado por isso. As citações e referências são uma forma de reconhecimento e respeito pelo pensamento de outros. Estamos cientes de que o estimado estudante não gostaria de ver uma ideia sua ser usada sem que fosse referenciado, não é? 6 Visão geral Avaliação A avaliação visa não só informar-nos sobre o seu desempenho nas lições, mas também estimular-lhe a rever alguns aspectos e a seguir em frente. Durante o estudo deste módulo o estudante deverá realizar 2 testes correspondentes aos seguintes conteúdos. Teste I: Unidades 1, 2 e 3 Teste II: Unidades 4, 5 e 6. O estudante deverá dirigir-se ao centro de EAD e apresentar a sua intenção de ser submetido a um teste sempre que tenha concluído com êxito as unidades acima referidas. No fim do estudo do módulo, o estudante será submetido ao exame final que em caso de ser bem sucedido, lhe confere a aprovação neste módulo. O exame será realizado nos centros de EAD mediante solicitação do estudante. Introdução à Estatística Ensino à Distância 7 Unidade 1 Estatística Descritiva Introdução Geralmente quando se faz um estudo ou se recolhe uma informação ela aparece duma maneira desorganizada e portanto sem nenhum significado. Para atribuir significado a esta informação é necessário organizá-la e resumi-la. Este é o grande propósito desta Unidade. Construir tabelas, gráficos e calcular medidas estatísticas como a média, mediana e outras. Tempo de estudo da Unidade: 17:30 Horas Esta unidade comporta 7 lições. O seu estudo deverá durar cerca de 17 horas e meia. O caderno de notas e a calculadora deverão acompanhar todo o estudo. Está pronto? Vamos começar apresentando os objectivos desta unidade. Ao completar esta unidade, você deverá ser capaz de: Objectivos Distinguir as duas partes da Estatística: estatística descritiva e indutiva; Identificar população, amostra, unidade estatística e variável num problema dado; Determinar medidas estatísticas; Construir tabelas de frequência e gráficos para representar conjuntos de dados Caracterizar a relação entre variáveis através do coeficiente de correlação. Fazer estimativas recorrendo ao modelo de regressão linear simples. 8 Unidade 1 Plano de estudo da unidade Nº da lição Tema Tempo de estudo Tempo de resolução da auto- avaliação 1 Conceitos básicos 1 hora 1 hora 2 Tabelas e gráficos 1 hora 2 horas 3 Medidas de tendência central 1 hora 1,5 hora 4 Quartis e percentis 1 hora 1 hora 5 Medidas de dispersão 1 hora 2 horas 6 Medidas de associação entre duas variáves: covariância e coeficiente de correlação 1 hora 2 horas 7 Regressão linear simples 1 hora 1 hora Introdução à Estatística Ensino à Distância 9 Lição nº 1 Estatística: Conceitos Básicos Introdução Expressões como não se vai à machamba sem enxada ou não se vai à guerra sem arma são bastante comuns nas conversas do dia a dia. Elas procuram chamar atenção para algo muito básico para certa acção mas que foi esquecido. Nesta lição, apresentam-se os conceitos básicos da estatística, conceitos esses que lhe acompanharão até ao fim deste módulo, e sem a compreensão dos quais o estimado estudante poderá considerar-se até certo ponto, “um agricultor sem enxada”. Tempo de estudo da lição: 01:00 Hora Esta lição deverá ser estudada em aproximadamente 2 horas, sendo 1 para a parte da auto-avaliação. Ao completar a lição nº 1 sobre conceitos básicos de Estatística, você será capaz de: Objectivos Distinguir estatística descritiva de inferência estatística; Distinguir população de amostra; Identificar a população, a amostra, a unidade estatística e a variável em estudo numa situação (problema) dada; Distinguir os tipos de variáveis; Dado um problema, identificar a variável em estudo e classificá-la. 10 Lição nº 1 Terminologia Estatística, EstatísticaDescritiva e Inferência Estatística, População e Amostra, Amostra Representativa, Variável, Variável Quantitativa e Qualitativa, Variável Nominal e Ordinal, Variável Contínua e Discreta. O que pensa sobre o que poderá ser a estatística? Pense e leia cuidadosamente o texto que se segue para confirmar as suas hipóteses. Estatística Etimologicamente, a palavra estatística vem do latim STATUS, que significa ESTADO, uma vez que na antiguidade, tal como hoje, o Estado fazia levantamentos para obter informações sobre a população disponível para pagar impostos, a idade dos jovens para irem para a guerra, etc. Hoje a Estatística serve não só ao Estado, mas a todas as áreas. O político pode recorrer à estatística para avaliar a possibilidade de vencer a eleição que se avizinha. O economista usa informação sobre a procura e a oferta de produtos, taxas de desemprego e outras, para calcular ou prever a inflação. Na saúde, dados sobre o estado de saúde de cidadãos são continuamente recolhidos e analisados e a partir deles são evitados alastramentos de epidemias. No campo da técnica vários componentes (por exemplo lâmpadas, transístores) são fabricados e testados para determinar o seu tempo de vida e definir planos de garantia aos consumidores. Debate Procure discutir com um ou dois colegas do curso, a aplicação da estatística na Física. Encontrem no mínimo 5 exemplos. A estatística é uma ciência ou método que se ocupa da recolha, organização e análise de dados. Introdução à Estatística Ensino à Distância 11 Distinguem-se as seguintes fases do método estatístico: 1. Identificação do problema e da população correspondente; 2. Recolha de dados. 3. Análise de dados e apresentação de resultados. Estatística Descritiva e Inferência Estatística A maioria das informações estatísticas nos jornais, relatórios e outras publicações consiste de dados reunidos e apresentados de forma clara para que o leitor possa entender. Tais sumários, que podem ser tabelas, gráficos ou medidas estatísticas são conhecidos como estatísticas descritivas. Nome Hora de Chegada Nome Hora de Chegad a Armindo 7:00 Isildo 8:30 Belmira 8:30 Janete 8:30 Célia 9:00 Laura 8:00 Carlos 8:00 Lucas 8:00 Dionísio 7:30 Mateus 7:30 Domingos 7:30 Mário 8:30 Elsa 8:30 Paula 7:00 Elisabeth 8:30 Rita 9:00 Flórido 7:30 Rui 8:30 Herinques 7:00 Zeca 8:00 Tabela 1. Hora de entrada dos funcionários da agência. A Estatística descritiva é a parte responsável pela sumarização de dados 12 Lição nº 1 Considere os dados sobre a hora de chegada dos funcionários de uma agência de viagens apresentados na tabela 1. Facilmente pode-se tecer algumas considerações sobre a hora de chegada dos funcionários da agência recorrendo ao gráfico apresentado na figura 1. Pode-se ver, por exemplo que a hora de chegada dos funcionários varia entre 7 a 9 horas, sendo 8:30 a hora em que uma boa parte dos funcionários chega ao trabalho. É este o papel da estatística descritiva: fazer sumários de dados. 0 2 4 6 8 7:00 7:30 8:00 8:30 9:00 Hora de chegada Nú m er o de fu nc io ná rio s Fig 1- Gráfico de barras da hora de chegada dos funcionários da agência de viagens. Em estatística, chama-se população ao conjunto de elementos (indivíduos) com alguma característica comum e com interesse para o estudo. Exemplo 1 É população, o conjunto dos eleitores no nosso país, as contas bancárias de um banco, os carros que circulam numa determinada cidade, o gado bovino existente na província de Gaza, os multímetros que o laboratório de física possui, etc. População Introdução à Estatística Ensino à Distância 13 Para conhecer de forma completa uma população é necessário analisar todos os seus elementos, isto é, realizar um censo. Exceptuando casos em que a população tem dimensão modesta e é acessível, raramente é possível analisar todos os elementos da população por não se dispor de orçamento, de tempo, e até algumas vezes por a observação ser destrutiva. Neste caso o estudo das características da população é feito sobre um subconjunto da população que se chama Amostra. Os resultados da amostra são depois usados para fazer estimativas sobre as características da população. Este processo é chamado de inferência estatística. A inferência estatística, ou estatística indutiva trata de técnicas que permitem tirar conclusões ou tomar decisões sobre uma população a partir de evidências apresentadas pelos dados numéricos relativos à população, ou a uma amostra dela extraída. O sucesso do estudo baseado na amostra depende grandemente da escolha desta. Uma amostra mal escolhida pode conduzir a conclusões erradas. De um modo geral, na escolha de uma amostra deve-se ter em conta os seguintes aspectos: − Imparcialidade: Todos os elementos da população têm a mesma oportunidade de fazer parte da amostra; − Representatividade: A amostra deve conter qualitativamente todas as características que a população possui. − Tamanho: Deve ser suficientemente larga de modo que as características da amostra se aproximem das características da população. Em muitos estudos estatísticos usam-se amostras aleatórias. Variável Num estudo, parte-se de um conjunto a que se denomina população. Cada elemento desse conjunto (unidade estatística) tem provavelmente muitas características. Dependendo do objectivo do estudo, centra-se numa ou em mais características deste. A essas características chamam-se variáveis do estudo. Amostra é um subconjunto ou uma parte da população. Inferência estatística ou estatística indutiva 14 Lição nº 1 Exemplo 2 Por exemplo no conjunto dos alunos de uma turma podem-se observar muitas variáveis como: altura, cor dos olhos, última nota a matemática, distância de casa à escola, nível social do aluno, número de irmãos, sexo, etc. As variáveis observadas podem ser qualitativas (atributos ou nomes) ou quantitativas (que indicam quantidade de alguma coisa). Por exemplo, das variáveis acima, são qualitativas; o sexo, a cor dos olhos, e o nível social do aluno. São quantitativas, a altura, a idade, a última nota a Matemática, a distância casa-escola e o número de irmãos. As variáveis qualitativas podem estar numa escala nominal (se não é possível ordenar as diversas modalidades) ou ordinal (se há uma possibilidade de ordenamento das diversas modalidades que a variável toma). Das variáveis consideradas no exemplo 2, são qualitativas nominais, o sexo e a cor dos olhos. O social é um exemplo de uma variável qualitativa ordinal. Dependendo dos valores que as variáveis quantitativas tomam, estas classificam-se em contínuas (quando podem assumir qualquer valor dentro de um intervalo considerado) ou discretas (quando só assumem alguns valores dentro de um intervalo considerado). A idade e o número de irmãos são exemplos de variáveis discretas enquanto a distância casa - escola é uma variável contínua. É hora de descontrair-se um pouco mudando de actividade. Pense agora num conjunto de variáveis relacionadas com o seu dia a dia e resolva a tarefa seguinte. Reflexão Indique duas variáveis que sejam: a) Quantitativas b) Qualitativas c) Discretas d) Contínuas e) Nominais f) Ordinais Introdução à Estatística Ensino à Distância 15 Veja a seguir o sumário das partes mais relevantes da lição! Sumário A estatística é uma ciência ou método que trata da recolha, organização e análise de dados. Ela divide-se em duas partes: Estatística descritiva e indutiva. A estatística descritiva faz o resumo de dados, enquanto a indutiva procura caracterizar a população a partir de resultados da amostra. População, em estatística, designa um conjunto de indivíduos com pelo menos uma característica comum. Amostraé um subconjunto da população. Fig 2- Diferença entre estatística descritiva e inferência estatística 16 Lição nº 1 Variável Qualitativa Quantitativa Nominal Ordinal Discreta contínua Fig 3- Esquema dos tipos de variável Preparado para a prática! Se não, repita os aspectos que acha que não foram suficientemente apreendidos. Pode usar os livros que se apresentam no final da lição para a revisão. Agora apresentamos-lhe uma sequência de exercícios para consolidar a sua aprendizagem. Resolva-os cuidadosamente, voltando para os conceitos e exemplos apresentados sempre que achar necessário. Por favor, não consulte agora a resolução dos mesmos. O tempo necessário é de aproximadamente 2 horas. Não se esqueça do seu caderno de exercícios. Exercícios Auto-avaliação nº 1 1. Diferencie os seguintes conceitos: a) Estatística descritiva de inferência estatística. b) População de amostra. 2. Pretende-se fazer um estudo sobre o número de membros do agregado familiar, numa cidade. Para isso, efectuou-se um inquérito ao qual responderam 50 famílias. Introdução à Estatística Ensino à Distância 17 Tempo de realização: Uma Hora. Os resultados foram: 3 2 5 3 4 6 5 3 2 8 6 2 4 5 1 7 4 3 2 3 3 4 6 7 6 8 8 9 7 9 6 3 4 5 2 7 9 3 5 7 2 5 3 7 5 8 4 4 3 3. Em relação ao referido estudo, faça corresponder por meio de setas cada elemento do grupo A com um só elemento do grupo B. População Amostra Unidade Estatística Variável. Tipo de variável 50 famílias de Tete Famílias de tete População moçambicana Agragado familiar da cidade de Tete Citadino de Tete Membros do agregado familiar, qualitativa Citadinos de Tete Número de membros do agregado familiar, quantitativa discreta 50 famílias seleccionadas Número de membros do agregado familiar, quantitativa contínua a b c d e f g h i j GRUPO BGRUPO A 3. Um levantamento arguiu 2013 estudantes: “Você acha que as experiências laboratoriais ajudam a entender facilmente as leis da física?” As categorias das respostas foram sim, não e indeciso. a) Qual foi o tamanho da amostra para essa pesquisa? b) Os dados colectados eram qualitativos ou quantitativos? c) Para um resumo dos dados para esta questão, faria mais sentido usar as médias ou as percentagens? 18 Lição nº 1 d) Dos que responderam, 28% disseram não. Quantos estudantes forneceram esta resposta? 4. Considere a sequência do seguinte estudo: 1. Define-se uma amostra dos elementos de uma população. 2. Descrevem-se as variáveis para o estudo. 3. Toma-se nota, para cada variável, do valor correspondente a cada elemento da amostra. 4. Utilizam-se diversos métodos científicos e analisam-se os dados, obtendo-se diversas estatísticas. 5. Com os dados obtidos na amostra prevê-se o comportamento da população com a ajuda do cálculo das probabilidades. Qual dos passos referidos está dentro da Inferência Estatística? 5. Uma amostra de notas de cindo estudantes mostrou os seguintes resultados: 72, 65, 82, 90, 76. Qual das seguintes declarações é correcta e qual poderia ser classificada como muito generalizada? a) A nota média para a amostra dos cinco estudantes é 77. b) A nota média pata todos os estudantes que fizeram o exame é 77. c) Uma estimativa da nota média para todos os estudantes que fizeram o exame é 77. d) Mais da metade dos estudantes que fizeram este exame obterão pontos entre 70 e 85. 6. Classifique cada uma das seguintes variáveis em qualitativa nominal, qualitativa ordinal, quantitativa discreta e quantitativa contínua: (a) Velocidade de um automóvel, (b) Marca de automóvel, (c) classe social, (d) distância casa-escola, (e) número de vezes que se repete uma experiência, (f) línguas faladas por estudantes duma turma de física, (g) altura atingida por um projéctil, (h) número de casos de sida diagnosticados diariamente. Introdução à Estatística Ensino à Distância 19 Que tal, alguma dúvida! Faça uma leitura da parte teórica e dos exemplos mais uma vez. Tente resolver e compare com a resolução. Feedback Resolução das Actividades de Avaliação 1 1. Aspectos a realçar: a) A Estatística descritiva sumariza dados, enquanto a inferência tenta validar as conclusões da amostra para a população. b) População é o conjunto de indivíduos com pelo menos uma característica em comum enquanto a amostra é uma parte da população. 2. População - famílias da cidade de Tete. Amostra - 50 famílias da cidade de Tete. Unidade Estatística - agregado familiar da cidade de Tete Variável: Tipo de variável - número de membros do agregado familiar, quantitativa discreta. 3. a) 2013. b) Qualitativos. c) Percentagens. d) 5642013 100 282013%28 =×=de Indivíduos. 4. Passo nº 5. 5. Correcta: a) Muito generalizada: c) 20 Lição nº 1 6. Qualitativa nominal b); f) Qualitativa ordinal c) Quantitativa discreta e); h) Quantitativa contínua a); d); g) Esperamos que tenha resolvido com sucesso esta actividade. Para leitura adicional do assunto desta lição, consulte os seguintes manuais: Leitura − ANDERSON, D. R. Estatística aplicada è Administração e economia. São Paulo: Thomson leaning. 2003 − LEVIN, Jack at al. Estatística para ciências Humanas. São Paulo: 9ª edição, Editora Pearson. 2004 Introdução à Estatística Ensino à Distância 21 Lição nº 2 Tabelas e gráficos Introdução Mais uma lição ou menos uma lição?! As duas coisas. Bem-vindo mais uma vez. Espero que esteja bem disposto a aprender mais esta lição. Vamos a isso! Jornais e revistas recorrem frequentemente a tabelas e gráficos para apresentar diversos tipos de informação. São formas de sumarização simples e com muito potencial. Um gráfico ou uma tabela bem construída podem poupar-nos muitas linhas ou até mesmo páginas de explicação. Nesta lição apresentamos as tabelas e gráficos mais usados no âmbito da estatística descritiva. Tempo de estudo da lição: 01:00 Hora Esta lição deverá ser estudada em aproximadamente 1 horas. Ao completar esta lição, você será capaz de: Objectivos Construir e interpretar tabelas de frequência, gráfico de barras, gráfico circular, histograma e polígono de frequência. Diferenciar os vários tipos de frequências e de gráficos. 22 Lição nº 2 Terminologia Frequência, frequência absoluta e relativa, frequência absoluta acumulada e relativa acumulada, gráfico de barras, gráfico circular, histograma, polígono de frequência. Depois de uma lição muito teórica, mas bastante importante para a compreensão de todo o módulo, estamos a entrar pouco a pouco para os cálculos. Prepare o seu caderno de notas, a sua régua e a sua calculadora para mais um percurso no seu módulo de estatística. Não se esqueça que Estamos Juntos! Esta lição deverá ser estudada em aproximadamente 3 horas, sendo 2 para a parte da auto-avaliação. Tabela de frequência Já foi referido anteriormente que a estatística descritiva recorre à tabelas para fazer sumários de dados. Um tipo de tabela comum é a chamada de tabela de distribuição de frequências ou simplesmente tabela de frequência. Ilustra-se, por meio de um exemplo, como construir uma tabela de frequência de dados simples (não agrupados em classes). Os seguintes dados representam a idade dos alunos duma turma da 12ª classe: 19, 19, 19, 18, 17, 20, 20, 19, 21, 19, 17, 18, 20, 18, 18, 23, 21, 18, 19, 20. Pouco ou nada se pode dizer em relação a idade dos alunos da turma com os dados dispostos desta maneira. Coloque os dados numa tabela em que consideramos por um lado o valor observado ( ix ) e por outro,o número de vezes que cada valor aparece repetido, também designado por frequência absoluta: Frequência absoluta Introdução à Estatística Ensino à Distância 23 Tabela 2: Frequência absoluta da idade dos alunos ix if 17 2 18 5 19 6 20 4 21 2 23 1 Total 20 A frequência absoluta só toma um significado mais efectivo se considerar o número total das observações (tamanho da amostra). Para entender facilmente esta questão, suponha que um colega lhe informe durante uma conversa que numa certa turma cinco alunos reprovaram num determinado exame. Parece-lhe por enquanto uma situação normal. Mas ele depois acrescenta: a turma era de 6 alunos apenas! A informação toma outro significado e é mais completa. Por essa razão é útil acrescentar a frequência relativa. ix if rf (%) 17 2 %101001,020 2 =×= 18 5 25 19 6 30 20 4 20 21 2 10 23 1 5 Total 20 100 Tabela 3: Tabela de frequência absolutarelativa da idade dos alunos Frequência relativa 24 Lição nº 2 rf Frequência relativa if Frequência absoluta n Tamanho da amostra Para além das frequências absoluta e relativa, pode-se apresentar as frequências absolutas acumuladas ( iF ) e relativas acumuladas ( rF ) que são as frequências considerando valores menores ou iguais ao observado: Tabela 4: tabela de frequências da idade dos alunos. ix if rf (%) iF rF (%) 17 2 %101001,020 2 =×= 2 %1010010,020 2 =×= 18 5 25 2 + 5 =7 %3510035,020 7 =×= 19 6 30 13 65 20 4 20 17 85 21 2 10 19 95 23 1 5 20 100 Total 20 100 - - Atenção à construção do gráfico de barras. Gráfico de barras O gráfico de barras constrói-se colocando no eixo horizontal (eixo das abcissas) os valores observados e no eixo vertical (eixo das ordenadas) a frequência absoluta ou relativa correspondente. Note que quanto maior for a frequência de uma observação, maior será também a altura da barra correspondente. n ff ir = (1.1) Introdução à Estatística Ensino à Distância 25 Gráfico de barras 0 1 2 3 4 5 6 7 17 18 19 20 21 23 Idade Fr eq . a bs ol ut a Figura 4: Gráfico de barras Gráfico circular Actividade 1 Tempo de realização: 30 minutos. O gráfico circular seguinte mostra a percepção de um grupo de empresas moçambicanas, em relação ao comportamento das taxas de juros no II trimestre de 2006. Indique as categorias que foram indicadas como mais e menos prováveis respectivamente. Justifique a sua resposta. Redução Sem mudança Subida Subida acentuada Fig 5: Percepção (em percentagem) em relação às taxas de juro no II trimestre de 2006, segundo dados da pesquisa sobre o índice de ambiente de negócios em Moçambique, realizada pela KPMG nos meses de Maio e Junho de 2006. Como construir um gráfico circular usando os dados da tabela 2? 26 Lição nº 2 Dica Sabes qual é o ângulo que uma circunferência representa e qual a medida desse ângulo? O que tem a fazer é determinar que parte do círculo representa cada uma das frequências de idade. Para o caso de 17 anos a frequência é 2. Usando a regra três simples segue: 20 (total) ― 360º (total) 2 ― x Donde se conclui que o o 36 20 3602 = × =x Com ajuda dum compasso, trace uma circunferência de raio à sua escolha (Por exemplo 5 cm). Una em seguida o centro da circunferência à curva, obtendo deste modo o raio. Partindo deste raio meça 36º, com a ajuda de um transferidor. Separe esta porção por meio de um raio. Esta é a parte do gráfico que representa os alunos com 17 anos. De maneira semelhante, determine a medida da parte correspondente aos alunos com 18anos, e, represente-a no círculo, de tal forma que as duas porções sejam adjacentes. Continue desta forma até completar o gráfico. 18 anos 19 anos 20 anos 21 anos 23 anos 17 anos 17 anos 18 anos 19 anos 20 anos 21 anos 23 anos Fig 6: Gráfico circular da idade dos alunos. Histograma e polígono de frequência Em certos casos, quando se dispõe de um conjunto de dados com muitas variações (geralmente variáveis contínuas) é vantajoso fazer-se a Introdução à Estatística Ensino à Distância 27 sumarização recorrendo ao agrupamento dos mesmos em classes de igual amplitude Considere os preços de venda de 90 casas praticados por uma agência imobiliária nos últimos 6 meses. Os dados constam na tabela seguinte: Preços (em milhares de dólares) Nº de casas 0 – 25 11 25 – 50 15 50 – 75 38 75– 100 14 100 – 125 8 125 – 150 3 150 – 175 1 Tabela 5: Preços de venda de casas praticados por uma agência imobiliária nos últimos 6 meses. Nota: Convenciona-se que, por exemplo, o intervalo 0 – 25 = [0; 25[ Em casos em que não aparecem previamente as classes, o primeiro passo na construção da tabela de frequência com dados agrupados em intervalos de classes é a determinação do número de classes. Há várias regras que ajudam a determinar o número de classes (k). Uma regra (que no caso de as classes terem igual amplitude, conduz a resultados satisfatórios) é, considerar 5 classes, para n ≤ 25 e k ≈ n para k > 25. Esta regra tem carácter meramente indicativo, devendo ser tomadas em conta as vantagens de ordem prática que advêm da definição de classes. 28 Lição nº 2 Histograma O histograma considera, por um lado, os valores observados em classes e por outro, as frequências absolutas ou relativas de cada classe. A particularidade deste reside no facto de as barras serem adjacentes, ao contrário do gráfico de barras. 0 25 50 75 100 125 150 175 ix 5 10 15 20 25 30 if 35 40 Fig 7: Histograma dos preços da agência imobiliária. Usando no eixo das abcissas as classes e no eixo das ordenadas as frequências acumuladas, obtemos a ogiva. Polígono de frequência Acompanhe a actividade seguinte, que lhe ajudará a construir um polígono de frequência. Não desanime, a lição está quase no fim! Introdução à Estatística Ensino à Distância 29 Actividade 2 Tempo de realização : 10 minutos. Assinale no histograma acima, os pontos médios das barras. Veja o exemplo abaixo. 0 25 Considere mais duas classes adicionais uma de 025−− e outra 200175 − , ambas com frequência zero, e assinale nestas também o seu ponto médio. Una os pontos médios das barras. O polígono obtido chama-se polígono de frequências. Dica Observe uma simulação do resultado final que obterá: 0 25 50 75 100 125 150 175 ix 5 10 15 20 25 30 if 35 40 30 Lição nº 2 Sumário As tabelas e os gráficos são formas de resumir dados. A tabela mais comummente usada é a tabela de frequência. Além da tabela de frequência, pode-se construir gráficos de barras, circular, histogramas, polígono de frequência e ogiva. Um gráfico pode substituir 1000 palavras! Seguem-se os exercícios para consolidar a lição. Resolva-os com atenção. Use os manuais de apoio e a resolução. Caso tenha algum, problema volte a rever a lição. Exercícios Auto-avaliação nº 2 1. Um inquérito realizado para um supermercado classificou os seus clientes segundo a frequência com que o visitam e segundo a frequência com que compram produtos de limpeza. FREQUÊNCIA DE COMPRA DE PRODUTOS DE LIMPEZA Sempre Algumas Vezes Nunca Frequente 12 48 19 FREQUÊNCIA DE VISITA Não Frequente 7 6 8 Tabela 6: Frequência de visita e de compra dos clientes dum supermercado a) Quantos indivíduos visitam frequentemente o supermercado? b) Quantos indivíduos visitam frequentemente o supermercado e compram produtos de limpeza? Introdução à Estatística Ensino à Distância 31 Tempo de realização 02:00 horas. c) Qual é a percentagem de indivíduos que não visitam o supermercado frequentemente e compram produtos de limpeza? d) Qualé a percentagem dos que compram sempre produtos de limpeza, no conjunto dos que visitam frequentemente o supermercado? 2. O gráfico abaixo mostra a distribuição das massas disponíveis no laboratório de Física. 14 20 32 22 10 2 0 5 10 15 20 25 30 35 fr 1g 2g 5g 10g 20g 50g massas Fig 8: Gráfico de barras da distribuição das massas existentes no laboratório de física. Com base no gráfico acima, assinale com V (verdadeiro) e F (falso) às afirmações seguintes: a) A maior parte das massas que existem no laboratório tem 5g. b) As massas disponíveis variam de 2 a 32g. c) A massa que existe com maior frequência é a de 5g. d) 50% das massas são de pelo menos 5g. e) No máximo 25% das massas existentes são de 5g. f) No total existem 100 unidades de massas no laboratório. g) Se existem 4 unidades de 2g, então pode-se concluir que há no total 20 unidades no laboratório. 32 Lição nº 2 3. Observe o gráfico que mostra as 5 empresas com maior volume de negócios no sector de alimentos em 2005, segundo a KPMG. % de volume de negócios das 5 melhores empresas no ramo de alimentação e bebidas 44% 26% 22% 7% 1% Cervejas de Moçambique, SARL Companhia Industrial da Matola, SARL Coca-Cola Sabco (Moçambique), SARL Águas de Moçambique, SARL S.E.Ginwala & Filhos, Lda Fig 9: Gráfico circular das 5 empresas com maior volume de negócios. Em relação ao gráfico indique: a) A empresa com maior volume de negócios. b) A empresa com menor volume de negócios. c) A percentagem correspondente às duas empresas com maiores volumes de negócios. d) O volume de negócios das Águas de Moçambique, sabendo que as cinco empresas totalizaram o valor de 5964674000 Meticais. 4. Considere as distribuições do tipo de combustível doméstico usado em 2 cidades, em 1988: Tabela 7: Uso de combustível doméstico em duas cidade Número de Residências Tipo de Combustível Cidade A Cidade B Gás 67450 31800 Electricidade 23800 3450 Outros 6450 3850 Introdução à Estatística Ensino à Distância 33 a) Justifique a proposição: "De forma relativa, a cidade B usa mais gás que a cidade A". b) Qual dos dois tipos de gráfico é adequado para comparar o consumo de combustível nas duas cidades? Justifique a sua resposta. i) Gráfico de barras ii) Gráfico circular. 5. As classificações obtidas, no 1º semestre deste ano pelos 150 alunos do 2º ano de uma escola, na disciplina de Física distribuem-se da seguinte forma: Classificações: 7 8 9 10 11 12 13 14 15 16 17 No de alunos: 5 11 14 9 20 30 18 9 12 8 4 a) Indique a população e a variável estatística em estudo. b) Calcule a frequência relativa da classificação 8. 6. A tabela abaixo resume a tendência de voto dos 100 membros associados, na eleição do presidente do clube. Tabela 8: Tendência de voto dos membros dum clube Categorias Nº de respostas Candidato A 5 Candidato B 20 Candidato C 30 Candidato D 25 Indeciso 10 Votos em branco 10 34 Lição nº 2 a. Classifique a variável em estudo. Justifique. b. Construa um gráfico circular para a distribuição das respostas dos sócios. c. Construa um gráfico circular a partir da frequência relativa considerando apenas as respostas dos quatro candidatos (total - 80). d. Qual dos dois gráficos na sua opinião mostra-se útil para sustentar a hipótese de que o candidato C tem maiore possibilidades de vencer a eleição? 7. Realizou-se uma experiência com cabos fabricados para determinar a carga máxima por eles suportada, e obtiveram-se os seguintes resultados: 4,3 6,8 9,2 7,2 8,7 8,6 6,6 5,2 8,1 8,7 7,4 4,6 4,2 7,6 6,8 7,7 8,4 7,5 8,6 6,0 7,7 8,1 7,0 8,2 8,3 8,8 6,7 8,1 9,4 7,7 6,3 7,7 9,1 7,8 7,9 7,9 9,4 8,2 6,7 8,2 a) Construa uma tabela de frequência absoluta, agrupando os dados em seis classes. (sugestão: Determine a amplitude total (A) subtraindo o valor mínimo observado ( minX ) do máximo ( )máxX , em seguida determine a amplitude de classe (a), dividindo a amplitude total pelo número de classes propostas). b) Represente graficamente os dados (histograma e polígonos de frequências), tomando por base a tabela construída na alínea a). Introdução à Estatística Ensino à Distância 35 Feedback Resolução dos exercícios de auto-avaliação 1. a) 79194812 =++ . b) 604812 =+ c) %60%100 867194812 60 =× +++++ d) %2,15%100 79 12%100 194812 12 =×=× ++ 2. a) F b) F c) V d) V e) F f) F g) V 3. a) Cervejas de Moçambique. b) S.E. Ginwala & Filhos, Lda. c) %70%44%26 =+ . d) 5964674000 100 75964674000%7 ×=de = 417527180 Meticais. 4. a) Verdadeira, pois em relação ao gás a frequência relativa para a cidade A é menor %0,69%100 64502380067450 67450 =× ++ que a frequência relativa da cidade B que é de %.3,81 3850345031800 31800 = ++ b)O gráfico circular é mais adequado uma vez que a porção· ocupada por cada um dos combustíveis é relativa ao total· do consumo em cada cidade. 36 Lição nº 2 5. a)População: Alunos do segundo ano de uma escola. Variável em estudo: classificações dos alunos do 2º ano· na disciplina de Física. b) %3,7%100 150 11 =× 6. a) Qualitativa nominal (Tendência de voto). 7. a) 2,52,44,9min =−=−= XXA máx 187,0 6 2,5 →==a (Usa-se o valor 1 por questões práticas). Note por exemplo que 5,2 pertence à classe 5,2–6,2 e não à anterior. Alguma dúvida ainda: Consulte a lista de manuais que se segue: Leitura − ANDERSON, D. R; Estatística aplicada à Administração e economia; São Paulo Thomson leaning; 2003. − GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill, 1997. − TRIOLA, Mário F. Introdução à Estatística.Rio de Janeiro. Livros técnicos e científicos. 7ª edição, 1999 Classes if 4,2–5,2 3 5,2–6,2 2 6,2–7,2 7 7,2–8,2 14 8,2–9,2 11 9,2–10,2 3 Introdução à Estatística Ensino à Distância 37 Lição nº 3 Medidas de tendência central Introdução Nas duas lições anteriores discutimos os conceitos básicos da Estatística e a construção de tabelas e gráficos. Nestas próximas vamos discutir a determinação de medidas estatísticas como outra forma de sumarizar dados. Esteja atento aos aspectos mais importantes. Uma maneira conveniente de descrever um grupo como um todo é achar um número único que represente o que é médio, ou típico daquele conjunto de dados. Esse valor é chamado medida de tendência central, porque em geral, ele está localizado mais para o meio ou centro de uma distribuição, onde a maior parte dos valores tende a concentrar-se. Aborda-se em seguida as três medidas de tendência central mais usadas: média aritmética, mediana e moda. Tempo de estudo da lição: 02:00 Hora Esta lição deverá ser estudada em aproximadamente 2 horas. Ao completar esta lição, você será capaz de: Objectivos Determinar a média, mediana e moda. 38 Lição nº 3 Terminologia Média, mediana e moda, ponto central da classe. Média aritmética ( x ) Para a aprendizagem deste tópico, siga o exemplo seguinte: Exemplo 3 Suponha que durante a quadra festiva (última semana do ano e primeira semana do novo ano), uma loja de prendas tenha registado os seguintes valores (em mil meticais) na venda dos seus produtos: 9,5 8 7 10,5 8 5 8,5 10 8 11 9 6 Qual é neste caso o valor médio (média aritmética) das vendas da loja no referido período? 375,8 12 69118105,8585,10785,9 = +++++++++++ =x mil meticais. Como facilmente pode concluir, a média aritmética determina-se somando todos os valores observados e dividindoesta soma pelo número total de observações: n fx xou n x x iii ∑∑ == , uma vez que, por exemplo, no caso da observação 8, 38888 ×=++ , onde 3 é a sua frequência absoluta. Quando os dados se apresentam agrupados em classes de igual amplitude, a determinação da média aritmética passa primeiro pela determinação de Introdução à Estatística Ensino à Distância 39 um valor que possa a caracterizar cada uma das classes - O ponto médio da classe ( ix ). A seguinte actividade, que deverá ser feita em 10 minutos, ajuda--lhe na determinação da média aritmética para dados agrupados. Actividade nº 3 Tempo de realização: 20 minutos. Complete a seguinte tabela: Densidade do solo ( 3/ cmg ) if Ponto médio da classe ( ix ) ii fx 1,00 - 1,10 5 1,05 1,10 - 1,20 7 1,20 - 1,30 8 1,30 - 1,40 4 1,40 - 1,50 2 Total 26 - Tabela 9: Densidade do solo de 30 amostras. Determine a média dividindo o total de ii fx por 26. Dica O ponto médio representa o valor no meio do intervalo da classe. Também pode ser obtido fazendo a média dos dois limites, isto é, 05,1 2 10,100;1 = + . A média é obtida dividindo por n a soma do produto ii fx . Mediana ( x~ ) Quando os dados são dispostos por ordem de tamanho, torna-se possível localizar a mediana, o ponto central da distribuição. Por isso, a mediana é encarada como uma medida de tendência central que separa o conjunto 40 Lição nº 3 de dados em duas partes aproximadamente iguais, com aproximadamente 50% dos dados. Retomando o problema discutido na introdução da média, e dispondo os dados em ordem crescente segue: 5 6 7 8 8 8 8,5 9 9,5 10 10,5 11 No centro da distribuição dos dados das vendas aparecem dois valores. Portanto a mediana será a média desses dois valores: 25,8 2 5,88~ =+=x 5 6 7 8 8 8 8,25 8,5 9 9,5 10 10,5 11 50% dos dados Mediana 50% dos dados Observe que neste caso, em que temos 12 observações a mediana resulta da soma dos dados nas posições 6 e 7. Introdução à Estatística Ensino à Distância 41 Actividade nº 4 Tempo de realização : 20 minutos. Preencha a seguinte tabela, sobre a posição dos valores a somar para determinar a mediana, no caso em que temos um número par de observações: (Não leve mais de 10 minutos). Tabela10: Determinação da posição dos valores a somar para determinação da mediana. Caso n-par. Tamanho da amostra (n) Posição dos dados a somar para obter a mediana 12 6º e 7º 10 ___ e ___ 16 ___ e ___ 20 ___ e ___ 100 ___ e ___ 112 ___ e ___ 5012 ___ e ___ n ___ e ___ Dica Procure valores hipotéticos para os primeiros 4 casos. Coloque os valores em ordem crescente e verifique a posição daqueles que estão no centro. Procure uma regularidade e prove se essa regra pode ser usada para esses casos. Por último, aplique a regra para os outros casos em que o tamanho da amostra é maior. 42 Lição nº 3 Conclui-se portanto, para casos em que n é par que a mediana é obtida colocando os dados em ordem crescente e achando a média dos dados centrais; cujas posições são 1 22 + nen O que acontece na determinação da mediana, quando o tamanho da amostra é impar? Faça a actividade 7 para descobrir. Não leve mais do que 10 minutos para a sua realização. Actividade nº 5 Tempo de realização : 20 minutos. Determine a mediana do seguinte conjunto de dados (não se esqueça de ordena-los primeiro): 14 12 7 9 12 10 15 9 11 − Qual é o valor da mediana neste caso? − Complete a seguinte tabela: Tabela 11: Determinação da posição dos valores a somar para determinação da mediana. Caso n-impar. Tamanho da amostra (n) Posição dos dados a somar para obter a mediana 11 6º 15 ___ 31 ___ 77 ___ 101 ___ 509 ___ 10103 ___ n ___ Introdução à Estatística Ensino à Distância 43 Dica Procure dados hipotéticos para os primeiros 3 casos. Observe a posição do valor central. Procure uma regra que possa ser válida para estes casos. Verifique-a. Use essa regra para os restantes casos. Concorda com a seguinte conclusão! No caso em que n é impar a mediana é o valor central depois de ordenar os dados. Neste caso a posição da mediana é 1 2 + n Moda A moda é o valor mais frequente, mais típico ou mais comum numa distribuição. Por exemplo ao afirmarmos que há mais pessoas do sexo feminino em Moçambique do que as do sexo masculino, referimo-nos ao género feminino como moda. Actividade nº 6 Tempo de realização: 05 minutos. Determine a moda para o problema apresentado no início desta lição. 44 Lição nº 3 Dica A moda é o valor mais frequente. A moda corresponde ao valor com maior frequência e não à frequência deste valor. Casos há em que não há moda ou há mais que um valor da moda. Das medidas de localização discutidas anteriormente, a média é a medida mais utilizada, embora, em certos casos, a utilização da mediana ou da moda seja preferível. • A média é muito sensível a valores extremos, isto é, valores excessivamente maiores ou menores provocam variações consideráveis ao serem incluídos ou excluídos do conjunto de dados. Outro aspecto é que o cálculo da média em dados nominais ou ordinais fornece-nos um resultado desprovido de sentido, em que em geral não indica nenhuma tendência central. É o caso por exemplo da média de uma distribuição de províncias de um país ou da cor dos olhos. • A mediana só pode ser obtida para dados quantitativos ou ordinais, mas não para dados nominais. Não se pode por exemplo, calcular a mediana do país de origem ou da filiação religiosa. • A moda revela a sua importância perante estudo de variáveis nominais, já que tanto a média como a mediana não se podem aplicar, mas esta pode ser aplicada a qualquer conjunto de dados pois exige apenas uma contagem de frequências. Introdução à Estatística Ensino à Distância 45 Sumário A média aritmética é a medida mais usada na sumarização de dados. Ela é determinada pela expressão n x x i∑= . Para dados agrupados em classes, ix não representa o valor observado, mas o ponto central da classe. A mediana mostra-se mais robusta pois não é afectada por valores extremos. A moda é a única medida de tendência central que pode ser determinada quando se está perante dados nominais. Exercícios Auto-avaliação nº 3 Tempo de realização: 01:30 Horas. 1. Seguidamente apresentam-se algumas estimativas para a velocidade da luz, determinadas por Michelson em 1882 (Statistics and Data Analysis, Siegel): 299,96 299,88 299,90 299,94 299,88 299,96 299,85 299,94 299,80 299,84 Determine as três medidas de tendência central. 2. A uma amostra de 8 estudantes vivendo em residências universitárias pediu-se que classificasse, numa escala de 1 (um) a 7 (excelente) a qualidade das refeições servidas na residência. Foram obtidos os seguintes resultados: 2, 4, 2, 3, 5, 4, 3, 2. a) Encontre a classificação média dada pela amostra. b) Calcule a mediana. 3. Num teste de automobilismo de distância e de consumo de gasolina, 13 automóveis foram testados por 300 quilómetros em estrada, nas mesmas condições de direcção na cidade e no campo. Foram registados os seguintes dados para o desempenho em milhas por galão. 46 Lição nº 3 Cidade: 16,2 16,7 15,9 14,4 13,2 15,3 16,8 16,0 16,1 15,3 15,2 15,3 16,2 Campo: 19,4 20,6 18,3 18,6 19,2 17,4 17,2 18,6 19,0 21,1 19,4 18,5 18,7 Use a média, mediana e a moda para comparar o desempenho na conduçãona cidade e no campo. 4. A tabela abaixo apresenta as notas dos 35 estudantes de uma determinada turma a Estatística: NOTAS 0 - 5 5 - 10 10 - 15 15 - 20 N° DE ESTUDANTES 4 8 18 5 Tabele 12: Notas a estatística de 35 estudantes duma turma. Determine a nota média. 5. Os 40 docentes de uma faculdade publicam em média 0,5 artigos por ano, enquanto os 10 docentes de outra faculdade publicam, em média, 3 artigos por ano. Quantos artigos publicam em média os 50 docentes? Feedback Resolução dos exercícios de Auto-avaliação nº 3 1. 895,299 10 95,2998 === ∑ n x x i Moda: 299,96; 299,88 e 299,94. 89,299 2 90,29988,299~ =+=x Introdução à Estatística Ensino à Distância 47 2. a) 125,3 8 25 === ∑ n x x i b) 3 2 33~ =+=x 3. Cidade Campo Média 15,58 18,92 Mediana 15,9 18,7 Moda 15,3 18,6 e 19,4 Os resultados levam-nos a concluir que no campo foi possível percorrer maiores distâncias que na cidade. ´4. Notas if ix ii fx 0–5 4 2,5 10 5–10 8 7,5 60 10–15 18 12,5 225 15–20 5 17,5 87,5 Total 35 - 412,5 8,11 35 5,412 ==x 5. 1 50 103405,0 = ×+× =x 48 Lição nº 3 Leitura recomendada em relação a esta lição: Leitura − ANDERSON, D. R; Estatística aplicada à Administração e economia; São Paulo Thomson leaning; 2003. − GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill, 1997. − HOGG e TANIS. Probability and Statical Inference. New Jersey. Prantice Hall, 2001 − LEVIN, Jack e FOX, James Alan. Estatística para ciências humanas.São Paulo. Pearson Prentice Hall, 9 ª edição, 2004 Introdução à Estatística Ensino à Distância 49 Lição nº 4 Quartis e percentis. Diagrama de extremos e quartis Introdução Anualmente, muitos cidadãos afluem à Universidade Pedagógica para realizar exames de admissão aos cursos por ela fornecidos. Para o ano de 2007 por exemplo, concorreram para o curso de licenciatura em ensino de Física na Delegação de Maputo, 459 candidatos para 50 vagas disponíveis. Observe que estas vagas correspondem a %11100 459 50 ≈× . E é aí onde “entram” os percentis: para determinar até que nota correspondem os melhores 11%, isto é, qual é o valor do percentil 89. Tempo de estudo da lição: 02:00 Hora Esta lição deverá ser estudada em aproximadamente 2 horas. Ao completar esta lição, você será capaz de: Objectivos Determinar e interpretar os quartis e percentis. Construir e interpretar o diagrama de extremos e quartis. 50 Lição nº 4 Terminologia Quartil e percentil. Primeiro e terceiro quartis. Diagrama de extremos e quartis. Percentis Sabe-se que a mediana divide um conjunto de dados em aproximadamente 50-50%. Um percentil fornece a informação sobre como os valores estão distribuídos ao longo do intervalo, do menor para o maior. Os percentis dividem o conjunto de dados em 100 partes aproximadamente iguais. Leitura Consideremos os dados da tabela 2.4, que mostra as notas obtidas por 210 candidatos a um emprego. Suponha que a empresa irá admitir os melhores 30% dos participantes no teste. Qual é a nota mínima a considerar? Tabela 14: Distribuição de frequência das notas dos candidatos a emprego. Encontrar a nota mínima obtida pelos melhores 30% dos candidatos equivale a retirar os primeiros 70%, ou seja, localizar o percentil 70. Nos percentis, o conjunto de dados é dividido em 100 partes iguais. Sendo assim, pode-se localizar qualquer percentil usando as frequências relativas acumuladas: Notas 8 9 10 11 12 13 14 16 17 Frequência 13 20 50 31 22 30 14 18 12 Introdução à Estatística Ensino à Distância 51 Tabela 15: Frequência absoluta e relativa acumulada das notas dos candidatos a emprego. Como 70% só são atingidos depois do valor 12 que corresponde a uma percentagem acumulada de 64,8%, o percentil 70% corresponde neste caso ao valor 13, isto é 1370 =P . É claro que em termos práticos a empresa não poderá contratar todos os candidatos com a nota 13 visto que eles perfazem %2,35%8,64%100 =− , valor maior que o desejado. ix 8 9 10 11 12 13 14 16 17 if 13 20 50 31 22 30 14 18 12 rF (%) 6,2 15,7 39,5 54,3 64,8 79,0 85,7 94,3 100,0 Uma alternativa ao procedimento apresentado anteriormente é o recurso à posição. Sabe que neste caso o total das observações (210) corresponde a 100%. Pretende-se saber a quantas observações corresponderia 70%. Usando a regra de três simples segue: 100% ––––––– 210 70% ––––––––– x o que resulta em 147 100 21070 = × =x (posição 147, pois corresponde aos primeiros 147 casos) Duma forma geral, se i representa a posição do percentil desejado, p o percentil desejado e n tamanho da amostra, temos que 100 pni = , com p = 1, 2, 3,..., 99. 52 Lição nº 4 Note que no cálculo da posição do percentil, dois casos podem ocorrer: O resultado pode ser número natural ou decimal. Se o resultado é um número natural, o percentil será a média do dado com esta posição e seguinte. Se o resultado é decimal o percentil será o dado da posição imediatamente seguinte. Assim a posição do P70 é .147 100 21070 = × =i Sendo natural P70 será dado pela média do 147°e 148°. .13 2 1313 70 = + =P Isto significa que a nota mínima a considerar é 13. Ainda considerando os dados da tabela, calculemos o percentil 91. 1,191 100 21091 = × =i . Sendo decimal, o percentil será dado pelo valor da posição seguinte, neste caso 192°. 1691 =P . Quartis Como o nome sugere, os quartis dividem a distribuição ou o conjunto de dados em 4 partes aproximadamente iguais, contendo cada uma cerca de 4 1 ou aproximadamente 25% dos dados. Note que: O primeiro quartil ( 1Q ) é igual ao percentil 25 ( 25P ); 753502 ; PQMePQ === . Sendo assim, o procedimento para o cálculo dos percentis será usado no cálculo dos quartis. Por exemplo, calculando o Q1 com os dados da tabela 9, teremos: o535,52 100 21025 →= × =i 101 =Q Introdução à Estatística Ensino à Distância 53 Diagrama de extremos e quartis (box-plot) Um diagrama que ilustra muito bem a distribuição dos dados é o diagrama de extremos e quartis. São medidas importantes para a sua construção: mediana, Q1 e Q3. Leitura Acompanhe o exemplo seguinte que mostra a construção de um diagrama de extremos e quartis com base nos dados referentes ao número de passageiros transportados pelo autocarro em cada um dos percursos efectuados durante um dia: 30 78 38 44 65 52 28 34 46 50 61 84 44 Ordenando os dados, segue-se: 28 30 34 38 44 44 46 50 52 61 65 78 84. A posição da mediana para n impar é 467 2 113 =→= + = Mei A posição do primeiro e terceiro Quartil é dada por 1075,9 4 133425,3 4 13 →=→ × =→== iei respectivamente. Então 6138 31 == QeQ 54 Lição nº 4 N. de passageiros 90 80 70 60 50 40 30 20 Figura 10: Diagrama de extremos e quartis. Principalmente na inferência estatística, o diagrama de extremos e quartis é usado na identificação de “valores estranhos”. São valores excessivamente menores ou maiores que influenciam grandemente a média. Neste caso, ao invés do valor mínimo e máximo, usa-se como limites a amplitude interquartil multiplicada por 1,5; como ilustra a figura 1.8. 60 80 45 30 35 70 50 20 85 65 25 40 75 55 90 95 25% dos dados 25% dos dados Mediana 1º Quartil 3º Quartil Valor mínimo Valor máximo Figura 11: Diagrama de extremos e quartis para a identificação de valores estranhos. Introdução à Estatística Ensino à Distância 55 1Q 3Q Me 5,1×AIQ 5,1×AIQ Dadosdos%25 Dadosdos%25 Figura 12: Esquema da construção dum diagrama de extremos e quartis, identificando valores estranhos. Sumário Quartis e percentis são medidas usadas
Compartilhar