Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estaística Educacional Ensino Básico Ensino à Distância Universidade Pedagógica Rua Comandante Augusto Cardoso nº135 Error! Use the Home tab to apply Guide Title to the text that you want to appear here.: 1 ( Page 126 ) Lastupdated/Issuedon02 Setembro 2014 Direitos de autor (copyright) Este módulo não pode ser reproduzido para fins comerciais. Caso haja necessidade de reproduçãodeverá ser mantida a referência à Universidade Pedagógica e aos seus Autores Universidade Pedagógica Rua Comandante Augusto Cardoso, nº 135 Telefone: 21-320860/2 Telefone: 21 – 306720 Fax: +258 21-322113 Agradecimentos À COMMONWEALTH of LEARNING (COL) pela disponibilização do Template usado na produção dos Módulos. Ao Instituto Nacional de Educação a Distância (INED) pela orientação e apoio prestados. Ao Magnífico Reitor, Directores de Faculdade e Chefes de Departamento pelo apoio prestado em todo o processo. Gostaria de agradecer a colaboração dos seguintes indivíduos e instituições na elaboração deste manual: Ficha Técnica Autor: Macie, Jonatane Matias & Manhique, Célia Mateus Desenho instrucional: Revisão Linguística: Maquetização: Ilustração: Contacto: 846185571 Índice Visão geral 8 Bem-vindo ao Módulo de Estatística 8 Objectivos do curso 8 Quem deveria estudar este módulo 9 Como está estruturado este módulo 9 Ícones de actividade 10 Habilidades de estudo 12 Precisa de apoio? 12 Tarefas (avaliação e auto-avaliação) 12 Avaliação 13 Unidade 1 14 Estatística descritiva 14 Introdução 14 1.1 Introdução à Estatistica 15 1.1.1Objecto da estatística 15 1.1.2 Um pouco de História 17 1.1.3 Importância da Estatística 18 O estudo 19 1.1.4 Termos e conceitos básicos de estatística 20 1.1.5 Razões para a utilização de uma amostra 21 1.1.6 Cuidados a ter na formação de uma Amostra 21 Exercícios para auto avaliação 22 1.1.7 Amostragem 24 1.1.8 Tipos de amostragem 24 1.1.9 Estatística descritiva e Estatística Indutiva 26 1.1.10 Caracteres ou variáveis estatísticas 29 Sumário 30 Exercícios de auto avaliação 31 Soluções 36 1.2 Distribuição de Frequências e Gráficos 37 Introdução 37 1.2.1 Tabela de Frequências 38 1.2.2 Gráficos de Distribuição de Frequências 42 Sumário 45 1.3 Medidas de localizaçao 46 Introdução 46 1.3.1 Média Aritmética () 47 1.3.2 MEDIANA (Me) 49 1.3.3 MODA, NORMA OU MODO (MO) 51 1.3.4 CONSIDERACÕES GERAIS SOBRE A MÉDIA, A MODA E A MEDIANA. 54 Licao No 8 58 1.3.5 Medidas separatrizes ( quartis, decis e Percentis) 58 Sumário 63 Exercicios de Auto-avaliação 64 1.4 Medidas de Dispersao 68 Introdução 68 Licao No 9 68 1.4.1 Amplitude Total (At) 68 1.4.2 Desvio- Médio (Dm) 69 1.4.3 Variância 70 1.4.4 Desvio- Padrão 70 1.4.6 Relações Empíricas Entre as Medidas de Dispersão 73 1.5 DISTRIBUIÇÕES BIDIMENSIONAIS 75 Introdução 75 Terminologia 76 Neste capítulo, você deverá prestar muita atenção aos seguintes conceitos: 76 Diagrama de dispersão 76 Covariância 76 Coeficiente de correlação linear; 76 Coeficiente de determinação 76 Recta de regressão linear. 76 Licao No 10 76 1.5.2 COVARIÂNCIA 78 1.5.3 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON 79 1.5.4 REGRESSÃO LINEAR SIMPLES 80 Sumário 81 Exercicios 82 Exercicios de auto avaliaçao 83 Unidade 2 88 Teoria Elementar de Probabilidades e Distribuições 88 Introdução 88 Licao No 1 89 2.1 Teoria Elementar de Probabilidades 89 2.1.1 Origem das Probabilidades 89 2.1.2.Termos e Conceitos Probabilisticos 89 2.1.3 Definição Clássica de Probabilidade 91 A primeira definição que se conhece de probabilidade foi enunciada por Pierre Simon Laplace( 1749-1827) 91 Lição No 2 92 2.1.4 Noções Básicas de Análise Combinatória 92 (Factorial, Permutações, Arranjos e Combinações) 92 Exercicios para auto avaliaçao 96 Licão No 3 97 2.1.4 Teoremas Básicos de Probabilidades 98 Sumário 102 Exercicios de Auto-Avaliação 104 Soluções 107 2.2 Distribuição de probabilidade 108 Introdução 108 Lição No 4 109 2.2.1 Introdução à distribuição normal de probabilidade 109 Uso da tabela de distribuição normal de probabilidade 110 Exercicios de Auto-Avaliação 111 Soluçoes 111 Lição No 5 112 2.2.2 Distribuição Qui- quadrado 112 2.2.3 Distribuição t- Student 113 Exercicios de Auto-Avaliação 114 Unidade 3 115 Estatística inferencial 115 Introdução 115 Lição No 1 116 3.1 Distribuição amostral e Intervalo de confiança para a média de uma população 116 3.1.1 Distribuição Amostral 116 3.2.1. Intervalo de confiança para a média de uma população 117 3.1.2 Intervalo de confiança para proporções 118 3.1.3. Intervalo de confiança para a variância de uma população 119 Lição No 2 121 3.1.3 Intervalo de confiança para duas médias populacionais 121 Exercícios de Auto-Avaliação 124 Soluções 126 Lição No 2 127 3.2 Teoria de decisão estatística, testes de hipóteses e significância 127 3.2.1. Teste de Hipóteses para a Média de Populações normais com variâncias conhecidas 128 4. Bibliografia 131 Apêndices 132 Disciplina: Estatística Educacinal 137 Visão geral Bem-vindo ao Módulo de Estatística Caro estudante, para poder seguir o estudo da Estatística espera-se que você tenha uma preparação adequada em Matemática Básica. Isso implica um conhecimento básico de expressões numéricas e equações. Mesmo supondo preenchidos estes pré – requisitos, é frequentemente reconhecida a necessidade de se rever um pouco do material preparatório, no início de uma lição. Teremos que omitir a maioria dos detalhes, em particular os que envolvem demonstrações matemáticas. Objectivos do curso Quando terminar o estudo do Módulo de Estatística educacional, você será capaz de: Objectivos · Aplicar e desenvolver técnicas de recolher, organizar, apresentar e interpretar Estatísticas Educacionais; · Aplicar métodos quantitativos na elaboração de um projecto de pesquisa; · Organizar uma base de dados utilizando pacotes informáticos Excel ou SPSS; · Gerir uma base de dados utilizando pacotes informáticos Excel ou o SPSS no processamento e análise de dados; · Estimar e analisar Indicadores de eficácia interna do sistema de educação Moçambicano; · Elaborar relatórios fazendo um uso apropriado da informação estatística. Quem deveria estudar este módulo Este Módulo destina-se à formação de professores em exercício e outros interessados que possuem a 12ª Classe ou equivalente e inscritos no Curso à Distância, fornecido pela Universidade Pedagógica. Como está estruturado este módulo Todos os módulos dos cursos produzidos pela Universidade Pedagógica encontram-se estruturados da seguinte maneira: Páginas introdutórias Um índice completo. Uma visão geral detalhada do curso / módulo, resumindo os aspectos-chave que você precisa de conhecer para completar o estudo. Recomendamos vivamente que leia esta secção com atenção antes de começar o seu estudo. Conteúdo do módulo O curso está estruturado em unidades. Cada unidade e seus capítulos incluirão uma introdução, objectivos, conteúdos incluindo actividades de aprendizagem, um sumário da unidade e uma ou mais actividades para auto-avaliação. O Módulo de Estatística compreende três unidades, nomeadamente: (1) Estatística descritiva; (2) Noções de probabilidade e Distribuições; (3) Estimação por intervalos e Teste de hipóteses. Outros recursos Para quem esteja interessado em aprender mais, apresentamos uma lista de recursos adicionais para você explore-os. Estes recursos podem incluir livros, artigos ou sites na internet. Tarefas de avaliação e/ou Auto - avaliação Tarefas de avaliação para este módulo encontram-se no final de cada lição . Sempre que necessário, dão-se folhas individuais para desenvolver as tarefas, assim como instruções para as completar. Estes elementos encontram-se no final do modulo. Comentários e sugestões Esta é a sua oportunidade para nos dar sugestões e fazer comentários sobre a estrutura e o conteúdo do módulo. Os seus comentários serão úteis para nos ajudar a avaliar e melhorar este modulo. Ícones de actividade Ao longo deste manual irá encontraruma série de ícones nas margens das folhas. Estes icones servem para identificar diferentes partes do processo de aprendizagem. Podem indicar uma parcela específica de texto, uma nova actividade ou tarefa, uma mudança de actividade, etc. Acerca dos ícones Os ícones usados neste manual são símbolos africanos, conhecidos por adrinka. Estes símbolos têm origem no povo Ashante de África Ocidental, datam do século 17 e ainda se usam hoje em dia. Os ícones incluídos neste manual são... (ícones a ser enviados - para efeitos de testagem deste modelo, reproduziram-se os ícones adrinka, mas foi-lhes dada uma sombra amarela para os distinguir dos originais). Pode ver o conjunto completo de ícones deste manual já a seguir, cada um com uma descrição do seu significado e da forma como nós interpretámos esse significado para representar as várias actividades ao longo deste curso / módulo. Comprometimento/ perseverança Actividade Resistência, perseverança Auto-avaliação “Qualidade do trabalho” (excelência/ autenticidade) Avaliação / Teste “Aprender através da experiência” Exemplo / Estudo de caso Paz/harmonia Debate Unidade/relações humanas Actividade de grupo Vigilância / preocupação Tome Nota! “Eu mudo ou transformo a minha vida” Objectivos “[Ajuda-me] deixa-me ajudar-te” Leitura “Pronto a enfrentar as vicissitudes da vida” (fortitude / preparação) Reflexão “Nó da sabedoria” Terminologia Apoio / encorajamento Dica Habilidades de estudo Caro estudante! Para frequentar com sucesso este módulo terá que buscar através de uma leitura cuidadosa das fontes de consulta a maior parte da informação ligada ao assunto abordado. Para o efeito, no fim de cada unidade apresenta-se uma sugestão de livros para leitura complementar. Antes de resolver qualquer tarefa ou problema, o estudante deve certificar se de ter compreendido a questão colocada; É importante questionar se as informações colhidas na literatura são relevantes para a abordagem do assunto ou resolução de problemas; Sempre que possível, deve fazer uma sistematização das ideias apresentadas no texto. Desejamos - lhe muitos sucessos! Precisa de apoio? Dúvidas e problemas são comuns ao longo de qualquer estudo. Em caso de dúvida numa matéria tente consultar os manuais sugeridos no fim da lição e disponíveis nos centros de ensino a distância (EAD) mais próximos. Se tiver dúvidas na resolução de algum exercício, procure estudar os exemplos semelhantes apresentados no manual. Se a dúvida persistir, consulte a orientação que aparece no fim dos exercícios. Se a dúvida persistir, veja a resolução do exercício. Sempre que julgar pertinente, pode consultar o tutor que está à sua disposição no centro de EAD mais próximo. Não se esqueça de consultar também colegas da escola que tenham compreendido ou feito a cadeira de Estatística, vizinhos e até estudantes de universidades que vivam na sua zona e tenham ou estejam a fazer cadeiras relacionadas com Estatística. Tarefas (avaliação e auto-avaliação) Ao longo deste módulo irá encontrar várias tarefas que acompanham o seu estudo. Tente sempre solucioná-las. Consulte a resolução para confrontar o seu método e a solução apresentada. O estudante deve promover o hábito de pesquisa e a capacidade de selecção de fontes de informação, tanto na internet como em livros. Consulte manuais disponíveis e referenciados no fim de cada lição para obter mais informações acerca do conteúdo que esteja a estudar. Se usar livros de outros autores ou parte deles na elaboração de algum trabalho deverá citá-los e indicar estes livros na bibliografia. Não se esqueça que usar um conteúdo, livro ou parte do livro em algum trabalho, sem referenciá-lo é plágio e pode ser penalizado por isso. As citações e referências são uma forma de reconhecimento e respeito pelo pensamento de outros. Estamos cientes de que o estimado estudante não gostaria de ver uma ideia sua ser usada sem que fosse referenciado, não é? Na medida de possível, procurar alargar competências relacionadas com o conhecimento científico, as quais exigem um desenvolvimento de competências, como auto-controle da sua aprendizagem. As tarefas colocadas nas actividades de avaliação e de auto-avaliação deverão ser realizadas num caderno à parte ou em folha de formato Avaliação O Módulo de Estatística terá dois testes e um exame final que deverá ser feito no Centro de Recursos mais próximo, ou em local a ser indicado pela administração do curso. O calendário das avaliações será também apresentado oportunamente. A avaliação visa não só informar-nos sobre o seu desempenho nas lições,mas também estimular-lhe a rever alguns aspectos e a seguir em frente. Durante o estudo deste módulo o estudante será avaliado com base na realização de actividades e tarefas de auto-avaliação previstas em cada Unidade. 10 Unidade 1 Estatística descritiva Introdução O objectivo fundamental da estatística é o de caracterizar (ou inferir sobre) uma população conhecendo apenas uma parte dela. Neste caso, a verdadeira arte está no observador que tem de ser capaz de ver o que está encoberto só com base na quilo que consegue observar. Para tal reunimos um conjunto de conceitos de estatística e de métodos de análise considerados fundamentais para analisar dados estatístico. Nesta Unidade, você deverá fazer: o estudo do Objecto de Estatística, concentrando a atenção nas Fases do método estatístico; um pouco do Historial e importância da Estatística a diversos níveis; alguns conceitos e termos usados em Estatística como é o caso da População e amostra. Ainda nesta Unidade, vai estudar as técnicas de amostragem, tipos de variáveis e distinguir a Estatística descritiva da Inferencial. Vai poder ainda resumir os dados estatísticos em tabelas e gráficos e, calcular certos parâmetros estatísticos que lhe permitirão descrever certos fenómenos. Para poder seguir esta unidade sem maiores dificuldades, espera-se que você tenha uma preparação adequada em Matemática básica. Isso implica um conhecimento básico de expressões numéricas e equações. Ao completar este capitulo, você será capaz de: Objectivos · Identificar o objecto de estudo de Estatística · Dar alguns exemplos de utilização de estatística no seu dia-a-dia · Identificar população e amostra num estudo estatístico; · Explicar as razões da utilização da amostra num estudo estatístico · Indicar os cuidados a ter na utilização de uma amostra · Explicar os diferentes tipos de amostragens · Estabelecer a diferença entre Estatística Descritiva e Inferencial · Identificar e classificar variáveis num estudo estatístico; · Representar dados estatísticos em tabelas e gráficos; · Calcular certos parâmetros estatístico; · Analizar e descrever fenómeno estatístico. Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · População; amostra e tamanho de amostra; · Dados estatísticos; unidade estatística; · Variáveis qualitativas; quantitativas e escalas de medição; · Estatística descritiva e inferencial. Lição No 1 1.1 Introdução à Estatistica 1.1.1Objecto da estatística De uma forma sintética, pode -se dizer que a Estatística é um conjunto de técnicas apropriadas para recolher, classificar, apresentar e interpretar conjuntos de dados numéricos. E tem por objectivo a análise e avaliação numérica de observações. Os computadores e calculadoras são meios excelentes para trabalhar com Estatística. Assim, a Estatística é mais um método do que uma teoria, pois o seu objectivo fundamental é descrever fenómenos e não tanto explicá-los. O método estatístico na medida em que utiliza a linguagem de números, é um método quantitativo. Num estudo estatístico, normalmente segue-se um conjunto de passos que designamos por fases do método estatístico para facilitar o estudo estatístico. Fases do Método estatístico: a) Definição do problema - a primeira fase consiste na definição e formulação do problema a ser estudado. O investigador deve ainda analisar outros estudos feitos sobre o mesmo tema.b) Planificação - definido o problema, é preciso determinar um processo para o resolver e em especial, como obter informações sobre a variável em estudo. É nesta fase que se decide pela observação de toda população ou de uma amostra e a calendarização das actividades a realizar. c) Recolha de dados - os dados podem ser recolhidos através de: · Questionário; · Entrevista; · Observação; · Experimentação; · Pesquisa bibliográfica, etc. d) Organização ou classificação de dados - consiste em “resumir” os dados através da sua contagem e agrupamento. Deste modo, obtém-se um conjunto de números que possibilita distinguir o comportamento do atributo estatístico. e) Apresentação dos dados - há duas formas de apresentação que não se excluem mutuamente: · Apresentação por tabelas; · Apresentação por gráficos. Estas formas de apresentar dados, permitem sintetizar grandes quantidades de dados, tornando mais fácil a compreensão do carácter em estudo e permitindo uma futura análise. f) Análise e interpretação dos dados - é a mais importante e delicada do estudo estatístico, pois é nesta fase que se tiram conclusões que ajudam o investigador a resolver o problema. Nesta fase, ainda é possível, por vezes, “arriscar” alguma generalização, a qual envolverá sempre algum grau de incerteza. Ao estudo estatístico interessam os fenómenos não deterministas cujos resultados envolvem alguma incerteza (inflação, resultados de uma eleição, …). Os fenómenos deterministas ou causais (queda de um móvel, a resistência a rotura de um material, …), para os quais existe uma lei matemática que os define, não serão naturalmente estudados em Estatística. 1.1.2 Um pouco de História A origem de Estatística remota a tempos muito antigos da nossa história e começou por tratar de assuntos de Estado. A palavra Estatística tem origem na palavra em latim status, traduzida como o estudo do Estado e significava, originalmente, uma colecção de informação de interesse para o estado sobre população e economia. Essas informações eram colectadas objectivando o resumo de informações indispensáveis para os governantes conhecerem suas nações e para a construção de programas de governo Há indícios de que por volta do ano 3000 a.c. já se faziam censos na Babilónia, na China e no Egipto com o propósito de cobrar impostos e para fins militares. O livro quarto do Antigo Testamento refere que Moisés foi instruído pelo profeta a fazer um levantamento dos homens de Israel que estivessem aptos a guerrear. Na época do Imperador César Augusto foi ordenada a realização de um censo em todo o Império romano no primeiro ano da nossa era (na região entre Douro e Guadiana). Apesar da sua origem remota, é apenas no séc. XVII que a Estatística começa a ser considerada uma disciplina autónoma. Para esta autonomia, muito contribuiu a acção do alemão Herman Conring(1606-1681) ao introduzir o seu estudo na universidade de Helmstadt, no que foi continuado por Godofred Achenwall (1719-1772) e por Schlozer(1735-1809). No Séc. XVII, surge também a escola inglesa. John Graunt(1620-1674) e William Petty (1623-1687) dois dos seus mais destacados representantes, preocuparam-se com o estudo numérico dos fenómenos sociais e políticos numa primeira tentativa de determinarem leis quantitativas capazes de exemplificarem tais fenómenos. A Graunt se deve a primeira investigação estatística sobre a mortalidade, como consta de uma memória que apresentou á Real Sociedade de Londres, em 1661. Nesse estudo, Graunt concluiu que nasciam mais crianças do sexo masculino do que do sexo feminino, que as mulheres tendiam a viver mais tempo do que os homens e que o número de mortes (excepto durante as epidemias) se mantinha sensivelmente constante de ano para ano. Na Alemanha, o Pastor Sussmilch (1707-1767) conduziu um estudo sobre Demografia, que colocou como o precursor da Estatística enquanto meio indutivo de investigação. O passo decisivo para a fundamentação teórica da inferência estatística encontra se associado ao desenvolvimento do cálculo das probabilidades. 1.1.3 Importância da Estatística Nos nossos dias, a Estatística assume uma importância decisiva a diversos níveis. A importância da Estatística pode ser vista através da sua utilização ao nível do Estado, de Organizações Sociais e profissionais, do Cidadão comum e ao nível científico. Ao nível do Estado, hoje em dia quase todos as decisões importantes que se tomam são acompanhadas de estudos estatísticos e o mesmo se pode dizer relativamente á justificação da adequação ou não das políticas seguidas por diferentes governos. O grau de importância atribuído a Estatística, neste caso, é tão grande que praticamente todos os países possuem organismos oficiais destinados a realização de estudos estatísticos - Instituto Nacional de Estatística (INE). No que respeita as organizações sociais e Profissionais, tem se vindo a assistir a um aumento do uso da Estatística. Relativamente as Organizações Sociais, empresas, sindicatos, organizações de assistência social, etc. Todas elas conduzem a sua acção recorrendo mais ou menos a Estatística. Por exemplo, uma empresa quando lança um novo produto indaga pessoas acerca desse produto com o fim de determinar índices de potenciais compradores. No que concerne aos grupos profissionais, são também cada vez maiores as exigências na utilização de Estatística. Muitas vezes tal utilização acompanha diversas fases do seu trabalho, que vão desde a planificação passando pela execução e terminando na análise dos resultados. Destaca-se, ao nível das organizações, o aparecimento recente e o grande incremento de empresas e profissões ligadas a publicidade e técnicas de marketing, nas quais a Estatística desempenha um papel central. Ao nível do Cidadão comum, a importância da Estatística resulta imediatamente das implicações das decisões tomadas, quer pelo Estado quer pelas diferentes organizações sociais e profissionais. É sabido que as decisões políticas tomadas pelo Governo, as estratégias de desenvolvimento e de gestão das empresas e as posições dos sindicatos, p.ex., afectam a generalidade do cidadão comum. A necessidade de formação estatística para todos no sentido de promover uma participação esclarecida e crítica justifica-se, pois, voluntariamente ou involuntariamente, por vezes, os resultados estatísticos favorecem certos grupos sociais em prejuízo de outros. A este respeito recorde-se que com base no mesmo estudo, os membros do Governo e os dirigentes sindicais podem sustentar opiniões díspares acerca do desemprego. E não se pense que tais disparidades resultam sempre de um uso distorcido da Estatística, pois essas discrepâncias podem resultar de consideração de certos aspectos em detrimento de outros de acordo com o interesse dos interlocutores. O Cidadão comum é bombardeado também com informação relacionada com a cultura e com o desporto, cuja a compreensão exige, igualmente, conhecimento de estatística. No caso de futebol é frequente a televisão apresentar uma síntese relativa a certos aspectos do jogo durante o intervalo e no fim do jogo. A Estatística é também responsável pelo desenvolvimento científico em geral. Para além da sua aplicabilidade nas Ciências Naturais, na Medicina, na Agronomia e na Economia, a Estatística constitui um suporte de cientificidade para as ciências humanas e sociais. É assim que ciências como a Sociologia, a Psicologia, a História e a Pedagogia têm beneficiado de consideráveis desenvolvimentos e de aumento de credibilidade pública com a utilização de meios estatísticos. Exercícios 1. Descreve o objecto de estudo de estatística; 2. Dê pelo menos dois exemplos de utilização de estatística no seu dia-a-dia; 3. Que procedimentos devem ser observados num estudo estatístico? O estudo Lição No 2 1.1.4 Termos e conceitos básicos de estatística População e Amostra Num censo ou recenseamento são observados todos elementos da população relativamente aos diferentes atributos que estão a ser objecto de estudo estatístico. Ex. Para conhecermosos gostos dos alunos de uma escola acerca dos sabores de yougurtes através de um censo, teríamos de interrogar todos alunos da escola. Como exemplos de censos que se efectuam na generalidade dos países, temos: o recenseamento militar, o recenseamento eleitoral e o recenseamento geral da população. Estes recenseamentos têm por finalidade última facultar um melhor conhecimento das pessoas e das suas condições de vida, de forma a permitir as entidades governamentais tomar medidas adequadas para o desenvolvimento do país. Quando por várias razoes, a realização de um censo surge como uma impossibilidade, então a sondagem assume-se como uma alternativa. Numa sondagem, o estudo estatístico baseia-se numa parte da população, isto é, numa amostra que deve ser representativa dessa população. Ex. Recorrendo a empresas especializadas, os partidos políticos encomendam sondagens para estimar o número de votantes e/ou para avaliar o impacto público das suas posições; as empresas promovem sondagens para prever o número de potenciais compradores dos seus produtos e os investigadores efectuam sondagens para avaliar o impacto social das suas descobertas, etc. Quando se faz uma sondagem acerca da audiência de um programa televisivo, não se pergunta a toda população se gosta ou não do programa, mas sim interroga-se uma parte da população, ou seja, uma amostra. Quando se analisa a qualidade dos fósforos produzidos por uma fábrica, não se experimenta todos os fósforos (população), mas sim uma parte dos fósforos (amostra). População ou Universo Estatístico é uma colecção de seres com qualquer característica comum. Amostra é um subconjunto finito da população. A cada elemento da população chama-se Unidade Estatística ou individuo. A população pode ser finita ou infinita. Ex. População finita – o número de funcionários de uma empresa. População infinita – os pontos de uma recta, os resultados obtidos (coroa ou cara) em sucessivos lançamentos de uma moeda. A maior parte de pesquisas científicas recorre a estudos de uma amostra. 1.1.5 Razões para a utilização de uma amostra A utilização de uma amostra e não da população num estudo estatístico embora nos conduza a conclusões seguras, deve-se pelo menos, a uma das seguintes razoes: · A população ser infinita; · Economia de dinheiro; · Economia de tempo; · Comodidade; · Inutilização dos elementos observados. (a dona Amélia partiu todos os ovos para verificar a sua qualidade, o que acontece aos ovos.) O sucesso de um estudo estatístico baseado no estudo de uma amostra depende da escolha desta. Uma amostra mal escolhida conduz a conclusões erradas. 1.1.6 Cuidados a ter na formação de uma Amostra Dum modo geral, devemos ter os seguintes cuidados na formação da amostra: Imparcialidade - todos os elementos devem ter a mesma oportunidade de fazer parte da amostra; Representatividade – deve conter em proporção tudo o que a população possui, qualitativa e quantitativamente; Tamanho – deve ser suficientemente larga de modo que as características da amostra se aproximem, tanto quanto possível, das características da população. Exercícios para auto avaliação 1. Relativamente a uma recolha estatística diga o que entende por: a) População b) Unidade estatística c)Amostra 2. Fez-se um inquérito dirigido a todos operários de uma fábrica. Dos diferentes sectores seleccionaram-se 50 operários. Neste estudo: a) qual é a população b) qual é a amostra? 3. Dê dois exemplos de estudos estatísticos onde seja necessário utilizar uma amostra. 4. Dê um exemplo de amostra mal escolhida. E justifica 5. Porque em maior parte de pesquisas científicas usa se a amostra e não a população? 6. Leia a seguinte notícia: «É surpreendente. Apenas 5% do tempo de trabalho diário de um vendedor é passado a…. Vender ou negociar». Esta a conclusão que chegou Robert Kinnaird de uma consultora de Glasgow, na sequência de um inquérito junto de 1000 vendedores de quatro países europeus. Fortuna, Maio 95 Neste estudo referido na notícia usou-se um censo ou uma sondagem? Justifique. 7.Indique a população e a unidade estatística em que o carácter em estudo era: a) O curso preferido pelos estudantes da turma; b) A nacionalidade dos Políticos que visitaram Moçambique em 1986; c) O tempo gasto pelos 5 melhores ciclistas Moçambicanos na volta a Moçambicano em 2007. Soluções 2.a) Operários de uma fábrica; b) 50 Operários seleccionados 3.Exemplos: i.) Análise de sangue de um ser humano ii) Estudo do tipo do solo. 4. Exemplo: Selecção de rendimento de 5 melhores alunos de uma turma de 60 para avaliar o aproveitamento da mesma. Justificação: Não se observa a representatividade; isto é, não estão contempladas outras categorias de alunos(fracos e médios) além disso trata se de uma amostra não significativa. E os resultados a obter se são incorrectos. 5. Razões: A população ser infinita; Economia de dinheiro; Economia de tempo; Comodidade; Evitar inutilizar os elementos observados; etc. 6. Sondagem. Pesquisa feita somente a 1000 vendedores amostra de 4 países. 7. a) Estudantes da turma; cada estudante representa a unidade estatística; b) Políticos que visitaram Moçambique em 1986; cada politico que visitou Moçambique em 1986; c) Ciclistas Moçambicanos; cada ciclista. Lição No 3 1.1.7 Amostragem Existem técnicas científicas para a selecção correcta de amostra. A amostragem é o processo pelo qual recolhemos dados. Isto dá-nos apenas uma imagem da população em estudo. No entanto, independentemente da correcção dos processos usados, para recolher a amostra, há sempre a considerar o chamado erro de amostragem. Devemos sempre esperar algumas diferenças entre a amostra e a população. Por outro lado, por exemplo, o erro pode residir não só na amostragem, mas também nos próprios dados. Erros não amostrais acontecem quando os valores recolhidos não pertencem aos valores possíveis da entidade (exemplo: registado o valor 32 para uma nota, quando deveria ter sido 23) ou quando apenas uma pequena proporção da população é recolhida. 1.1.8 Tipos de amostragem De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória. O método de amostragem não aleatório consiste em seleccionarmos entidades através de escolha pessoal. As amostras não aleatórias incluem: 1) As de opinião quando as entidades são escolhidas porque compõem uma amostra representativa (os habitantes de duas freguesias podem ser usados como representativos dos eleitores de uma zona mais ampla do país, por exemplo); 2) As de conveniência quando escolhemos as entidades apenas estas estarem mais próximas de nós (escolhemos os alunos de uma turma quando pretendemos obter a opinião de todos os alunos de uma escola); 3) As de quota quando os elementos que compõem a amostra são de determinadas características (se soubermos que os consumidores de um determinado produto são 60% do sexo feminino, podemos dizer a um inquiridor que esteja à porta de um supermercado para entrevistar 60 pessoas do sexo feminino e 40 do sexo masculino, cabendo-lhe a decisão de escolher quem entrevista). Porque dependem de escolha pessoal, as amostras não aleatórias podem efectivamente não ser representativas de uma população, sendo difícil o cálculo do erro amostral. Para ultrapassarmos este problema, as amostras aleatórias deixam a escolha ao acaso, tendo em princípio cada elemento da população a mesma probabilidade de ser escolhido. Há quatro tipos de amostragens aleatórias. A primeira delas é a chamada amostra aleatória simples de tamanho n onde não só cada elemento da população tem as mesmas hipóteses de ser escolhido, como também qualquer conjunto de tamanho n pode ser escolhido. Ex. Pretende-se uma amostra de 20 alunos de uma escola, atribui-se um número a cada um dos alunos da escola e, seguidamente, escolhe-se ao acaso 20 desses números. O segundo tipo de amostragem é a amostragem estratificada. Neste tipo de amostragem, as entidades são agrupadas em estratos segundo características físicas ou materiais. Para assegurarque todos os estratos da população estudantil afectados por determinado diploma sejam considerados, escolhem-se, por exemplo, uma amostra aleatória de estudantes de cada um dos tipos de ensino: básico, secundário e superior. Uma única amostra aleatória simples não poderia garantir esta representação de estudantes dos três tipos de ensino. Ex. Na selecção de 30 alunos de uma escola, considerando cada ano de escolaridade como estrato, escolher-se-ia em cada um desses anos um determinado número de alunos por um dos processos anteriores. O número de alunos a escolher em cada ano, seja, em cada estrato deve ser proporcional ao número dos alunos desse ano. Se a escola, com 600 alunos, 150 são da 10ªclasse, 100 são da 11ª classe e 50 são da 12ªclasse poder-se-ia para amostra · 15 Alunos da 10ªclasse · 10 Alunos da 11ªclasse · 5 Alunos da 12ª classe O que significa que em cada estrato tem se 10% de alunos Um terceiro tipo de amostragem é a chamada amostragem por cachos. Aqui, as entidades são classificadas em grupos ou cachos e é seleccionada uma amostra aleatória de cachos. Um censo (de toda a população) é então conduzido dentro dos cachos seleccionados. Por fim, a amostra sistemática, os elementos da amostra, são escolhidos a partir de uma regra estabelecida. Ex. Para seleccionar uma amostra de 30 alunos de uma escola com 600 alunos, depois de numerados todos, pode-se escolher um aluno de 20 em 20 a partir do primeiro aluno seleccionado e escolhido ao acaso de entre o primeiro grupo de 20 alunos. Supondo que o número 3 foi seleccionado, tem-se para a amostra: 3, 23, 43, 63, ……, 563, 583. 1.1.9 Estatística descritiva e Estatística Indutiva Estatística descritiva ou dedutiva tem por finalidade descrever certas propriedades relativas a um conjunto de dados. Ela trata da recolha, ordenação, classificação e análise de um conjunto de dados obtidos em observações, Depois de efectuadas observações ficamos na posse de um conjunto caótico de dados, o que dificulta a obtenção de conclusões. É perante esta «desordem» dos dados que a Estatística descritiva revela a importância e interesse das suas técnicas, ao permitir classificar esses dados e deles fornecendo características sumárias. Constroem-se tabelas e gráficos que simplificam a complexidade de dados e calculam-se parâmetros estatísticos que ajudam a compreender e descrever a situação em estudo. Os métodos descritivos enquanto meios que permitem ordenar a «desordem» e sintetizar a diversidade das informações contidas nos dados, podem explicar-se quer a população quer a amostra. Estatística Indutiva ou Inferencial – procura inferir propriedades do universo estatístico a partir de propriedades verificadas na amostra. Ela generaliza para uma população, estabelecendo previsões a partir dos resultados na Estatística Descritiva e apoia-se no cálculo das probabilidades que permite quantificar o erro, compreendendo que a inferência é tanto mais provável quanto menor for o erro que acompanha. Pode utilizar-se a Estatística indutiva só no estudo da amostra. ExercíciosExercícios de Auto-Avaliação 1. Supondo que ia fazer um estudo sobre cada um dos temas indicados, diga, justificando, em quais deles utilizaria uma amostra: a) Controlo de qualidade da educação oferecida pelas escolas privadas moçambicanas; b) Aproveitamento dos alunos da turma 10ª A de uma Escola; c) Análise do mercado para lançamento de uma nova pasta de dentes; d) Estado sanitário dos ovos existentes num armazém; e) Tipo de borboletas existentes num País. 2.Explique a diferença entre Estatística descritiva e estatística inferencial. 3. Considerar a sequência do seguinte estudo: a) Define-se uma amostra dos elementos de população; b) Descrevem-se as variáveis para o estudo; c) Toma-se nota, para cada variável, do valor correspondente a cada elemento da amostra; d) Utilizam-se diversos métodos científicos e analisam-se os dados, obtendo-se diversas estatísticas; e) Com os dados obtidos na amostra prevê-se o comportamento da população com ajuda do cálculo das probabilidades. Qual dos passos referidos está dentro da Inferência Estatística? 4.Um promotor de vendas quer saber a opinião de mulheres empregadas sobre uma nova política do governo que prevê escolaridade obrigatória até 7ª classe. Ela tem uma lista de todas as mulheres que pagam quotas a um dos sindicatos. Ela envia um questionário a 100 destas mulheres escolhidas aleatoriamente. Destas, 68 preenchem e devolvem o questionário. a) Qual é, neste caso, a população e amostra? b) Acha que a amostra é representativa? Justifique. 5.Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de televisão. Como parte do teste, o comercial é mostrado em um programa de notícias locais, as 18h30min. Dois dias mais tarde, uma firma de pesquisa de mercados realizou um levantamento telefónico para obter informações sobre os índices de respostas (percentagem de espectadores que responderam vendo o comercial) e impressões sobre o comercial. a) Qual é a população desse estudo b) Qual é a amostra para esse estudo c) Porque se usaria uma amostra nessa situação? Soluções 1. a) , c), d) e e). 3.e) 4. a) Mulheres empregadas. Amostra 100 mulheres empregadas. b) A amostra não é representativa pois, não envolveu mulheres de todos sindicatos. 5. a) População: novo comercial. b) Amostra: o comercial mostrado em um programa de notícias locais; c) Comodidade Lição No 4 1.1.10 Caracteres ou variáveis estatísticas Se a população de um estudo estatístico fosse constituída pelos alunos de uma escola, cada aluno seria uma unidade estatística. Cada aluno tem muitas Características ou caracteres: a cor dos olhos, a altura, o número de irmãos, a profissão dos pais, sexo, a distância de casa a escola, a última nota de história, etc. Os caracteres podem ser qualitativos (nominais e ordinais) ou quantitativos (discretos e contínuos). Caracteres qualitativos são aqueles que não se podem medir. Estão relacionados com uma qualidade e apresentam-se em modalidades. Caracteres qualitativos Modalidades A cor dos olhos Azul, verde, castanho, … O curso preferido Jornalismo, direito, … A profissão dos pais Professor, médico, pedreiro, …. Caracteres quantitativos – são aqueles que se podem medir. A apresentam-se com diferentes intensidades ou valores. Caracteres quantitativos Valores O peso de um limão 10g, 15g, 50g, …. Altura de uma pessoa 136cm, 179cm, … O custo da renda de casa 2.500Mt, 7.000Mt, … Ao resultado da observação de um carácter qualitativo ou quantitativo chama-se dado estatístico. Ex. O Alfredo tem olhos castanhos; o Alfredo mede 1,86cm de altura. Os estudos estatísticos incidem essencialmente em variáveis quantitativas. As variáveis estatísticas quantitativas subdividem-se em duas categorias: Discretas e contínuas. i. Variáveis Discretas – são as que só podem tomar um número finito ou uma infinidade numerável de valores. Ex. Número de irmãos de um aluno da turma, mesmo antes de fazermos a observação, sabe que vamos encontrar dados que em termos geométricos, correspondem a pontos isolados. ___. ________. ________. ________. _..... 0 1 2 3 ii. Variáveis Contínuas – são as que podem tomar qualquer valor de um intervalo. __._____________. ___ 1,70 1,90 Ex. Peso dos recém nascidos durante um mês, numa maternidade, mesmo antes de fazermos uma observação, sabemos que, teoricamente, podemos encontrar uns dados estatísticos que, em termos geométricos, seriam representados na recta real por qualquer ponto de um intervalo. Sumário População ou Universo Estatístico é uma colecção de seres com qualquer característica comum. Amostra é um subconjunto finito da população. A cada elemento da população chama-se Unidade Estatística ou individuo. A população pode ser finita ou infinita. Razões para a utilização de uma amostra A utilização de uma amostra e não da populaçãonum estudo estatístico embora nos conduza a conclusões seguras, deve-se pelo menos, a uma das seguintes razoes: a população ser infinita; economia de dinheiro; economia de tempo; comodidade; inutilização dos elementos observados. Na selecção da amostra deve se observar os seguintes cuidados: imparcialidade, representatividade e tamanho. De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória. A estatística esta subdividida em duas partes: a descritiva e a inferencial. O diagrama abaixo indica os tipos de variáveis. ( Nominais Ordinais Qualitativas ou Categóricas Quantitativas Contínuas Discretas variáveis ) Ex. Sexo ex. nível de instrução ex. alturas ex. n° de filhos Exercícios de auto avaliação 1.Considere o seguinte texto: Num congresso sobre «direitos da criança» apresentaram comunicações 5 Pediatras, 3 Psicólogos, 4 Educadores, 2 Assistentes Sociais e 2 Sociólogos. Da análise do Texto, infere-se que foi feito um estudo estatístico. Para esse estudo indique: a) A população b) Unidade estatística c) O carácter estatístico. Classifique-o. 2.Tende-se fazer um estudo sobre o número de filhos dos professores de Matemática de uma cidade. Para isso, efectuou-se um inquérito ao qual responderam 30 professores de Matemática, os resultados obtidos foram: ____________________________________ 5 4 3 0 0 2 2 2 1 1 1 0 3 0 2 2 0 3 4 6 1 1 0 2 3 1 2 0 0 1 ____________________________________ Indique: a) A população em estudo b) A amostra escolhida c) A unidade estatística d) A variável em estudo e classifique-a. 3.Mediram se os comprimentos de cinco mesas rectangulares e obtiveram se os seguintes dados: 1,3cm; 1,2cm; 1,25cm; 1,02cm; 1,4cm. Neste conjunto de observações, indique: a) População; b) A unidade estatística; c) A variável estatística e classifique-a; d) O que representam em linguagem estatística, os números dados? 4.Um levantamento arguiu 2010 adultos. «Você está satisfeito com a situação da educação das nossas crianças nas escolas hoje?» As categorias das respostas eram insatisfeitas, satisfeitas e indeciso. a)Qual foi tamanho da amostra para esta pesquisa? b) Os dados colectados eram quantitativos ou qualitativos? c) Para um resumo dos dados para esta questão, faria mais sentido usar as médias ou percentagens? d) Dos que responderam, 60% disseram que estavam insatisfeitos com a situação da educação. Quantos indivíduos forneceram esta resposta? 5. Uma agência classifica a ocupação dos trabalhadores como profissional liberal, funcionário e operário. A variável é a ocupação do trabalhador. Esta é uma variável qualitativa ou quantitativa? 6. Declare se cada uma das variáveis é quantitativa (discreta, contínua) ou qualitativa (nominal, ordinal). a) Idade b)Género c) Classe social d) Marca de automóvel e) Número de pessoas favoráveis a pena de morte f) Vendas anuais g) Ganhos por acção h) Método de pagamento (a vista, com cheque, com cartão de crédito). 7. Uma funcionária tem um salário de 140 mil meticais mas é informada de que terá uma redução de 10% no pagamento em virtude do declínio dos lucros da companhia. É informada também de que no ano seguinte terá um aumento de 10%. A situação não se afigura tão má porque a redução de 10% parece ser compensada pelo aumento de 10%. a) Determine a renda anual após o corte de 10%. b)Com base no resultado obtido em a), determine a renda anual após o aumento de 10%. c) O corte de 10% seguido do aumento de 10% restitui a funcionária o salário original de 140mil meticais? 8. Num teste de Matemática as classificações positivas e negativas distribuem-se pelos rapazes e raparigas de acordo com os valores da seguinte tabela: Rapazes Raparigas Total Positivas 15 21 36 Negativas 5 4 9 Total 20 25 45 Determine a percentagem de: a. Raparigas b. Raparigas com classificação positiva; c. Rapazes com classificação positiva, no conjunto dos rapazes. 9.Um inquérito realizado para um supermercado classificou seus clientes segundo a frequência com que o visitam e segundo a frequência com que compram produtos de limpeza. Frequência de visita Frequência de compra de produtos de limpeza Sempre Algumas vezes Nunca Frequente 12 48 19 Não frequente 7 6 8 a) Quantos indivíduos visitam frequentemente o super mercado? b) Quantos indivíduos visitam frequentemente o super mercado e compram produtos de limpeza? c) Qual é a percentagem de indivíduos que não visitam o supermercado frequentemente e compram produtos de limpeza? Soluções 1. a) crianças; b) cada criança; c) direito das crianças. Variável qualitativa nominal; 2. a) professores de Matemática; b) 30 professores inquiridos; c) cada professor; d) número de filhos de professores de Matemática. Variável quantitativa discreta. 3. a) Mesas rectangulares; b) Cada mesa; c) Comprimento de cada mesa. Variável quantitativa contínua; d) Dados estatísticos. 4. a) 2010 adultos; b) qualitativos; c) Percentagens; d) 1206 adultos. 5. Qualitativa; 6. A) Quantitativa contínua; b) qualitativa nominal; c) qualitativa ordinal; d) qualitativa nominal; e) quantitativa discreta; f) quantitativa discreta; g) quantitativa contínua; h) qualitativa nominal. 7. a)1512000 b) 1663200 c)Não. 8. a) 55.6% b) 46.7% c)75%. 9. a) 79 b) 60 c) 13% 1.2 Distribuição de Frequências e Gráficos Introdução Neste capítulo, você vai tratar das fases do método estatístico é neste capitulo onde você vai começar a actividade de recolha, organização, apresentação (uso de tabelas e gráficos), análise e interpretação do fenómeno estatístico observado, é, aqui onde vai construir um banco de dados processando-os usando pacotes estatísticos Excel ou Spss. Este capitulo tem 4 lições, estando previsto para cada uma delas um tempo de estudo de 2,5 horas. Este número de horas é um indicativo para lhe ajudar a gerir melhor o seu tempo; é considerado suficiente para você conseguir atingir os objectivos definidos no início de cada lição. Ao completar esta unidade, você será capaz de: Objectivos · Recolher dados num estudo estatístico; · Organizar dados estatísticos; · Apresentar dados estatísticos numa tabela e num gráfico de distribuição de frequências usando o pacote estatístico Excel ou Spss; · Analisar e interpretar os dados descrevendo-os e tirar conclusões; · Elaborar um relatório preliminar sobre o fenómeno estatístico observado. Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · Tabela de distribuição de frequências · Gráficos de barra, histograma, polígono de frequências, sectograma; · Frequências: absolutas, relativas, absoluta acumulada e relativa acumulada Licao No 5 1.2.1 Tabela de Frequências Vamos dar em seguida, particular atenção `a organização e apresentação dos dados, nomeadamente `a elaboração de tabelas e gráficos Para organizar e representar dados, usam-se tabelas e gráficos. Tabela de Frequências para dados simples(não agrupados em classes) Suponhamos que numa turma da 10ª classe pretendíamos fazer um estudo estatístico sobre as idades(em anos) dos alunos. E neste caso registamos: 16, 13, 15, 16, 14, 13, 14, 15, 15, 14, 15, 17, 14, 15, 15, 15, 14, 16, 15, 14, 14, 15, 17. A variável estatística idade (em anos), é discreta e toma os valores 13, 14, 15, 16 e 17. Tabela 1: Distribuição das idades da turma Idade (em anos) Xi contagem Frequência fi 13 // 2 14 //// // 7 15 //// //// 9 16 /// 3 17 // 2 Total - 23 A tabela acima representa a frequência absoluta ou efectivo (fi) de um valor X da variável, pois indica o número de vezes que esse valor foi observado. Sabemos da tabela que 7 alunos da turma têm 14 anos, 3 alunos têm 16 anos, etc. A partir da frequência absoluta (fi), podemos calcular outras frequências: Frequência relativa (fri) de um valor X da variável, é o quociente entrea frequência absoluta do valor X da variável e o número total de observações. ou em percentagem (i=1,2,3,…..,k) Frequência absoluta acumulada (faci) ou (Fi) do valor X, é a soma das frequências absolutas de todos valores anteriores a X com frequência absoluta de X. Frequência relativa acumulada (facri) ou (Fri ) do valor X, é a soma das frequências relativas de todos valores anteriores a X com frequência relativa de X. Tabela2: Distribuição das frequências das idades da turma Idade (em anos) Xi Freq.Absoluta Freq.relativa Freq.Absol. acumulada. Freq.Relat.Acumul. 13 2 2/23=0.09 ou 9% 2 0.09 ou 9% 14 7 7/23=0.30 ou 30% 9 0.39 ou 39% 15 9 9/23=0.39 ou 39% 18 0.78 ou 78% 16 3 3/23=0.13 ou 13% 21 0.91 ou 91% 17 2 2/23=0.09 ou 9% 23 1 ou 100% n=23 Nesta tabela, encontram-se respostas para as seguintes questões: 1. qual é o número de alunos com idade inferior ou igual a 14 anos? Resp.- há 9 alunos com 14 anos ou menos; 2. qual é a percentagem de alunos com 15 anos? Resp - há 39% de alunos com 15 anos; 3. quantos alunos tem 17 anos? Resp - há 2 alunos com 17 anos; 4. qual é a percentagem de alunos com idade inferior a 16 anos? Resp -78% dos alunos têm menos de 16 anos; 5. qual é a percentagem de alunos com mais de 15 anos? Resp - 22% (13%+9%) dos alunos da turma têm mais de 15 anos; 6. qual é o número total dos alunos da turma? Resp - o número total dos alunos da turma é 23. Tabela de Frequências para dados agrupados ou tabulados em classes Se no lugar de estudarmos a variável idade dos alunos, fossemos estudar a variável altura dos alunos e tivéssemos: 1,62 1,71 1,50 1,62 1,69 1,59 1,48 1,52 1,64 1,57 1,49 1,66 1,73 1,53 1,61 1,63 1,56 1,55 1,57 1,64 1,60 1,51 1,68 ___________________________________________________________________ Trata-se agora de uma variável contínua. E o estudo das variáveis contínuas assenta-se na organização dos dados em classes. Também pode-se usar o agrupamento de dados em classes de variáveis discretas se tivermos tantos valores diferentes para variável X. Não existe nenhuma fórmula universalmente aceite para determinar o número de classes a considerar. A tabela de Truman L. Kelley que estabelece o número de classes (k) em função do número total de observações (n) pode constituir uma ajuda. n 5 10 25 50 100 200 500 1000 k 2 4 6 8 10 12 15 15 No caso das alturas podemos considerar 6 classes, pois n=23. Todas as classes devem ter a mesma amplitude e para isso calcula-se: 1º Amplitude total =limite superior(Ls)-limite inferior(Li)=1,73-1,48=0,25. 2º Pode, então, considerar – se 0,05 como amplitude de cada classe e 1,45 como limite inferior da primeira classe . Obs: Se considerássemos a amplitude de 0,04 e 1,48 (menor valor observado) como limite inferior da primeira classe verificava-se que o valor 1,73 não se incluía em qualquer classe Deste modo, a definição da amplitude das classes e do limite inferior da primeira classes devem ser estabelecidos por forma que cada valor da variável estatística pertença exactamente a uma classe. Uma outra maneira de determinar o número de classes é a regra sugerida por Sturgos. K=1+3,3logn e ainda, , sendo n, o número de observações. Tabela 3: Distribuição das alturas dos alunos Alturas(em m) contagem fi [1,45; 1,50[ // 2 [1,50; 1,55[ //// 4 [1,55; 1,60[ //// 5 [1,60; 1,65[ //// // 7 [1,65; 1,70[ /// 3 [1,70; 1,75[ // 2 Total ---- n= 23 Tabela 4: Distribuição de frequências das alturas dos alunos Alturas(em m) Freq.Absoluta Freq.relativa Freq.Absol.acum. Freq.Relat.Acumul. [1,45; 1,50[ 2 2/23=0.09 ou 9% 23 1 ou 100% [1,50; 1,55[ 4 4/23=0.17 ou 17% 21 0.91 ou 91% [1,55; 1,60[ 5 5/23=0.22 ou 22% 17 0.74 ou 74% [1,60; 1,65[ 7 7/23=0.30 ou 30% 12 0.52 ou 52% [1,65; 1,70[ 3 3/23=0.13 ou 13% 5 0.22 ou 22% [1,70; 1,75[ 2 2/23=0.09 ou 9% 2 0.09 ou 9% n= 23 Nesta tabela encontram-se as respostas para as seguintes questões: 1 qual é o número de alunos com alturas maiores ou iguais a 1,65m? Resp.- há 5 alunos com altura de 1,65m ou mais. 2. qual é a percentagem dos alunos maiores ou iguais a 1,55m? Resp.- - 74% dos alunos têm alturas iguais a 1,55 ou mais; 3. quantos alunos têm alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m? Resp.- -há 4 alunos com alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m; 4. qual é a percentagem do alunos que têm uma altura de 1,60m ou compreendida entre 1,60m e 1,65m? Resp.- - 30% dos alunos têm altura de 1,60m ou compreendida entre 1,60m e 1,65m. Licao No 6 1.2.2 Gráficos de Distribuição de Frequências Os gráficos constituem uma outra forma de representar dados. Comparativamente as tabelas, os gráficos são mais atractivos e facilitam a apreensão da mensagem. Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas situações. Neste estudo referir-se-ão: gráficos de barras, histograma, polígono de frequências e gráfico circular. Gráficos de Barras Os gráficos de barras utilizam-se essencialmente para dados simples (não agrupados). Estes gráficos são empregues muita das vezes para estabelecer comparações. No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. A partir dos dados da tabela de frequências das idades dos alunos da 10ª classe, vamos construir o gráfico de barras. Histograma ou diagrama em colunas Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas(horizontal) representam-se as classes e no eixo das ordenadas(vertical) as frequências. Polígono de Frequências Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da classe e sua respectiva frequência absoluta simples correspondente (no histograma). Gráficos Circulares (sectograma) Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais `a frequência correspondente. O gráfico circular costuma-se utilizar quando o número de categorias para a variável é pequeno (normalmente menor ou igual a seis-6) e, é especialmente adequado para estabelecer comparações entre diferentes valores do atributo em estudo. A amplitude de cada sector é determinada pela frequência relativa. Na tabela seguinte foram observadas 54 pessoas relativamente a cor dos olhos. Cor dos olhos Efectivos Azul Verde Cinzenta castanha 10 5 19 20 Vamos fazer uma tabela que nos permite calcular a percentagem e o ângulo correspondente a cada classificação. Cor dos olhos Efectivos (fi) Percentagem Ângulos (amplitude em graus) Azul `10 10/54=0,185… ou 18,5% 0,185x360o=66,66…=67º Verde 5 5/54=0,093 …ou 9,30% 0,093x360o = 33,33=33º Cinzenta 19 19/54=0,352… ou 35,2% 0,352x360o=126,66...=127º … castanha 20 20/54=0,370 …ou 37,0% 0,370x =1360o=133,33º …=133º n=54 Total=360º Distribuição da cor dos olhos de 54 pessoas Sumário Para organizar e representar dados, usam-se tabelas e gráficos. Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas situações. Podemos destacar os gráficos de barras, histograma, pictograma, polígono de frequências, sectograma ou polígono circular, etc… Os gráficos de barras utilizam-se essencialmente para dados simples (não agrupados). Estes gráficos são empregues muita das vezes para estabelecer comparações. No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. Os histogramas usam se para dados agrupados em classes. Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais `a frequência correspondente. O gráfico circular costuma-se utilizar quando o número de categoriaspara a variável é pequeno (normalmente menor ou igual a seis-6) e, é especialmente adequado para estabelecer comparações entre diferentes valores do atributo em estudo. A amplitude de cada sector é determinada pela frequência relativa. Exercícios 1. Considera a seguinte distribuição de frequências, relativas as comissões ganhas no último mês pelos vendedores de uma dada empresa: Comissões (em centenas de contos) [0;2[ [2;4[ [4;6[ [6;8[ [8;10[ [10;12[ [12;14[ No de trabalhadores 2 3 7 16 7 3 2 Construa o histograma, o polígono de frequências e polígono de frequências acumuladas. 2.Inquéritos realizados em 20 residências de diversas universidades de um determinado país trevelaram os seguintes valores para o número de estudantes de gestão por residência: No de estudantes 0-10 10-20 20-30 30-40 No de Residências 2 4 9 5 a) Encontre as frequências absoluta, relativa, absoluta acumulada e relativa acumulada; b) Construa o histograma; 3. Os vencimentos mensais, em mil meticais, dos 40 funcionáriosde uma empresa são os seguintes: 18 18 20 22 21 18 19 20 23 18 19 20 21 18 17 19 20 18 22 19 18 24 20 18 19 18 22 21 20 19 17 18 21 18 18 19 18 18 18 18 a) Indique a população, a variável e a unidade estatística desta distribuição; b) Elabore um quadro de distribuição de frequências; c) Construa um gráfico de barras que defina esta distribuição; d) Elabore um relatório de 2 linhas sobre esta distribuição 1.3 Medidas de localizaçao Introdução No capítulo anterior discutimos sobre a organização e apresentação de dados. Neste capítulo, você vai aprender alguns parâmetros que representam os fenómenos pelos seus valores médios, ou seja, valores em torno dos quais tendem a concentrar os dados. Esses parâmetros irão lhe auxiliar na fase de análise e descrição do fenómeno estatístico, é o caso da média aritmética, moda, mediana e separatrizes. Ao completar esta unidade, você será capaz de: Objectivos · Determinar a média, moda, mediana, quartís,decís e percentís ; · Interpretar as medidas de localização Terminologia Neste capítulo, você deverá prestar muita atenção aos seguintes conceitos: · Média aritmética · Moda; · Mediana e · Separatrizes. Licao No 7 1.3.1 Média Aritmética () Emprega-se a média quando desejamos obter uma medida de posição de maior estabilidade e quando houver necessidade de tratamento algébrico ulterior. Chama-se média aritmética ou média de um conjunto de números x1, x2, x3, …,xn e representa-se por e definido por: · Para dados simples 1º ) Ex. As alturas de 5 árvores são: 2,3,2,4,5 m. Calcular a média das alturas das árvores. · Para dados classificados se x1, x2, x3, …,xm ocorrem f1,f 2,…, fn vzeses respectivamente. Exemplo: consideremos a variável idade (em anos) dos alunos da 10ª classe cuja a distribuição é dada pela tabela: Xi(idade) 13 14 15 16 17 Fi 2 7 9 3 2 idade média é 14,83. · Para dados ponderados As vezes, associam se os números x1, x2, x3, …,xka certos factores de ponderação ou pesos w1,w2,…,wk que dependem do significado ou importância atribuída aos números. Neste caso: Exemplo: Um aluno obteve no primeiro bimestre em Estatística, respectivamente, 6, 7 e prova final 8 e os pesos das provas são respectivamente¨3,2 e 5. Achar a média final do 1º bimestre. Média aritmética ponderada Como as frequências são números indicadores da intensidade de cada valor, elas funcionam como factores de ponderação. · Para dados agrupados em classe =; ou Pmi=li+hc/2 onde, Pmi é o ponto médio de cada classe também chamado marca de classe é igual a semi-soma dos extremos da classe. Li –limite superior da classe li- limite inferior da classe e hc- amplitude da classe. Ex.Consideremos a variável altura(em metros) dos alunos de uma turma da 10ª classe. Alturas(em m) fi Xi fiXi [1,45; 1,50[ 2 1,475 2,95 [1,50; 1,55[ 4 1,525 6,10 [1,55; 1,60[ 5 1,575 7,875 [1,60; 1,65[ 7 1,625 11,375 [1,65; 1,70[ 3 1,675 5,025 [1,70; 1,75[ 2 1,725 3,45 n= 23 36,775 Pi= ,etc. = Para além da média aritmética, existem outros tipos de média como: média harmónica, média geométrica e média quadrática. 1.3.2 MEDIANA (Me) Mediana é um valor central de um rol, isto é, o valor que divide um conjunto de dados ordenados (crescente ou decrescente) em duas partes iguais. E representa-se por: Me ou Md ou . Sejam x1,x2,x3,…,xn, n dados estatísticos ordenados, se: · n é ímpar, o valor da variável que ocupa a posição central(mediana) é Me=Xk, com - posição do elemento mediana. · n é par, ; e Exemplo: Para dados simples Consideremos dois conjuntos de elementos: A={2,7,13,5,9,15,22} e B={7,16,2,10, 5,9} Determinemos a mediana de cada conjunto. Para o conjunto A: 1º ordenar os dados: A={2, 5, 7, 9, 13, 15, 22} 2º como n é impar, =, X4=Me=9 Para o conjunto B: 1º ordenar os dados: ={2, 5, 7,9, 10, 16} 2º neste caso, n é par, e k2=k1+1=3+1=4 assim, x3=7 e x4=9 Dados em tabelas não agrupados 1- se n é ímpar, Consideremos a tabela das idades dos alunos da duma turma da 10ª classe Idade(em anos) Xi Frequência fi Fi 13 2 2 14 7 9 15 9 18 16 3 21 17 2 23 n=23 , o número 12 indica a posição do elemento mediana e procura-se na Fi. E nesta posição encontramos a idade 15. Porque de 10 a 18 encontramos uma sequência de 15 2- se n é par Consideremos os dados da seguinte tabela: xi Fi Fi 33 6 6 45 11 17 87 17 34 88 9 43 91 5 48 N=48 e k2=k1+1=24+1=25. como se pode ver na tabela, de 18 a 34 encontramos uma sequência de 87 isto significa que na posição 24 e 25 temos o mesmo valor ou seja X24=X25=87 assim, coincidentemente, . Dados em tabelas agrupados em classe Para calcular a mediana em dados agrupados em classes usa-se a expressão onde lMe-limite inferior da classe mediana; - elemento mediano, n, pode ser par ou ímpar. ; fme- frequência absoluta da classe mediana h- amplitude da classe mediana, Fi ant-frequência absoluta acumulada a anterior a classe mediana. Ex. Consideremos a tabela-4 das alturas dos alunos da 10ª classe Alturas(em m) fi Fi [1,45; 1,50[ 2 23 [1,50; 1,55[ 4 21 [1,55; 1,60[ 5 17 [1,60; 1,65[ 7 12 [1,65; 1,70[ 3 5 [1,70; 1,75[ 2 2 n= 23 =23/2 =11,5, é o elemento mediano que indica a posição da classe mediana, e observando na tabela a coluna de Fi podemos ver que de 6 a 12 temos uma sequência da classe [1,60;1,65[. Logo na posição 11,5 temos classe mediana [1,60; 1,65[; lMe.=1,60, fMe-=7, h=0,05, Fi ant=5 1.3.3 MODA, NORMA OU MODO (MO) Chama-se moda de um conjunto de n dados, x1, x2, x3, …., xn, de uma variável estatística, ao dado que ocorre com maior frequência e representa se por Mo. Karl Pearson foi quem a introduziu em Estatística pela primeira vez no sec.XIX. No caso de idades, a moda é 15 anos. Para um conjunto de dados, pode existir mais do que uma ou até nem existir moda. · se num conjunto de dados existir uma moda, diz-se unimodal · se o conjunto de dados tiver duas modas, ele diz se bimodal · se o conjunto de dados tiver mais que duas modas, ele diz se multimodal ou plurimodal · se o conjunto de dados não tiver modas, ele diz se amodal. Ex. 4,1,3,5,7,4,3,1,5,7. Para dados agrupados em classes, utilizamos diversos processos na sua obtenção. Mas o primeiro passo é identificar a classe modal. Moda bruta É o processo mais elementar, basta tomar o ponto médio da classe modal. Processo de Czuber Leva em consideração as frequências anteriores e posteriores `a classe modal. ou seja: Onde: Moc- moda (processo de czuber); 1=fmax-fant ( diferença entre a frequência modal e a imediatamente anterior); 2=fmax-fpost (diferença entre a frequência modal e a imediatamente posterior); h- amplitude de classe; xMo- limite inferior da classe modal. Utilizando o processo gráfico,basta para isso, identificar a frequência absoluta da classe modal e as frequências absolutas simples anterior e posterior das duas classes adjacentes e seus respectivos limites inferior e superior. 0 xMoMo LMo classe Ex. Calcular a moda pelo processo Czuber, usando os dados da tabela das alturas dos alunos da 10ª classe. Dados: fmax=7; fant=5; fpost=3, xMo =1,60m , h=0,05m Numero de alunos ( 7 ) ( 6 ) ( 5 ) ( 4 ) ( 3 ) ( 2 ) ( 1 ) ( 1,45 ) ( 1,50 ) ( 1,55 ) ( 1,60 ) ( 1,65 ) ( 1,70 ) ( 1,75 ) Altura(m) Mo=1,62m Processo de King É considerada a influência sobre a classe modal das frequências das classes anterior e posterior. onde Mok- moda (processo de King); fpost- frequência absoluta simples posterior; fant- frequência absoluta simples anterior. Graficamente post. 0 xMo Mo LMo classe ant. Ex.: De acordo com os daos da tabela as alturas temos: fant=5; fpost=3, lMo =1,60m , h=0,05m Distribuição das alturas dos alunos da 10ª classe Número de alunos ( 1,45 1,50 1,55 1,60 1,70 1,75 ) ( 7 ) ( 6 ) ( 5 ) ( 4 ) fantt ( 3 ) ( 2 ) ( 1 ) ( 1,65 ) Altura(m) Fpost Mo=1,62m Processo de Pearson Este processo pressupõe que a distribuição seja aproximadamente simétrica, na qual a média aritmética e a mediana são levados em consideração. Obs. Nem sempre coincidem os valores da moda usando os diferentes processos. Nos dados agrupados em classe a moda é um valor provável dentro da classe modal comportando portanto uma certa margem de erro. 1.3.4 CONSIDERACÕES GERAIS SOBRE A MÉDIA, A MODA E A MEDIANA. A média é a medida de localização mais utilizada, embora em certos casos, a utilização da mediana ou da moda seja preferível. · A média é muito sensível a valores extremos; isto é, quando alteramos drasticamente de um dos dados a média varia consideravelmente. a)50 85 60 65 60 65 60 80 60 =65 b) 50 85 60 65 60 65 195 80 60 =80 · A mediana é preferível à média quando se está interessado em conhecer o ponto médio da distribuição, aquele valor que divide um rol de dados em duas partes iguais. · A moda revela a sua importância perante o estudo de caracteres qualitativos, já que tanto a média como a mediana são medidas aplicáveis apenas a caracteres quantitativos. A importância das medidas consideradas está dependente do tipo de variável estatística, da distribuição dos dados e do objectivo que se tem em vista. Das três medidas acima referidas, a mais importante é a média seguida da médiana e finalmente a moda. Na maioria dos estudos, o conhecimento das 3 medidas proporciona uma melhor descrição do fenómeno ou acontecimento. Vejamos resumidamente que relação existe entre estas três medidas quando temos representação através de um polígono de frequências. Curva Simétrica Curva Assimétrica Curva Assimétrica Positiva Negativa Me=Mo >Me>Mo <Me<Mo Em termos gráficos a curva simétrica apresenta as duas caudas com a mesma configuração. Neste caso, a distribuição diz-se normal e a média, mediana e a moda coincidem. Exemplo: Consideremos o problema dos vencimentos ( em milhares de meticais) dos empregados da empresa X. verifique se a distribuição é simétrica ou assimétrica: 500 700 600 600 1500 1700 2600 700 600 2000 600 ________________________________________________ Resolução: vencimentos Fi Fi 500 1 1 600 4 5 700 2 7 1500 1 8 1700 1 9 2000 1 10 2600 1 11 N=11 1º Tabela de frequências: 2º Média 3º Moda Mo=600 4º Mediana N é ímpar, assim, Me=X6=700 5º >Me>Mo, a distribuição é assimétrica positiva. Também se pode dizer que há muitos trabalhadores que recebem a baixo da média. Exercicios 1. As classificações obtidas, no 1º teste deste ano pelos 150 alunos do 2º ano de Ensino Básico de na disciplina de Estatística distribuem se da seguinte forma: Classificações: 7 8 9 10 11 12 13 14 15 16 17 No de alunos: 5 11 14 19 . 20 30 18 9 12 8 4 a) Indique a população e a variável estatística em estudo; b) Calcule a frequência relativa da classificação 8. c) Indique a percentagem de alunos que tiveram nota inferior a 10; d) Determine a nota média, a nota modal e a nota mediana. 2. . O chefe de estacão dos Caminhos de Ferro de uma dada localidade registou o atraso dos comboios, durante uma semana na seguinte tabela: Determine: A média, a moda e a mediana de atrasos. No. de minutos de atraso 0-5 5-10 10-15 15-20 20-25 25-30 No de combois 6 5 7 4 2 4 Licao No 8 1.3.5 Medidas separatrizes ( quartis, decis e Percentis) Os quartis são os valores que dividem um rol de dados em quatro partes iguais. X1 Q1 Q2=Me Q3 xn Q1(1ºquartil): é o valor que divide a sequência em duas partes de tal modo que, pelo menos, ¼ ou 25% das observações sejam inferiores ou iguais a esse valor e ¾ ou 75% das observações sejam superiores ou iguais a esse valor; Q2(2ºquartil): é o valor que divide a sequência em duas partes iguais de tal modo que , pelo menos, ½ ou 50%das observações sejam inferiores ou iguais a esse valor e 1/2 ou 50% das observações sejam superiores ou iguais a esse valor; o Q2 coincide com a mediana. Q3(3ºquartil):é o valor que divide a sequência em duas partes de tal modo que, pelo menos, ¾ ou 75% das observações sejam inferiores ou iguais a esse valor e ¼ ou 25% das observações sejam superiores ou iguais a esse valor; Os quartis proporcionam-nos informações acerca da distribuição interna dos dados. Cálculo de quartis Calcula-se qualquer dos quartis de forma idêntica ao cálculo da mediana, substituindo-se na fórmula desta, apenas a posição em que se encontra o elemento desejado. · Dados não agrupados em classe A posição do elemento quartil no conjunto ordenado é identificado pela expressão, , (i= 1,2 e 3); n é nº de observações. Ex1: dada a tabela seguinte calcular Q1, Q2 e Q3. ( Resolução: Q1-? Q1 1º) Q2 Q1 está entre x 5 e x 6 mas x 5 =x 6 =1, logo Q1=1 Q3 ou seja: Q1=x 5 +(x 6 -x 5 ).0,75=1+(1-1).0,25=1+0=1 2º) Q2-? ) xi Fi Fi 0 1 1 1 5 6 2 7 13 3 6 19 4 2 21 5 1 22 6 1 23 N=23 Q2 está entre x11 e x12mas logo Q2=2 ou seja: Q3? Q3 está entre e mas x17=x18=3 logo Q3=3 ou seja: Q3=x17+(x18-x17).0,75=3+(3-3).0,75=3+0=3 Ex2:Determinar a faixa salarial(distância do 1º ao 3º quartil) de 6 funcionários de certa empresa que ocupam o mesmo cargo. Salários em Mt: 5.500, 5.780, 6.120, 6.150, 6.620, 7.120. 1º) mas x1=5.500 e x2= 5.780 Q1=x1+(x2-x1).0,5 = 5.500+(5.780-5.500).0,5=5.640 Mt 2º) , x4= 6.150 e x5= 6.620. Q3= x4+(x5-x4).0,5 =6.150+(6.620-6.150).0,5=6.385 Mt Portanto a faixa salarial dos seis funcionários é de (5.640 a 6.385)Mt. · Para dados agrupados em classe A posição do elemento quartil no conjunto ordenado é identificado pela expressão, , i= 1,2 e 3; n é nº de observações. E li- limite inferior da classe de Qi; fclasse- frequência da classe do Qi. ( Resolução: Q1 1º) ; ; Q2 2º) , h=2, =27 e f Q1 =16 Q3 )Ex. Consideremos a tabela das notas dos alunos de 4 turmas da 8ªclasse. Calculemos Q1, Q2 e Q3. Notas fi Fi [0;2[ 27 27 [2;4[ 16 43 [4;6[ 34 77 [6;8[ 17 94 [8;10[ 16 110 N=110 Interpretação a) para Q1=2,06significa que em nosso exemplo, 25% dos alunos obtiveram nota 2,06 ou menos; b) para Q2=4,7 significa que 50% dos alunos obtiveram notas 4,7 ou menos; c) para Q3=6,65 significa que 75% dos alunos obtiveram notas 6,65 ou menos. Diagrama de Extremos e Quartis (Box-Plot ou Caixa de Bigod) Quando uma distribuição é marcadamente assimétrica, tem interesse organizar um diagrama de extremos e quartis. Uma vez calculados os quartis e considerando os valores extremos; isto é, o valor máximo e mínimo de uma variável estatística, podemos construir o diagrama de extremos e quartis, vejamos um exemplo: Calcular Q1, Me e Q3 d conjunto de notas de cada uma das disciplinas: Matemática: 2 5 8 8 8 9 11 11 12 13 14 Geografia: 4 7 89 11 14 15 16 16 17 18 História: 5 9 10 10 1112 12 12 13 14 14 Q1 Me=Q2 Q3 Para construir diagrama de extremos e quartis, começamos por desenhar uma linha vertical onde assinalamos os valores da variável. Primeiro, marcamos na linha, os valres extremos máximo e mínimo e, em seguida, assinalámos Q1, Me e Q3. construimos a «caixa» ou seja «Box-Plot» correspndente a intervalo de extremos Q1 e Q3. Os diagramas de extremos e quartis permitem uma visualização da distribuição das notas nas três disciplinas, pondo em distaque: 1- diferença na amplitude total( na História há menor diferença na amplitude total); 2- diferença na Mediana ( o valor central mais elevado diz respeito à disciplina de Geografa); 3- diferença nos intervalos interquartis(Q3, Q1 dentro de cada «caixa»estão pelo menos 50% das classificações respectivas; 4- na disciplina de História( a «caixa» é mais pequena ) existe uma maior concentração de 50% das notas em torno da mediana; 5- nas disciplinas de Geografia e História há uma grande concentração de valores acima da mediana; 6- na disciplina de Matemática há uma maior dispersão das notas inferiores ou iguais a Q1 do que das notas superiores ou iguais a Q3. Notas ( 18 16 14 12 10 8 6 4 2 0 0 0 Matemática Geografia História ) Decil (Di) Divide a distribuição em dez partes iguais em um conjunto ordenado de valores. Assim podemos ter: D1, D2, D3,....., D9. Para dados agrupados em classe Façamos, onde i=(1,2,3,..., 9), asim: Exemplo: Com os dados da tabela anterior, de notas dos alunos das 4 turmas da 8ªclasse, determinar D2, D5 e D7. As posisões dos elementos desejados são: ªposição, ªposição ª posição ; ; Interpretação · Para D2=1,63 significa, em nosso exemplo que 20% dos alunos obtiveram notas 1,63 ou menos; · Para D5=4,70 significa que 50% dos alunos obtiveram notas 4,7 ou menos; · Para D7=6,00 significa que 70% dos alunos obtiveram notas 6,0 ou menos. Centil ou Percentil (Ci) Divide a distribuição em cem partes iguais em um conjunto ordenado de valores. Assim podemos ter: C1, C2, C3,....., C99. Para dados agrupados em classe Façamos, onde i=(1,2,3,..., 99), asim: Exemplo: Ainda com base na tabela do exercicio anterior, determinar C25, C50 e C75 e fazer a respectiva interpretação. ªposição; ªposição; ªposição ; ; Interpretação · Para C25=2,06 significa, em nosso exemplo que 25% dos alunos obtiveram notas 2,06 ou menos; · Para C50=4,70 significa que 50% dos alunos obtiveram notas 4,7 ou menos; · Para C75=6,65 significa que 75% dos alunos obtiveram notas 6,65 ou menos. Obs:Calcula-se qualquer dos quartis, decil e centil de forma idêntica ao cálculo da mediana, substituindo-se na fórmula desta, apenas a posição em que se encontra o elemento desejado Exercício Um professor de Português obteve para o mesmo teste os seguintes resultados, em duas turmas (o teste foi cotado de 0 a 20). Turma -1: __________________________________ 10 13 16 17 18 12 12 13 14 14 15 16 16 17 17 17 18 17 18 ---------------------------------------------------- Turma-2: ____________________________________ 3 18 5 7 9 12 13 12 10 8 8 12 10 6 9 11 17 12 13 ------------------------------------------------------ a) escreve as classificações, por ordem crescente, para cada uma das turmas. b) Determine a mediana, o 1º quartil e o 3º quartil para cada uma das turmas. c) Indique a amplitude total e a amplitude interquartis da turma -1. d) Elabore os respectivos diagramas de extremos e quartis e interprete-os, referindo: · A posição relativa a mediana; · A distriuição das notas no intervalo interquartis. Sumário Emprega-se a média quando desejamos obter uma medida de posição de maior estabilidade e quando houver necessidade de tratamento algébrico ulterior. Para além da média aritmética, existem outros tipos de média como: média harmónica, média geométrica e média quadrática. Mediana é um valor central de um rol, isto é, o valor que divide um conjunto de dados ordenados (crescente ou decrescente) em duas partes iguais. E representa-se por: Me ou Md ou . Chama-se moda de um conjunto de n dados, x1, x2, x3, …., xn, de uma variável estatística, ao dado que ocorre com maior frequência e representa se por Mo. Karl Pearson foi quem a introduziu em Estatística pela primeira vez no sec.XIX. Para dados agrupados em classes, utilizamos diversos processos na sua obtenção. Mas o primeiro passo é identificar a classe modal. Moda bruta é o processo mais elementar, basta tomar o ponto médio da classe modal. Processo de Czuber, leva em consideração as frequências anteriores e posteriores `a classe modal. Processo de King é considerada a influência sobre a classe modal das frequências das classes anterior e posterior Processo de Pearson, este processo pressupõe que a distribuição seja aproximadamente simétrica, na qual a média aritmética e a mediana são levados em consideração. Obs. Nem sempre coincidem os valores da moda usando os diferentes processos. Nos dados agrupados em classe a moda é um valor provável dentro da classe modal comportando portanto uma certa margem de erro. A média é a medida de localização mais utilizada, embora em certos casos, a utilização da mediana ou da moda seja preferível. A importância das medidas consideradas está dependente do tipo de variável estatística, da distribuição dos dados e do objectivo que se tem em vista Na maioria dos estudos, o conhecimento das 3 medidas proporciona uma melhor descrição do fenómeno ou acontecimento. Os Quartis são os valores que dividem um rol de dados em quatro partes iguais Q1,Q2 e Q3. Os quartis proporcionam-nos informações acerca da distribuição interna dos dados. Os Decis, dividem a distribuição em dez partes iguais em um conjunto ordenado de valores. Assim podemos ter: D1, D2, D3,....., D9. Centil ou Percentil (Ci), dividem a distribuição em cem partes iguais em um conjunto ordenado de valores. Assim podemos ter: C1, C2, C3,....., C99. Exercicios de Auto-avaliação 1. Na figuraque está representado um histograma que mostra a pontuação obtida num exame escrito. Terão de prestar o exame oral os alunos que obtiveram pontuação inferior a 70. ( No. de Estudantes ) ( Resultados de um exame ) ( 2 ) ( 6 ) ( 4 )no 10 20 30 40 50 60 70 80 90 pontuacão a) quantos alunos dispensaram do exame oral? b) qual a percentagem de alunos que obtiveram pontuação inferior a 50? 1. Construa umgráfico circular indicando a percentagem relativa a cada sector de acordo com os dados da tabela que indica tipo de transporte utilizado por 90 pessoas, quando se deslocam para o trabalho: Meio de transporte No. de pessoas Carro 32 Autocarro 38 Comboio 12 Motorizada 6 2. Os empregados do ministério do Turismo estão num sistema de horário flexível: eles podem começar seu dia de trabalho às 7h, 7:30h, 8h, 8:30h ou 9h. Os seguintes dados
Compartilhar