Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Aplicada Estatística Aplicada Adriana Santos Augusto 2ª e di çã o Estatística Aplicada DIREÇÃO SUPERIOR Chanceler Joaquim de Oliveira Reitora Marlene Salgado de Oliveira Presidente da Mantenedora Jefferson Salgado de Oliveira Pró-Reitor de Planejamento e Finanças Wellington Salgado de Oliveira Pró-Reitor de Organização e Desenvolvimento Jefferson Salgado de Oliveira Pró-Reitor Administrativo Wallace Salgado de Oliveira Pró-Reitora Acadêmica Jaina dos Santos Mello Ferreira Pró-Reitor de Extensão Manuel de Souza Esteves Pró-Reitor de Pós-Graduação e Pesquisa Marcio Barros Dutra DEPARTAMENTO DE ENSINO A DISTÂNCIA Gerência Nacional do EAD Bruno Mello Ferreira Gestor Acadêmico Diogo Pereira da Silva FICHA TÉCNICA Direção Editorial: Diogo Pereira da Silva e Patrícia Figueiredo Pereira Salgado Texto: Adriana Santos Augusto Revisão: Lívia Antunes Faria Maria e Walter P. Valverde Júnior Projeto Gráfico e Editoração: Andreza Nacif, Antonia Machado, Eduardo Bordoni e Fabrício Ramos Supervisão de Materiais Instrucionais: Janaina Gonçalves de Jesus Ilustração: Eduardo Bordoni e Fabrício Ramos Capa: Eduardo Bordoni e Fabrício Ramos COORDENAÇÃO GERAL: Departamento de Ensino a Distância Rua Marechal Deodoro 217, Centro, Niterói, RJ, CEP 24020-420 www.universo.edu.br Ficha catalográfica elaborada pela Biblioteca Universo – Campus Niterói Bibliotecária: Elizabeth Franco Martins – Crb 7/4990 © Departamento de Ensino a Distância - Universidade Salgado de Oliveira Todos os direitos reservados. Nenhuma parte desta publicação pode ser reproduzida, arquivada ou transmitida de nenhuma forma ou por nenhum meio sem permissão expressa e por escrito da Associação Salgado de Oliveira de Educação e Cultura, mantenedora da Universidade Salgado de Oliveira (UNIVERSO). A923e Augusto, Adriana Santos. Estatística aplicada / Adriana Santos Augusto ; revisão de Lívia Antunes Faria Maria e Walter P. Valverde Júnior. 2. ed. – Niterói, RJ: UNIVERSO, 2011. 242 p. ; il. 1. Estatística aplicada. 2. Gráficos estatísticos. 3. Medidas estatísticas. 4. Amostragem (Estatística). I. Maria, Lívia Antunes Faria. II. Valverde Júnior, Walter P. III. Título. CDD 519.5 Estatística Aplicada Palavra da Reitora Acompanhando as necessidades de um mundo cada vez mais complexo, exigente e necessitado de aprendizagem contínua, a Universidade Salgado de Oliveira (UNIVERSO) apresenta a UNIVERSO EAD, que reúne os diferentes segmentos do ensino a distância na universidade. Nosso programa foi desenvolvido segundo as diretrizes do MEC e baseado em experiências do gênero bem-sucedidas mundialmente. São inúmeras as vantagens de se estudar a distância e somente por meio dessa modalidade de ensino são sanadas as dificuldades de tempo e espaço presentes nos dias de hoje. O aluno tem a possibilidade de administrar seu próprio tempo e gerenciar seu estudo de acordo com sua disponibilidade, tornando-se responsável pela própria aprendizagem. O ensino a distância complementa os estudos presenciais à medida que permite que alunos e professores, fisicamente distanciados, possam estar a todo momento ligados por ferramentas de interação presentes na Internet através de nossa plataforma. Além disso, nosso material didático foi desenvolvido por professores especializados nessa modalidade de ensino, em que a clareza e objetividade são fundamentais para a perfeita compreensão dos conteúdos. A UNIVERSO tem uma história de sucesso no que diz respeito à educação a distância. Nossa experiência nos remete ao final da década de 80, com o bem- sucedido projeto Novo Saber. Hoje, oferece uma estrutura em constante processo de atualização, ampliando as possibilidades de acesso a cursos de atualização, graduação ou pós-graduação. Reafirmando seu compromisso com a excelência no ensino e compartilhando as novas tendências em educação, a UNIVERSO convida seu alunado a conhecer o programa e usufruir das vantagens que o estudar a distância proporciona. Seja bem-vindo à UNIVERSO EAD! Professora Marlene Salgado de Oliveira Reitora Estatística Aplicada Estatística Aplicada Sumário 1. Apresentação da disciplina ....................................................................................... 07 2. Plano da disciplina ..................................................................................................... 09 3. Unidade 1 – Elementos de Estatísticas Descritiva.................................................. 11 4. Unidade 2 – Representação Gráfica ......................................................................... 49 5. Unidade 3 – Medidas de Tendência Central ........................................................... 63 6. Unidade 4 – Medidas de Dispersão ........................................................................ 85 7. Unidade 5 – Noções de Amostragem ..................................................................... 103 8. Unidade 6 – Cálculo das Probabilidades. ................................................................ 121 9. Unidade 7 – Distribuição . ......................................................................................... 141 10. Unidade 8 – Correlação e Regressão. ...................................................................... 171 11. Considerações finais .................................................................................................. 187 12. Conhecendo o autor .................................................................................................. 189 13. Referências .................................................................................................................. 191 14. Anexos ......................................................................................................................... 193 Estatística Aplicada 6 Estatística Aplicada 7 Apresentação da Disciplina Caro aluno, Seja bem-vindo à disciplina Estatística Aplicada. Muitos falam em estatística, mas poucos sabem o que é e para que ela serve. A estatística é um ramo da matemática aplicada que desempenha um papel fundamental para a compreensão da realidade. Ela nos fornece métodos para coleta, organização, análise e interpretação de dados para posterior utilização dos mesmos em tomada de decisões. Na Antigüidade, assim como hoje, os povos mantinham um registro permanente do número de habitantes, nascimentos e óbitos. O que faziam ainda não tinha nome. A palavra ESTATÍSTICA surgiu na Idade Média, quando as informações eram tabuladas com finalidades bélicas e tributárias, ou seja, sua importância maior era servir ao Estado, daí o nome. A estatística será de grande utilidade para você, pois é uma ferramenta indispensável não só nos negócios, mas em todas as ciências, afinal de contas, você poderia imaginar o mundo de hoje sem registros numéricos? Já se deu conta da facilidade com que "projetamos" o futuro muito antes de ele acontecer? E isso acontece em todos os ramos da nossa vida. Assim, desejamos que você realize um ótimo estudo e, lembre-se: a aprendizagem é infinita! Utilize nossas referências bibliográficas para aprofundar e engrandecer seus conhecimentos sobre os assuntos aqui estudados, pois isso lhe acrescentará muito, não só como aluno, mas também como profissional e cidadão. Tenha um excelente estudo! Sucesso! Estatística Aplicada 8 Estatística Aplicada 9 Plano da Disciplina A disciplina Estatística possui objetivos próprios no que diz respeito ao processo ensino-aprendizagem, desenvolvendo competências e habilidades necessárias à formação de futuros profissionais que atuarão na sociedadecontemporânea. São objetivos gerais da disciplina: capacitar o aluno para o uso da metodologia estatística mediante aplicação de técnicas de análise estatística de dados, de projeção e metodologia de tomada de decisão; utilizar os conceitos e o conteúdo prático dos Métodos Quantitativos aplicados para o desenvolvimento de trabalhos pedagógico-científicos e proporcionar melhor aplicabilidade interdisciplinar durante o exercício do curso. O conteúdo programático foi divido em oito unidades que abordarão desde os Elementos da Estatística Descritiva até a Correlação e Regressão. Seguiremos, agora com a apresentação de cada unidade: Unidade 1 – Elementos da Estatística Descritiva Objetivo: identificar conceitos básicos da disciplina; compreender o que é exatamente a estatística e para que ela serve; interpretar um levantamento estatístico; conhecer as séries estatísticas; trabalhar os dados estatístico através da montagem de uma distribuição de freqüências. Unidade 2 – Representação Gráfica Objetivo: construir e analisar os gráficos que você tanto conhece e que fazem parte da sua vida cotidiana. Unidade 3 – Medidas de Tendência Central Objetivo: compreender as medidas de tendência central e calculá-las para dados não agrupados e dados agrupados em classes de freqüências. Estatística Aplicada 10 Unidade 4 - Medidas de Disperção Objetivo: compreender as medidas de dispersão, calcular essas medidas para dados não agrupados e dados agrupados em classes de freqüências. Unidade 5 - Noções de Amostragem Objetivo: conhecer mais sobre o cálculo e os tipos de amostra e os métodos probabilísticos. Unidade 6 - Cálculo das Probabilidades Objetivo: caracterizar os experimentos aleatórios; calcular as possibilidades de acontecimento de tais experimentos, a chance de um evento ocorrer ou não, ou seja, a probabilidade de sucesso ou insucesso. Unidade 7- Distribuição de Probabilidade Objetivo: identificar e calcular problemas relacionados à contagem – Distribuição Binomial; identificar e calcular problemas relacionados a espaços amostrais contínuos e às variáveis contínuas – Distribuição Normal. Unidade 8 – Correlação e Regressão Objetivo: ajustar uma reta a um conjunto de dados e determinar a equação da reta que constitui o melhor ajuste; calcular e classificar o grau de correlação existente entre duas variáveis. Estatística Aplicada 11 Elementos de Estatística Descritiva Conceitos básicos da Estatística Séries estatísticas Distribuição de frequências 1 Estatística Aplicada 12 Nesta primeira unidade, estudaremos o que é o método estatístico, bem como as suas fases. Aprenderemos as definições de variável, população e amostra, assim como algumas técnicas para o cálculo de uma amostra. Também iremos estudar as séries estatísticas e a distribuição de frequências . OBJETIVOS DA UNIDADE: Identificar conceitos básicos da disciplina. Compreender o que é exatamente a estatística e para que ela serve. Interpretar um levantamento estatístico. Conhecer as séries estatísticas. Trabalhar os dados estatístico através da montagem de uma distribuição de frequências. PLANO DA UNIDADE : Conceitos básicos da estatística Séries estatísticas Distribuição de frequências Bem-vindo à primeira unidade de estudo Estatística Aplicada 13 Conceitos Básicos Estatísticas são feitas todos os dias em jornais e revistas, algumas vezes por órgãos que não conhecemos e que não sabemos se são confiáveis ou não. O dia-a- dia de um cidadão está cheio de “armadilhas” espalhadas na mídia de modo a levá- lo a percorrer caminhos nem sempre corretos. Para não cair nessas “armadilhas”, a primeira coisa que devemos saber é distinguir os dois tipos de estatística - a que envolve a contagem pura e simples, como o censo da população, feito de tempos em tempos pelo IBGE e a calculada por amostragem, como, por exemplo, as pesquisas sobre a intenção de voto. A decisão quanto à metodologia a ser utilizada, se recenseamento ou amostra, vai depender principalmente dos custos e do tempo para apuração dos dados. É óbvio que o ideal seria consultar toda a população, porém isso custa caro e nem sempre os recursos existentes são suficientes para isso. Por isso, normalmente utiliza-se a pesquisa amostral. Deve-se saber também que há algumas regras básicas empregadas na "contabilidade" e na generalização dos dados obtidos. A coleta, a organização, a descrição, o cálculo, a análise e interpretação dos coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto que a análise e a interpretação dos dados amostrais, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, que se fundamenta na teoria da probabilidade e é muito útil na análise de jogos, entre outros. Por exemplo, não é preciso provar todas as caixas de bombom produzidas numa fábrica para se saber se o chocolate é bom. A amostragem nos permite mensurar o que queremos apenas sobre uma parcela pequena de determinada “população”, denominada amostra e utilizar essa informação para fazer inferência sobre toda a população. Estatística Aplicada 14 MÉTODO ESTATÍSTICO Método: é o meio mais eficaz para atingir determinada meta. Dos métodos científicos destacamos o método experimental e o método estatístico. Método Experimental: consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. Em laboratório é fácil mantermos constantes, por exemplo, a pressão e variarmos a temperatura para estudar o efeito dessa variação . Método Estatístico: diante da impossibilidade de manter as causas constantes, admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex.: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? É um método muito usado nas ciências sociais, pois seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. FASES DO MÉTODO ESTATÍSTICO Definição do Problema O que exatamente se pretende pesquisar? Ou seja, é preciso definir corretamente o problema. Estatística Aplicada 15 Planejamento Como levantar informações ? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censo? Amostragem? Qual é o cronograma de atividades? Quais são os custos envolvidos no processo? Coleta É o registro de dados com um objetivo determinado. A coleta de dados pode ser Direta ou Indireta. Coleta Direta: é feita pelo próprio pesquisador (censo) ou através de registros permanentes quando é obtida diretamente da fonte. Ex: empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. A coleta direta de dados pode ser classificada quanto ao fator tempo em contínua, periódica ou ocasional. Coleta Contínua: quando é feita continuamente. Ex.: registros de nascimento, óbitos, casamentos; Coleta Periódica: quando é feita em intervalos constantes de tempo. Ex.: censo (de 10 em 10 anos); Coleta Ocasional: quando é feita a fim de atender a uma emergência. Ex.: coleta de dados epidemiológicos. Coleta Indireta: é feita por deduções a partir de dados que são conhecidos, conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcionalização. Estatística Aplicada 16 Quanto aos dados coletados, ou seja, a matéria-prima sobre a qual iremos aplicar os métodos estatísticos, eles podem ser primários ou secundários. Dados primários: quandosão publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE. Dados secundários: quando são publicados por outra organização. EXEMPLIFICANDO Quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. IMPORTANTE Trabalhar com fontes primárias é sempre mais seguro! Crítica Os dados coletados devem ser cuidadosamente criticados para evitar erros que possam vir a alterar os resultados. Ex.: numa pesquisa feita numa academia perguntou-se o peso dos atletas. Resposta: 765 kg. É obvio que houve algum tipo de erro na coleta do dado, este deve ser, então, descartado. Estatística Aplicada 17 Apuração É a organização dos dados obtidos na coleta, através de sua contagem e agrupamento. Apresentação dos Dados Há duas formas de apresentação. A apresentação tabular segundo regras práticas fixadas pelo Conselho Nacional de Estatística e a apresentação gráfica dos dados. Uma não exclui a outra. Análise dos Resultados Esta é a última fase do método estatístico. Refere-se ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Nesta etapa obteremos conclusões sobre o todo (população), a partir das informações fornecidas pela parte que representa o todo (amostra). População ou Universo Estatístico É o conjunto total de elementos portadores de pelo menos uma característica em comum. Ex.: o universo dos alunos de uma escola. Variáveis Variável é o conjunto de resultados possíveis de um fenômeno. Ex.: sexo, cor da pele, idade...Pode ser classificada de variável quantitativa ou variável qualitativa. Variável Qualitativa: quando seu valores são expressos por atributos: sexo, cor da pele,etc. Estatística Aplicada 18 Variável Quantitativa: quando os dados são de caráter quantitativo, e o conjunto dos resultados possui uma estrutura numérica, se divide em variável discreta e variável contínua. Variável Discreta ou Descontínua: seus valores são expressos geralmente através de números inteiros não-negativos. Resulta normalmente de contagens. Ex: número de filhos de um casal - pode assumir valores como 0; 1; 2; 3;..., mas nunca valores como: 1,5; 3,72; etc. Variável Contínua: pode assumir qualquer valor entre dois limites, ou seja, assume valores em um intervalo real. Resulta normalmente de uma mensuração, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: temperatura. Normalmente as medições dão origem a variáveis contínuas e as contagens a variáveis discretas. Amostragem Amostra é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre essa população. É um subconjunto finito de uma população. Uma amostra deve ser cuidadosamente planejada a fim de garantir a menor margem de erro na pesquisa. A margem de erro é um intervalo controlado dentro do qual podem variar os resultados finais. Nenhum levantamento estatístico feito por amostragem é perfeito, ou melhor dizendo, um estudo bem planejado não elimina o erro, apenas o limita. Estatística Aplicada 19 Para selecionar uma amostra é preciso levar em conta as características de distribuição física da população, ou seja, algumas áreas têm uma população maior que outras. É preciso levantar os dados em proporção à densidade populacional das regiões. Por exemplo, se o objeto de estudo é o tipo de programa de TV mais assistido, não adianta fazer o estudo apenas em uma turma de escola de educação infantil, pois o resultado obviamente seria desenho animado. Crianças não costumam assistir a telejornais ou a filmes da madrugada. Se a pesquisa fosse feita dessa forma, o resultado não estaria correto. Assim, no caso de uma população ser composta de 35% de crianças, 40% de adultos e os outros 25% de idosos, uma amostra dessa população também deve conter crianças, adultos e idosos na mesma proporção. Amostragem Casual ou Aleatória Simples É o processo mais utilizado. Equivale a um sorteio lotérico. Pode ser realizada da seguinte forma: numera-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, n números dessa sequência, que corresponderão aos elementos pertencentes da amostra. EXEMPLIFICANDO Obter uma amostra de 10% dos 580 alunos de uma escola: 1º - numeramos os alunos de 1 a 580. 2º - escrevemos os números dos alunos de 1 a 580 em pedaços iguais de papel, colocamos na urna e após mistura, retiramos, um a um, cinquenta e oito números que formarão a amostra. Estatística Aplicada 20 IMPORTANTE Quando o número de elementos da amostra é muito grande como neste caso, esse tipo de sorteio é muito trabalhoso. Então, utiliza-se uma tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas. Amostragem Proporcional Estratificada: Quando a população se divide em estratos (subconjuntos da população), é imprescindível que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos. EXEMPLIFICANDO Vamos obter uma amostra proporcional estratificada, de 10%, dos pacientes internados em um SPA. Supondo que sejam 106 mulheres e 54 homens. São, portanto, dois estratos (sexo masculino e sexo feminino). Logo, temos: SEXO POPULAÇÃO 10 % AMOSTRA MASCULINO 54 5,4 5 FEMININO 106 10,6 11 Total 160 16 16 Numeramos, então, os pacientes de 01 a 160, sendo 01 a 54 homens e 55 a 160, mulheres e procedemos o sorteio casual com urna ou tabela de números aleatórios, que será vista na unidade VII. Estatística Aplicada 21 IMPORTANTE No caso da tabela acima, estamos selecionando uma amostra composta por pessoas, portanto não podemos selecionar 5,4 pessoas do sexo masculino. Devemos, então, “arredondar” o número 5,4 para um número inteiro, ou seja, 5. Dúvidas no arredondamento? Existem duas formas de representar um número quando não podemos representá-lo com todos os seus dígitos, o truncamento e o arredondamento. O truncamento - Truncar um número é “quebrá-lo” de acordo com o número de dígitos que queremos representar. EXEMPLIFICANDO Representar os números abaixo com apenas dois dígitos. 27,283 → 27 27,575 → 27 27,897 → 27 Em todos os casos o número será representado da mesma forma, não importando o tamanho do erro. Erro- Toda vez que um número não é representado com todos os seus algarismos, estamos cometendo um erro. Por exemplo: ao aproximarmos o número 2,7 para 3 estamos aumentando esse número em 0,3 (erro!), ou então, ao aproximarmos o número 2,2 para 2 estamos diminuindo esse número em 0,2 (erro!). O erro cometido deve ser o menor possível!!! Estatística Aplicada 22 Arredondamento - Para arredondar um número, devemos seguir a seguinte regra: Observe o primeiro algarismo que será “descartado”. Se esse algarismo for 0, 1, 2, 3 ou 4 mantemos a mesma ordem. Se esse algarismo for 5, 6, 7, 8 ou 9, aumentamos a ordem em 1. EXEMPLIFICANDO Arredondar os números abaixo para duas casas decimais. 2,232 → 2,23 2,235 → 2,24 Amostragem Sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de sorteio. EXEMPLIFICANDO Suponhamos um prédio com 200 apartamentos, dos quais desejamos obter uma amostra formada por 20 apartamentos para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: como 200/20 = 10, escolhemos por sorteio casual um número de 01 a 10, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 10 em 10. Assim,suponhamos que o número sorteado fosse 6, a amostra seria: 6o apartamento, 16o apartamento, 26o apartamento, etc. Até aqui, vimos como se faz um levantamento estatístico, o que é e para que serve. Vimos ainda como é selecionada uma amostra e qual a importância desta. Veremos agora o que são séries estatísticas Estatística Aplicada 23 Vamos, então, passo a passo. Você sabe o que é uma tabela ? TABELA - É um quadro que resume um conjunto de observações organizados segundo linhas e coluna Veja o exemplo de tabela abaixo : Ex.: Equipamentos existentes, disponíveis ao SUS, por tipo, segundo as grandes regiões – Brasil - 2002 IMPORTANTE O lado direito e esquerdo de uma tabela oficial deve ser aberto. Na construção das tabelas, devemos colocar: um traço horizontal ( - ) quando o valor for zero; Estatística Aplicada 24 três pontos ( ... ) quando não tivermos os dados; zero ( 0 ) quando o valor for muito pequeno em relação à unidade utilizada; um ponto de interrogação quando não tivermos certeza quanto à exatidão de determinado valor. Agora que você já sabe o que é uma tabela e como construí-la vamos conhecer as séries estatísticas . Série Estatística É uma tabela que apresenta um conjunto de dados estatísticos em função da época, local ou espécie. TIPOS DE SÉRIES ESTATÍSITICAS SÉRIES HOMÓGRADAS São as séries em que a variável estudada é discreta, ou seja, não contínua. Pode ser temporal, geográfica ou específica. Série Temporal: o que está em estudo é o fator tempo. O local e a espécie são elementos fixos. Estatística Aplicada 25 ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS PERÍODO UNIDADES 1O/2002 300 2O/2002 250 1O/2003 225 2O/2003 289 1O/2004 352 2O/2004 458 TOTAL 1874 Fonte: dados fictícios. Série Geográfica: o que está em estudo é o fator geográfico. A época e a espécie são elementos fixos. ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS - 2004 FILIAIS UNIDADES São Paulo 356 Rio de Janeiro 229 Curitiba 225 TOTAL 810 Fonte: dados fictícios. Série Específica: a variável em estudo é o fator ou a espécie. ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS - 2004 TIPO UNIDADES ARTEFATOS EM BRONZE 365 TELAS 445 TOTAL 810 Fonte: dados fictícios. Estatística Aplicada 26 SÉRIES CONJUGADAS OU TABELAS DE DUPLA ENTRADA: apresentam duas ou mais séries em uma mesma tabela, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica temporal. ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS FILIAIS 2003 2004 São Paulo 236 356 Rio de Janeiro 153 229 Curitiba 125 225 TOTAL 514 810 Fonte: dados fictícios. Conhecidas as séries estatísticas, vamos estudar agora a distribuição de frequências, em que aprenderemos a organizar os dados coletados através ou não da amostra, faremos também uma breve revisão de como calcular porcentagem. Vamos em frente ! Mas, afinal, o que é uma distribuição de frequências? A distribuição de frequências é um tipo de tabela que condensa uma série de dados de acordo com a repetição de seus valores (frequências). Estatística Aplicada 27 1. Dados brutos ou Tabela primitiva Trata-se de uma relação de elementos ou tabela que não foram numericamente organizados. São os dados coletados sem nenhuma arrumação. Apenas olhando para os números, é difícil ter uma ideia do comportamento da amostra. Não sabemos, por exemplo, quem é o menor, quem é o maior, quais são os números que mais se repetem, etc. EX.: 25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31 2. ROL Se olharmos no dicionário veremos como definição que o rol é a relação obtida após a ordenação dos dados (crescente ou decrescente). Ordenando os dados podemos ter uma ideia melhor do comportamento da amostra. Percebemos, desta forma, os dados que mais se repetem, os que aparecem menos, quem é o menor deles e quem é o maior, etc. EX.: 21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40 3. Os tipos de distribuição de freqüência Distribuição de frequência sem intervalos de classe Essa distribuição é usada quando o número de dados diferentes que aparecem é pequeno. Trata-se de uma simples condensação dos dados, conforme as repetições de seu valores. No exemplo dado, ao invés de escrevermos o número 21 três vezes, escrevemos apenas uma e indicamos que ele se repete três vezes, ou seja, a frequência do número 21 é igual a três. Estatística Aplicada 28 EX.: Tabela Primitiva Distribuição de frequência com intervalos de classe Quando o tamanho da amostra é grande, com vários números diferentes se repetindo, uma tabela de distribuição de frequências como a vista acima seria muito longa (comprida). Dessa forma, agrupamos os valores em vários intervalos de classe, diminuindo o tamanho da tabela. Dados Frequência 21 3 22 2 23 1 24 1 25 1 26 2 30 2 31 1 32 1 34 1 37 1 38 2 40 2 Total 20 Estatística Aplicada 29 No exemplo dado, temos: i Classes Frequências 1 21 | 25 7 2 25 | 29 3 3 29 | 33 4 4 33 | 37 1 5 37 | 41 5 Total 20 Como você já deve ter percebido, a Estatística utiliza alguns nomes que talvez lhe sejam desconhecidos. Mas, a partir de agora, com certeza, você os aprenderá. Afinal de contas, é para isto que estamos aqui: para ensinar e também aprender! NOMECLATURAS CLASSE (i) É cada um dos intervalos de variação da variável analisada. Ex.: na tabela anterior, a 3ª classe, simbolizada por i = 3, varia de 29 até 33, ou seja, (29 | 33). O símbolo | significa intervalo aberto à direita e fechado à esquerda, ou seja, nessa classe estão contidos os valores de 29 (inclusive) até 33 (exclusive). Por exemplo, dado o número 33 do ROL, este não pertence a classe 3 e sim a classe 4 representada por 33 | 37. Sempre utilizaremos o intervalo fechado à esquerda e aberto à direita. Estatística Aplicada 30 4.2. LIMITES DE CLASSE Os limites de classe são os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li ). No intervalo 29 | 33, l3 = 29 e L3 = 33. 4.3. AMPLITUDES Aqui, podemos citar a amplitude do intervalo de classe, a amplitude amostral e amplitude total da distribuição. Vejamos, então, cada uma delas. AMPLITUDE DO INTERVALO DE CLASSE (hi) É calculado após conhecermos o valor de i (nº de classes) e o valor de AA (amplitude amostral). i AA hi Se a distribuição por classes já estiver construída, nesse caso, hi = Li - li, ou seja, a diferença entre os limites de cada classe. Ex.: na tabela anterior. h1 = 25-21=4 h2 = 29-25=4 h3 = 33-29=4 h4 = 37-33=4 h5 = 41-37=4 IMPORTANTE Na distribuição de frequência com classe, devemos sempre que possível ter hi igual em todas as classes. Estatística Aplicada 31 AMPLITUDE AMOSTRAL (AA = Xmáx - Xmin) Trata-se da diferença entre o valor máximo e o valor mínimo da amostra (ROL). No nosso exemplo: AA=40-21=19. AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT = L(max) - l(min)) É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. EX.: na tabela anterior, AT = 41 - 21= 20. Obs.: AT sempre será maior ou igual a AA. PONTO MÉDIO DE CLASSE 2 ii i Ll x O ponto médio de classe é o ponto que divide o intervalo de classe em duas partes iguais. EX.: considerea 3ª classe da tabela em 29 | 33, o ponto médio x3 = (29+33)/2 = 31. IMPORTANTE O ponto médio será de suma importância para o cálculo da média, pois, como dito anteriormente, na tabela organizada com intervalos de classe, não sabemos mais, exatamente, quais são os valores representados em cada Estatística Aplicada 32 intervalo. Assim, consideraremos esses valores como sendo o ponto médio dos intervalos para que o erro seja o menor possível. Cálculo do número de intervalos de classe Podemos calcular o número de intervalos de classe de duas formas: pela Regra de Sturges ou pela raiz quadrada de n. DICA Regra de Sturges - Número de Classes Para determinar o número de classes ideal de uma distribuição, utiliza-se a Regra de Sturges, de acordo com o tamanho da amostra. i 1 + 3,3 log.n Onde n é o número de elementos da relação de dados brutos. Para o exemplo dado, temos: i 1 + 3,3 log20 = 5,29 5. i Classes Frequências 1 21 | 25 7 2 25 | 29 3 3 29 | 33 4 4 33 | 37 1 5 37 | 41 5 Total 20 DICA Se você não possui uma calculadora científica para calcular o valor do logaritmo de n, busque nos anexos os respectivos valores. Estatística Aplicada 33 Regra da Raiz Quadrada de n - Número de Classes Para determinar o número de classes ideal de uma distribuição, utiliza-se a regra da Raiz Quadrada de n, de acordo com o tamanho da amostra. i n Onde n é o número de elementos da relação de dados brutos. Para o exemplo dado, temos: i 20 = 4,47 4. DICA Valores da raiz de n encontram-se previamente calculados nos anexos. i Classes Frequências 1 21 | 26 8 2 26 | 31 4 3 31 | 36 3 4 36 | 41 5 Total 20 Se i=4 deve-se calcular o novo hi. Ex.: na tabela anterior. h1= 26-21=5 h2= 31-26=5 h3= 36-31=5 h4= 41-36=5 Estatística Aplicada 34 Na tabela de distribuição de frequências sem intervalo de classes tínhamos um total de treze linhas com dados obtidos, já na tabela com intervalos de classe, apenas 5 ou 4 de acordo com a regra que for utilizada. Apesar de ser uma tabela mais “legível”, a precisão dos valores se perde um pouco, pois não sabemos mais quais são exatamente os sete números que aparecem no primeiro intervalo de classe, por exemplo. Mesmo assim, é a tabela mais usada, pois num levantamento de grande porte, seria inviável e incompreensível trabalharmos com os inúmeros valores que aparecem. Para a construção de uma tabela de distribuição de frequências com intervalos de classe, é muito importante o cálculo do número de intervalos de classe ou pela regra de Sturges ou pela raiz quadrada de n. Qualquer regra para determinação do número de intervalos de classes não determina com exatidão o valor de i, mas dá ao pesquisador uma noção do tamanho da tabela. Cabe ao pesquisador decidir com quantos intervalos de classe irá trabalhar. Na verdade, o número de intervalos de classe vai depender do tipo de dado que está sendo trabalhado. Por exemplo, se os dados referirem-se às notas de uma prova, talvez seja conveniente que os arrumemos em intervalos de 1 em 1 para que possamos ter uma ideia do número de alunos aprovados (nota maior que sete), o número de alunos em recuperação (nota entre quatro e sete) e o número de alunos reprovados (nota inferior a quatro). Para construção de uma Distribuição de Frequências c/ intervalos de Classes devemos seguir os seguintes passos ( roteiro ): 1º passo - Organize os dados brutos em um ROL. Dados Brutos: 25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31 Rol: 21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40 Estatística Aplicada 35 2º passo - Calcule a amplitude amostral AA (maior valor da amostra menos o menor). AA = 40 - 21 = 19 3º passo - Calcule o número de classes através da "Regra de Sturges" ou da raiz quadrada de n. i 1 + 3,3 log20 = 5,29 5 ou i n = 20 =4,47 4 IMPORTANTE O número de intervalos de classe pode ser diferente se calculado por uma regra ou por outra. Cabe ao pesquisador definir o número de intervalos de classe com que irá trabalhar. 4º passo - Calcule a amplitude dos intervalos de classe (amplitude amostral dividida pelo número de intervalos de classe). hi = AA/i = 19/5 = 3,8 4 No caso de termos que arredondar o valor de hi, este deve ser arredondado sempre para mais para que haja folga na última classe, no contrário corre-se o risco de a tabela montada não incluir o último valor, e nenhum valor pode ser descartado. i Classes 1 2 3 4 5 Estatística Aplicada 36 5º passo - Montemos, então, a tabela. O menor número da amostra será o limite inferior do 1º intervalo de classe e de h em h, no nosso exemplo, de 4 em 4, montamos, então, os limites de todos os intervalos de classe. O primeiro elemento das classes seguintes sempre será formado pelo último elemento da classe anterior. 6o passo - Agora é só marcar quantos números temos em cada intervalo de classe. A maneira mais simples de fazer é através de marcações da seguinte forma: lemos o primeiro número e identificamos qual a classe a que ele pertence. Identificada a classe, riscamos o número e o marcamos na classe a que ele pertence. i Classes Marcação Frequências 1 21 | 25 /////// 7 2 25 | 29 /// 3 3 29 | 33 //// 4 4 33 | 37 / 1 5 37 | 41 ///// 5 Total 20 i Classes 1 21 | 25 2 25 | 29 3 29 | 33 4 33 | 37 5 37 | 41 Estatística Aplicada 37 Agora é só apagar a coluna de marcação e está pronta a tabela! i Classes Frequências 1 21 | 25 7 2 25 | 29 3 3 29 | 33 4 4 33 | 37 1 5 37 | 41 5 Total 20 DADOS ABSOLUTOS E DADOS RELATIVOS Os dados absolutos são os resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida. Já os dados relativos são razões que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Os dados relativos são de fácil compreensão. Como o nome mesmo diz, relativo, em relação a. Porcentagem As porcentagens são partes proporcionais calculadas sobre cem unidades. O emprego da porcentagem é de suma importância quando o intuito é destacar a participação da parte no todo. Estatística Aplicada 38 Exemplo: Considere a série: Clínica A - 2005 Número de Pacientes Atendidos no Mês de Março por Setor Setor Número de pacientes Pediatria 225 Alergologia 175 Radiologia 135 Total 535 Fonte: Dados Fictícios. Porcentagens dos pacientes atendidos em cada setor: Pediatria: %06,42 535 100225 42% Alergologia: %71,32 535 100175 33% Radiologia: %23,25 535 100135 25% Podemos inserir esses dados na nossa tabela através de uma nova coluna: Clínica A - 2005 Número de pacientes atendidos no mês de março por setor Setor Número de pacientes % Pediatria 225 42 Alergologia 175 33 Radiologia 135 25 Total 535 100 Fonte: Dados Fictícios. Estatística Aplicada 39 TIPOS DE FREQUÊNCIAS Frequência Simples ou Absoluta (fi) - É o número de observações correspondentes a uma classe ou a um valor. Frequência Simples Relativa (fri) - É o número de observações de um valor ou de uma classe, em relação ao número total de observações. Em porcentagens temos: n f f iri 100 % ou 100% riri ff Obs.: a soma das frequências relativas é sempre igual a 1 ou 100%. Devido a erros de arredondamento pode acontecer de o somatório das frequências relativas dar diferente de 1 ou 100%. Por exemplo: %8,99rif ou %02,100rif Se isso acontecer, devemos retirar ou acrescentar a diferença no intervalo de maior frequência, pois dessa forma cometeremos um erro menor do que cometeríamos se alterássemos o intervalo de menor frequência. O ideal é trabalharmos com pelo menos 4 casas após a vírgula. n f f iri Estatística Aplicada 40 Frequências Acumuladas (Fi.) É a soma das frequências anteriores até a classe ou valor inclusive. Na tabela mais a frente, quantas pessoas tiraram nota até o limite superior do intervalo? Frequência Acumulada Relativa (Fri) Trata-se da frequência acumulada de uma classe dividida pela frequência total. Podemos, ainda, representá-la em valores percentuais multiplicando a frequência acumulada relativa por 100. No exemplo abaixo, qual o percentual das notas até o limite superior do intervalo? Exemplo: notas de um teste de estatística aplicado em uma turma do curso de Nutrição. No exemplo abaixo, temos as frequências simples (absoluta - fi ; relativa - fri e relativa percentual - fri %). i Notas fi fri fri % 1 2 3 4 5 18 ├─ 34 34 ├─ 50 50 ├─ 66 66 ├─ 82 82 ├─ 98 2 5 3 8 2 2/20=0,10 5/20=0,25 3/20=0,15 8/20=0,40 2/20=0,10 10 25 15 40 10 - Σ 20 1 100 Estatística Aplicada 41 No exemplo a seguir, temos as frequências acumuladas (acumuladas – Fi; acumulada relativa – Fri e acumulada relativa percentual – Fri%). i Notas fi Fi Fri Fri % 1 2 3 4 5 18 ├─ 34 34 ├─ 50 50 ├─ 66 66 ├─ 82 82 ├─ 98 2 5 3 8 2 2 7 10 18 20 2/20=0,10 7/20=0,35 10/20=0,50 18/20=0,90 20/20=1 10 35 50 90 100 - Σ 20 - - - No exemplo seguinte, vamos calcular também para completarmos o cálculo da distribuição de frequências, o ponto médio – xi. NOTAS DE UM TESTE DE ESTATÍSTICA APLICADO EM UMA TURMA DO CURSO DE NUTRIÇÃO. i Notas fi xi 1 2 3 4 5 18 ├─ 34 34 ├─ 50 50 ├─ 66 66 ├─ 82 82 ├─ 98 2 5 3 8 2 18+34/2 = 26 34+50/2 = 42 50+66/2 = 58 66+82/2 = 74 82+98/2 = 90 - - Σ20 - i Notas fi xi fri fri % Fi Fri Fri % 1 2 3 4 5 18 ├─ 34 34 ├─ 50 50 ├─ 66 66 ├─ 82 82 ├─ 98 2 5 3 8 2 26 42 58 74 90 2/20=0,10 5/20=0,25 3/20=0,15 8/20=0,40 2/20=0,10 10 25 15 40 10 2 7 10 18 20 2/20=0,10 7/20=0,35 10/20=0,50 18/20=0,90 20/20=1 10 35 50 90 100 - Σ 20 - 1 100 - - - Estatística Aplicada 42 Onde: fi → Frequência simples absoluta. xi → Ponto médio de uma classe. fri → Frequência relativa. Fi → Frequência acumulada. Fri → Frequência acumulada relativa . Chegamos ao fim da unidade I, onde estudamos os elementos da Estatística descritiva. Espero que você tenha gostado .Vamos em frente. É HORA DE SE AVALIAR! Lembre-se de realizar as atividades desta unidade de estudo. Elas irão ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Na próxima unidade estudaremos os gráficos Estatísticos . Vamos lá. Estatística Aplicada 43 Exercícios - Unidade 1 1. Classifique as variáveis em qualitativa e quantitativa. ( ) Cor preferida. ( ) Índice de liquidez. ( ) Sexo. a) qualitativa, qualitativa, quantitativa. b) quantitativa, quantitativa, qualitativa. c) quantitativa , qualitativa, quantitativa. d) qualitativa, qualitativa, qualitativa. e) qualitativa, quantitativa, qualitativa . 2. Classifique as variáveis quantitativas em contínuas (c) ou discretas (d). ( ) População: atletas Variável: altura ( ) P.: pacientes de um hospital Variável: pacientes com insuficiência cardíaca. ( ) P.: bebês monitorados em uma UTI neonatal Variável: peso a) contínua, contínua, contínua. b) contínua, discreta, contínua. c) contínua, discreta, discreta. d) discreta, contínua, contínua. e) discreta,discreta, contínua. Estatística Aplicada 44 3. Em uma escola de ensino médio, há 300 alunos divididos em 6 turmas, como no quadro abaixo. Selecionando uma amostra de 12% dessa população, acharemos o seguinte número: a) 10 b) 36 c) 40 d) 12 e) 20 4. São fases do método estatístico: 1. A apuração. 2. A coleta. 3. A crítica. 4. A definição do problema. 5. O planejamento. Qual a ordem correta dessas fases? a. 1, 2, 3, 4, 5 b. 4, 5, 2, 3, 1 c. 5, 4, 3, 2, 1 d. 4, 3, 5, 2, 1 e. 4, 5, 3, 1, 2 População TURMA MENINOS MENINAS 1001 25 20 1002 30 25 2001 29 28 2002 32 15 3001 26 22 3002 23 25 TOTAL 165 135 Estatística Aplicada 45 5. Considere a série abaixo. Podemos classificá-la em: Cidade AAA Ano Número de Habitantes 1999 1.125.235 2000 2.365.128 2001 2.535.548 2003 2.874.100 2004 3.258.003 2005 3.356.259 a) Geográfica. b) Categórica. c) Específica. d) Ocasional. e) Temporal. 6. Os dados abaixo se referem a uma série: Programa preferido N.º de entrevistados novela 35 telejornal 15 desenho 10 filme 27 esporte 15 a) Temporal. b) Geográfica. c) Periódica. d) Específica. e) Histórica. Estatística Aplicada 46 7. Uma população encontra-se dividida em três estratos de tamanhos, respectivamente, e1=400, e2=350 e e3=225. Retirando 50 elementos do 3º estrato, a proporção encontrada neste estrato deve ser aplicada aos estratos 1 e 2. No total, quantos elementos serão retirados dos três estratos? a) 292 elementos. b) 705 elementos. c) 207 elementos. d) 755 elementos. e) 217 elementos. 8. Identifique o item errado: a) A coleta periódica é aquela feita em intervalos constantes de tempo. b) A coleta ocasional é feita a fim de atender a uma emergência. c) A coleta direta de dados pode ser classificada quanto ao fator tempo em contínua, periódica ou ocasional. d) Os registros de casamentos são exemplos de coleta periódica. e) A coleta contínua é aquela feita continuamente. 9- Considerando as notas de estatística de uma turma de 80 alunos: 6,4 7,8 7,3 8,7 9,5 8,2 8,9 8,1 9,0 7,8 6,6 8,2 8,6 9,2 8,5 8,0 7,3 8,5 9,6 7,6 1,3 7,4 8,6 1,1 7,8 8,6 7,0 6,8 7,4 9,4 9,8 9,9 8,5 9,0 8,6 8,2 8,7 7,0 7,2 7,5 7,3 7,5 7,8 8,4 8,6 7,2 8,5 8,6 9,9 6,7 7,6 7,6 8,3 3,3 8,5 8,1 8,1 8,9 7,1 9,5 8,6 8,4 8,0 4,2 9,0 9,3 9,6 8,1 6,3 8,8 8,5 7,6 9,2 7,3 3,3 7,9 8,1 8,4 7,3 6,2 Forme uma distribuição de frequência com intervalos de classe seguindo o que se pede: a) Calcule a amplitude amostral. b) Calcule o número de classes através da "Regra de Sturges". Estatística Aplicada 47 c) Calcule a amplitude dos intervalos de classe. d) Calcule as frequências de cada um dos intervalos de classe. e) Monte a tabela. Estatística Aplicada 48 10. Complete a distribuição de frequências abaixo: Classes fi fri fri (%) Fi xi 10 | 14 14 15 | 12 25 | 12 35 | 0,14 39 45 | 55 | 70 1 0,02 2 50 65 1,00 - - Estatística Aplicada 49 Gráfico em linha Curva. Gráficos em barra vertical. Gráficos em barra horizontal. Gráficos de setores. Cartogramas. Histograma. Polígono de Frequência. Ogivograma. Ogiva de Galton. 2 Representação Gráfica Estatística Aplicada 50 Esta é uma unidade importante para o entendimento da estatística, pois grande parte dos dados estatísticos são apresentados através de gráficos. Nela aprenderemos a montar e a interpretar alguns dos gráficos mais utilizados e os gráficos estatísticos específicos. Esperamos que vocês gostem. OBJETIVO DA UNIDADE : Construir e analisar os gráficos que você tanto conhece e que fazem parte da sua vida cotidiana. PLANO DA UNIDADE : Gráfico em linha Curva. Gráficos em barra vertical. Gráficosem barra horizontal. Gráficos de setores. Cartogramas. Histograma. Polígono de Frequência. Ogivograma. Ogiva de Galton. Bons estudos! Estatística Aplicada 51 Os gráficos são representações visuais dos dados estatísticos e não substituem as tabelas. Devem corresponder aos dados de uma forma simples, clara e objetiva. DICA Muito cuidado com os gráficos, pois se mal elaborados podem trazer uma ideia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Por falar gráficos, quais você conhece? Você sabe qual é a funcionalidade deles? Vejamos então. Alguns Tipos de Gráficos Gráfico em linha ou curva Estatística Aplicada 52 Estes gráficos são frequentemente usados para a representação de séries cronológicas com um grande número de períodos. Nos dão uma visualização clara da variação dos dados existentes nas séries. Também são ideais quando há necessidade de se representarem várias séries em um mesmo gráfico. Gráficos em barras verticais (coluna). Gráficos em barras horizontais. Estatística Aplicada 53 Quando as legendas são longas usa-se de preferência os gráficos em barras horizontais. Os retângulos (barras) têm a mesma base e as alturas são proporcionais aos respectivos dados. Gráficos em setores Estes gráficos são construídos em uma circunferência e empregados sempre que desejamos ressaltar a participação do dado no total. O total é representado pelos 360 graus de um círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que seus ângulos são respectivamente proporcionais aos dados da série. DICA Devemos evitar o gráfico de setores quando tivermos mais de sete dados. IMPORTANTE As séries temporais, geralmente, não são representadas por este tipo de gráfico. Cartogramas São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Estatística Aplicada 54 Histograma É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. É o gráfico que melhor representa uma distribuição de frequências com intervalos de classe ( este assunto será abordado na unidade 3). No eixo horizontal (eixo x), representamos as classes da distribuição e no eixo vertical (eixo y), representamos as frequências. A área de um histograma é proporcional à soma das frequências simples ou absolutas. IMPORTANTE O histograma assemelha-se ao gráfico de colunas, a diferença é que não há espaçamento entre as colunas. Estatística Aplicada 55 Polígono de frequência É um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última da distribuição. Ogivograma É o gráfico de frequências acumuladas. Ele é construído da mesma forma que o histograma, porém no eixo vertical (eixo y), representaremos as frequências acumuladas. Estatística Aplicada 56 Ogiva de galton A Ogiva de Galton ou polígono de frequência acumulada é um gráfico de linhas traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. É HORA DE SE AVALIAR! Lembre-se de realizar as atividades desta unidade de estudo. Elas irão ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Nessa unidade, vimos os principais e os mais importantes gráficos estatísticos. Com uma ferramenta computacional é muito simples representar dados graficamente. Na próxima unidade veremos as medidas de tendência central. Estatística Aplicada 57 Exercícios - Unidade 2 1. Considere a tabela abaixo que representa as idades de vinte duas crianças atendidas em um posto de saúde do município de Itaboraí. Ao construir o gráfico de setores relativo à tabela dada, o setor correspondente à classe 3 será de aproximadamente: Idade 0 1 2 3 4 5 Crianças 4 3 6 3 0 6 22 a) 6o b) 16,6o c) 30º d) 20o e) 98º 2. Na administração de uma empresa, 50% do orçamento vai para a compra de equipamentos, 22% para a manutenção e 28% para pagamento de pessoal. O gráfico que melhor representa essa situação é: a) o de barras. b) o de setores. c) o linear simples. d) o de colunas. e) o de barras múltiplas. Estatística Aplicada 58 3. O gráfico estatístico designado a representar a série abaixo chama-se: Nota fi 1├─ 3 3├─ 5 5├─ 7 7├─ 9 3 5 9 8 Σ 25 a) Cronograma. b) Gráfico de colunas compostas. c) Histograma. d) Gráfico de colunas. e) Gráfico de barras. 4. Gráficos são instrumentos úteis na estatística. Assinale a afirmação incorreta: a. Um histograma é um gráfico de linhas. b. O gráfico de setores é apropriado quando se quer representar as divisões de um montante total. c. Um polígono de frequências acumuladas é construído unindo-se os pontos correspondentes aos limites superiores dos intervalos de classe da distribuição de frequência. Estatística Aplicada 59 d. Um polígono de frequências é construído unindo-se os pontos correspondentes aos pontos médios dos intervalos de classes. e. O gráfico de barras é usado para séries geográficas. 5. Observe a série abaixo. O gráfico que melhor representa tal série é: Ano Número de Infectados pela Doença AXZ 2000 2.236.215 2001 2.126.128 2002 2.035.265 2003 1.958.254 2004 1.532.126 2005 1.125.258 a) O gráfico de linhas. b) O histograma. c) O gráfico de setores. d) O cartograma. e) O pictograma. 6- Assinale a alternativa correta. a) O histograma assemelha-se ao gráfico de barras, a diferença é que não há espaçamento entre as barras. b) O histograma assemelha-se ao gráfico de colunas, a diferença é que não há espaçamento entre as colunas. c) O histograma assemelha-se ao gráfico de setores, a diferença é que não há espaçamento entre os setores. Estatística Aplicada 60 d) O histograma assemelha-se ao gráfico de linhas, a diferença é que não há espaçamento entre as linhas. e) O histograma assemelha-se ao ogivograma, a diferença é que não há espaçamento entre as linhas. 7. Assinale a alternativa verdadeira. a) O gráfico que melhor representa uma série histórica é o gráfico de setores de barras. b) Um polígono de frequências é construído unindo-se os pontos correspondentes aos limites inferiores dos intervalos de classe da distribuição de frequência. c) Um polígono de frequências acumuladas é construído unindo-se os pontos correspondentes aos limites superiores dos intervalos de classe da distribuição de frequência. d) O gráfico de linhas é usado quando queremos destacar uma parte do todo. e) O gráfico que melhor representa uma distribuição de frequências é o gráfico de barras. 8) O que podemos afirmar sobre o Polígono de Frequências? Assinale a alternativa correta: a) É formado por linhas que ligam ponto a ponto. b) É formado por colunas simples. c) É um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classes. Estatística Aplicada 61 d) É formado por um conjunto de retângulos, um colado ao outro, cujas bases se localizam sobre o eixo horizontal.e) É uma linha poligonal aberta. 9. Os gráficos abaixo mostram o perfil dos doentes de Aids no Brasil. Faça um breve comentário sobre o assunto, levando em consideração os dados contidos nos gráficos. Estatística Aplicada 62 10. A distribuição a seguir indica o número de dias afastados por motivo de doença de 40 funcionários de uma empresa alimentícia durante o período de um ano. No de dias afastados 1 2 3 4 5 6 7 No de funcionários 13 7 10 4 3 2 1 a) Construa um gráfico de colunas. b) Construa um gráfico de setores. Estatística Aplicada 63 Medidas de Tendência Central 3 Média Aritmética. Moda. Mediana. Estatística Aplicada 64 Estudaremos aqui três tipos de medidas de tendência central: média aritmética, moda e mediana. Essas medidas servem para visualizarmos a distribuição de frequências no eixo de variação da variável estudada. OBJETIVOS DA UNIDADE: Compreender as medidas de tendência central e calculá-las para dados não agrupados e dados agrupados em classes de frequências. PLANO DA UNIDADE: Média Aritmética. Moda. Mediana. Bons estudos! Estatística Aplicada 65 As Medidas de Posição ou Tendência Central são denominadas dessa forma devido aos dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. As outras medidas de posição são as separatrizes, que englobam a própria mediana, os decis, os quartis e os percentis. Média Aritmética A Média Aritmética ( X ) é a medida de posição que possui maior estabilidade e é igual ao quociente entre a soma dos valores da variável e o número total de observações. Veja, abaixo, a fórmula: n x n xxx X n i i n 121 ... Em que xi são os valores da variável e n o número de observações. Para dados não agrupados a Média Aritmética Simples ( x ) é calculada da seguinte forma: EXEMPLIFICANDO Ex.: Um aluno de determinada instituição de ensino tirou as seguintes notas em estatística: 7, 10 e 6. Sabendo-se que a nota final desse aluno é calculada através da média aritmética das três avaliações feitas no período, temos como média final do aluno: x1 = 7; x2 = 10 e x3 = 6 7,7 3 6107 X Estatística Aplicada 66 Em relação aos dados agrupados sem intervalos de classe, consideremos a distribuição relativa a 38 crianças pacientes de uma clínica pediátrica com idades entre 0 e 4 anos. Idades fi 0 2 1 6 2 12 3 14 4 4 Total 38 As frequências representam quantas vezes ocorreu determinada idade, por exemplo, ao invés de escrevermos 0,0,1,1,1,1,1,1 etc., atribuímos a frequência, logo, a idade 0 (zero) ocorre duas vezes; a idade 1 ocorre seis vezes e assim por diante. As frequências funcionam como fatores de ponderação. A média aritmética, nesse caso, é a média aritmética ponderada, ou seja, em vez de somarmos o número 0 duas vezes, o número 1 seis vezes, o número 2 doze vezes e assim por diante, ponderamos os valores da variável com suas respectivas frequências. Esta ponderação é dada pela fórmula: k i i k i ii k kk f fx fff fxfxfx X 1 1 21 2211 )( ... ... Obs.: k i if 1 = n, ou seja, a soma das frequências é igual a n. if = 38, n = 38. Estatística Aplicada 67 xi fi xi.fi 0 2 0 1 6 6 2 12 24 3 14 42 4 4 16 38 88 A idade média das crianças atendidas na clínica será anosX 3,2 38 88 . Agora, vejamos os dados agrupados com intervalos de classe. Observe a seguir as notas de 50 alunos de uma turma de estatística: Notas fi 0 ├─ 2 2 ├─ 4 4 ├─ 6 6 ├─ 8 8 ├─ 10 7 11 25 12 6 Σ 61 Neste caso não temos como saber se os sete alunos da primeira classe tiveram notas, por exemplo, zero ou 1,9. Então, para diminuirmos o erro cometido com o agrupamento, utilizamos como valor representativo de cada intervalo o seu ponto médio (xi). Utilizamos, então, a mesma fórmula, sendo que xi agora não é mais o valor da variável e sim o ponto médio de cada classe. A média aritmética é calculada, então, da seguinte forma: k i i k i ii f fx X 1 1 )( Estatística Aplicada 68 Em que ix é o ponto médio da classe. No nosso exemplo: 1 2 20 1 x , 3 2 42 2 x , 5 2 64 3 x , 7 2 86 4 x , 9 2 108 5 x . Notas fi ix ii fx 0 ├─ 2 2 ├─ 4 4 ├─ 6 6 ├─ 8 8 ├─ 10 7 11 25 12 6 1 3 5 7 9 7 33 125 84 54 Σ 61 - 303 9,4 61 5484125337 )( 1 1 k i i k i ii f fx X Outros tipos de médias menos usados são as médias geométrica, harmônica, quadrática, cúbica e biquadrática. IMPORTANTE A média aritmética para a população é denotada por . Você já ouviu falar em moda? Não, não é bem dessa moda que vamos falar! É a Moda na Estatística. Vamos estudar sobre ela, agora? Estatística Aplicada 69 Moda (Mo) A Moda é o valor que mais aparece em uma série de valores. Você deve estar se perguntando: Como assim o valor que mais aparece? É isso mesmo! EXEMPLIFICANDO Por exemplo: o número de calçado mais vendido em uma sapataria é a moda. Até os vendedores ambulantes, mesmo sem saber, utilizam-se da moda. De uma maneira grosseira, podemos nos lembrar daquilo que está na moda, ou seja, daquilo que mais aparece. Viu como é simples? Podemos calcular a Moda para diversos tipos de dados. Veja como fazer isso: Moda para dados não agrupados A moda de uma distribuição para dados não agrupados é fácil de ser vista, é só procurarmos o valor que mais aparece. Uma distribuição pode ter nenhuma (amodal), uma (unimodal), duas (bimodal) ou mais modas. CIELE Realce Estatística Aplicada 70 EXEMPLIFICANDO Exemplos: Na série {6, 7, 9, 11, 11, 11, 12, 12} a moda é igual a 11. A distribuição é unimodal; A série {2, 5, 7, 11,12} não possui um número que apareça mais que os outros. A série é amodal; A série {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série é bimodal; Em outros casos, pode haver três ou mais valores que mais se repetem. Nesse caso, a série tem três ou mais modas. Moda para dados agrupados sem intervalos de classe Uma vez agrupados os dados, a moda é o valor da variável de maior frequência. EXEMPLIFICANDO Ex.: Manequim de roupa feminina mais vendida em uma loja de departamentos: Manequim Frequência 34 3 36 9 38 16 40 6 42 4 44 1 Resposta: 38 é o manequim modal, pois é o de maior frequência. Estatística Aplicada 71 Moda para dados agrupados com intervalos de classe Classe modal é a classe que apresenta a maior frequência. Nesse caso, a moda está compreendida entre os limites da classe modal. O método mais simples para o cálculo consiste em tomarmos o ponto médio da classe modal como sendo a própria moda. A este valor chamamos de moda bruta. 2 ** Ll Mo Em que l* é o limite inferior da classe modal e L* o limite superior da classe modal. EXEMPLIFICANDO Ex.: Como podemos calcular o peso modal da tabela abaixo? Peso (kg) fi 45 |— 50 9 50 |— 55 11 Classe modal 55 |— 60 8 60 |— 65 6 65 |— 70 5 Resposta: A classe modal é 50|— 55, pois é a de maior frequência. l2 = 50 e L2 = 55 Mo = 5,52 2 5550 kg Estatística Aplicada 72 IMPORTANTE Não temos como saber o real valor da moda, pois não conhecemos mais os valores que estão compreendidos em um determinado intervalo. Portanto, este valor é apenas estimado. Você conhece a fórmula de Czuber? Pois, então conhecerá agora. Fórmula de CZUBER (processo mais elaborado) * 21 1 h DD D lM io Em que: li é o limite inferior da classe modal. D1 = f* - f(ant) D2 = f* - f(post) h* é a amplitude da classe modal. f* é a frequência simples da classe modal. f(ant) é a frequência simples da classe anterior à classe modal. f(post) é a frequência simples da classe posterior à classe modal. Para o cálculo do peso modal da tabela anterior temos: kgM o 525811911 911 50 Estatística Aplicada 73 Passemos a estudar, agora, a mediana para dados não-agrupados, agrupados sem intervalos de classe e agrupados em classes. Mediana (Md) A mediana de um conjunto de valores previamente ordenados. É o valor situado bem no meio do conjunto de valores de tal forma a separá-los em dois subconjuntos de mesmo número de elementos. Mediana para dados não-agrupados Quando o número de valores for ímpar: EXEMPLIFICANDO Ex.: Dada uma série de valores {7, 2, 8, 13, 11, 7, 15, 12, 1} o primeiro passo a ser dado é a construção do rol: {1, 2, 7, 7, 8, 11, 12, 13, 15}. O valor que divide a série em duas partes iguais é o 8, logo a mediana Md = 8. Na prática, o valor mediano é dado por 5 2 19 2 1 n , ou seja, a mediana será o quinto elemento da série ordenada, que é 8. Md = 8 Quando o número de valores for par: EXEMPLIFICANDO Ex.: Calcular a mediana da série {1, 2, 0, 0, 2, 4, 4, 3, 6, 4, 5, 6} Estatística Aplicada 74 Rol - {0, 0, 1, 2, 2, 3, 4, 4, 4, 5, 6, 6} - Md 5,3 2 43 Temos, aqui, duas observações a serem feitas, por isso preste bastante atenção: A mediana coincidirá com um dos elementos da série quando o número de elementos for ímpar. Quando o número de elementos da série for par, a mediana nunca coincidirá com um dos elementos da série. Neste caso, a mediana será sempre a média aritmética dos 2 elementos centrais da série; A média aritmética, a mediana e a moda de uma série de valores não têm, necessariamente, o mesmo valor. Mediana para dados agrupados sem intervalos de classe Neste caso, basta identificarmos a frequência acumulada (Fi) igual ou imediatamente superior à 2 if . A mediana será o valor da variável que corresponder a essa frequência acumulada. EXEMPLIFICANDO Ex.: Veja a tabela a seguir: Estatística Aplicada 75 Xi fi Fi 0 2 2 1 5 7 2 8 15 3 15 30 Classe Mediana 4 5 35 5 4 39 total 39 2 if = 5,19 2 39 , logo a mediana será Md = 3. Mediana para dados agrupados em classes Para esse tipo de dado é preciso determinar a classe da mediana, que será aquela que corresponder à frequência acumulada igual ou imediatamente superior à 2 if . idades fi FAi 10 ├─ 15 6 6 15 ├─ 20 11 17 20 ├─ 25 16 33 classe mediana 25 ├─ 30 13 46 (frequência acumulada imediatamente superior a 27 2 54 30 ├─ 35 5 51 35 ├─ 40 3 54 54 - Estatística Aplicada 76 A mediana é dada pela fórmula: * * )( .2l h f F f M ant i id Em que: li é o limite inferior da classe mediana. F(ant) é a frequência acumulada anterior à classe mediana. f* é a frequência simples da classe mediana. h* é a amplitude do intervalo da classe mediana. EXEMPLIFICANDO Exemplo: 1,235 16 17 2 54 20 Md IMPORTANTE Neste caso a mediana é estimada, pois não temos todos os valores da distribuição. Qual é a medida que devemos usar? Todas as médias são valores que estão compreendidos entre o menor e o maior valor observado. Todas são igualmente importantes, portanto uma não deve prevalecer sobre a outra. Devemos saber que: Estatística Aplicada 77 A média aritmética é a mais empregada apenas pelo fato de ser mais simples o seu cálculo e mais compreensível o seu resultado. É a medida de posição que possui a maior estabilidade; A moda será utilizada quando a medida de posição for o valor mais típico da distribuição. É uma medida de rápida obtenção; Quando desejamos obter o ponto que divide a distribuição em duas partes iguais, quando há valores extremos que afetam de maneira acentuada a média aritmética ou quando a variável em estudo é salário, usamos a mediana. A média aritmética de uma série de valores, por exemplo, é influenciável pelos seus extremos, enquanto que a mediana depende da posição e não dos valores dos elementos na série ordenada. É por isso que, no caso de séries com extremos muito distantes, usamos mais a mediana do que a média aritmética, para que não haja influência dos extremos. EXEMPLIFICANDO Ex.: Na série { 8, 9, 10, 15, 18}, a média = 12 e a mediana = 10. Já na série {6, 8, 10, 11, 75 }, a média = 22 e a mediana = 10. A média do segundo conjunto de valores é maior do que a do primeiro por influência do valor extremo (75), porém, nas duas séries, a mediana é a mesma, ou seja, não adianta analisarmos apenas as médias aritméticas de uma série de valores, é preciso analisar também a mediana. Estatística Aplicada 78 É HORA DE SE AVALIAR! Lembre-se de realizar as atividades desta unidade de estudo. Elas irão ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Vimos nesta unidade as medidas de tendência central. A média de um conjunto de valores ou de uma distribuição de classes é fundamental dentro do estudo da Estatística. Ela é um dos principais parâmetros de estudo e pesquisas. Na próxima unidade, veremos as medidas de dispersão – o cálculo dessas medidas nos permite a verificação de quão representativa é a média de uma distribuição em relação a todas as suas observações. Estatística Aplicada 79 Exercícios - Unidade 3 1. Uma empresa possui dois serventes recebendo salários de R$250,00 cada um, quatro escriturários recebendo R$600,00 cada um, um chefe de escritório com salário de R$ 1000,00 e três técnicos recebendo R$ 2200,00 cada. A média desses salários é de: a. R$ 1050,00 b. R$ 505,00 c. R$ 262,50 d. R$ 600,00 e. R$ 105,00 O quadro abaixo se refere às questões 2 e 3. A B C 2 0 7 4 2 5 5 8 2 6 9 6 3 3 1 2. As médias aritméticas das sequências A, B e C são, respectivamente: a. 4,0; 4,4 e 4,2 b. 4,4, 4,2 e 4,0 c. 4,2; 4,0 e 4,4 d. 5,0; 8,0 e 2,0 e. 4,0; 3,0 e 5,0 Estatística Aplicada 80 3. As medianas das sequências A, B e C são, respectivamente: A B C 2 0 1 3 2 2 4 3 5 5 8 6 6 9 7 a. 4,0; 4,4 e 4,2 b. 4,4, 4,2 e 4,0 c. 4,2; 4,0 e 4,4 d. 5,0; 8,0 e 2,0 e. 4,0; 3,0 e 5,0 O quadro abaixo representa as informações cadastrais de 5(cinco) cidadãos de ambos os sexos: Estado Civil sexo Grau de instrução Número de filhos Salários em S.M * Idade Solteiro F 2º Grau 2 4,00 29 Casado F 2º Grau 1 4,56 32 Solteiro M Superior 0 5,75 36 Casado M Superior 4 5,60 40 Solteiro M Superior 3 6,00 28 * o valor correspondente à variável salário representa o número de salário mínimo ( S.M ) Considerando as informações do quadro, marque a alternativa correta. 4) As Medianas das variáveis salário e idade são respectivamente: a) 28 e 5,75. b) 5,75 e 36. c) 5,60 e 32. d) 32 e 5,0. e) 32 e 5,75. Estatística Aplicada 81 A tabela abaixo dá a distribuição de frequências dos salários dos 83 enfermeiros de um hospital localizado em Rio Claro, por faixa de salário. Classe de Salários (R$) fi 500 650 15 650 800 18 800 950 23 950 1100 19 1100 1250 8 83 Com base nessas informações da tabela, marque a alternativa correta: 5) Qual o valor modal da distribuição? Classe de Salários (R$) fi 500 650 15 650 800 18 800 950 23 950 1100 19 1100 1250 8 83 a) R$ 870,55 b) R$ 866,67 c) R$ 883,33 d) R$855,43 e) R$ 843,90 Estatística Aplicada 82 6) Qual o valor mediano da distribuição? Classe de Salários (R$) fi FI 500 650 16 16 650 800 19 16 + 19 = 35 800 950 23 35 + 23 = 58 950 1100 19 58 + 19 = 77 1100 1250 8 77 + 8 = 85 85 a) R$ 870,55 b) R$ 848,91 c) R$ 883,33 d) R$ 855,43 e) R$ 843,90 7-Vinte empregados de uma cadeia de hotéis que frequentaram um curso de atendimento com alegria obtiveram as seguintes notas em uma prova dada ao final do curso: 17 19 14 20 17 17 12 15 15 16 16 19 18 15 16 16 17 13 14 19 Com base nas notas da tabela acima, responda: Qual foi a nota média? a) 16,25 b) 17,28 c) 16,75 d) 19,15 e) 17,26 Estatística Aplicada 83 8) Pesquisa elaborada recentemente revela que, nos últimos anos, o consumo de cigarros vem aumentando entre as mulheres. Com base nesse estudo, permitiu-se o esboço de uma tabela de distribuição de frequência, que relaciona a quantidade de cigarros consumidos diariamente entre 1000 mulheres fumantes. A média aritmética é, aproximadamente: CIGARROS CONSUMIDOS DIARIAMENTE FREQUÊNCIA 15 | 20 20 | 25 25 | 30 30 | 35 35 | 40 150 300 250 200 100 Total 1000 (Dados Fictícios) a) 21,6. b) 23,5. c) 24,6. d) 26,5. e) 27,6. 9 - Sejam os pesos (kg) de 50 alunos de uma determinada classe: PESO (kg) f i 40 | 50 50 | 60 60 | 70 70 | 80 80 | 90 4 12 20 12 2 Estatística Aplicada 84 a) Calcule a amplitude total. 10 - Calcule as frequências relativas. PESO (kg) f i Fr 40 | 50 50 | 60 60 | 70 70 | 80 80 | 90 4 12 20 12 2 4/50 = 0,08 12/50 = 0,24 20/50 = 0,40 12/50 = 0,24 2/50 = 0,04 50 1,00 Estatística Aplicada 85 Medidas de Dispersão 4 Amplitude total. Variância. Desvio padrão. Coeficiente de variação Estatística Aplicada 86 Estudaremos aqui as medidas de dispersão. Elas permitem calcular a dispersão (como os dados estão espalhados) existente entre os dados observados, estejam eles agrupados ou não, em relação à média aritmética. OBJETIVOS DA UNIDADE: Compreender as medidas de dispersão, calcular essas medidas, para dados não agrupados e dados agrupados em classes de frequências. PLANO DA UNIDADE: Amplitude total. Variância. Desvio padrão. Coeficiente de variação. Bons estudos! Estatística Aplicada 87 A média aritmética, a moda e a mediana são valores representativos do todo, portanto a obtenção desses valores se faz fundamental no estudo de um conjunto de valores. Porém, para analisarmos um fenômeno estatístico, não basta obtermos apenas medidas de posição ou gráficos estatísticos. Para uma análise mais profunda, devemos saber como esses dados estão distribuídos no todo. As medidas de variabilidade ou dispersão nos dão exatamente isso. Elas fazem uma descrição de como os dados estão espalhados no todo. Existem diversas medidas de dispersão, porém, em nossa disciplina, estudaremos quatro delas, que são: Amplitude total; Variância; Desvio padrão; Coeficiente de variação; EXEMPLIFICANDO Ex.: Observe os seguintes conjuntos de valores referentes à mesma variável: X = {20, 20, 20, 20, 20} Y = {05, 15, 20, 30 ,30} Z = {01, 01, 03, 05, 90} Estatística Aplicada 88 Os três conjuntos apresentam a mesma média aritmética 20 5 100 x , porém é fácil notar que o primeiro conjunto de valores é mais homogêneo que os outros dois, pois todos os valores são iguais. Já o segundo é mais homogêneo que o terceiro, pois este é o mais disperso de todos. Portanto não adianta dois ou mais conjuntos de valores terem a mesma média aritmética, algumas outras análises se fazem necessárias. Amplitude Total (AT) Amplitude Total (AT) é a diferença entre o limite superior da última classe e o limite inferior da primeira classe, ou seja, é a diferença entre os valores extremos de um conjunto de dados mínmáx lLAT . Trata-se da única medida de dispersão que não tem a média como ponto de referência. A amplitude total é instável, pois só leva em consideração os valores extremos dos conjuntos de dados, descuidando do conjunto de valores intermediários, por isso é pouco utilizada. Uma de suas utilizações é na hora de decidirmos por uma distribuição de frequência com ou sem intervalos de classes. Fazemos uso da amplitude total quando queremos determinar a amplitude da temperatura em um dia, por exemplo, medida de cálculo rápido sem muita exatidão. EXEMPLIFICANDO Ex.: Dada a série 2, 3, 5, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 21, 22, 23, 23, 23, 24, 25, 25, 27, 27, 48, 60 e 70 a amplitude amostral será: 68270 AA Estatística Aplicada 89 Agrupando os dados sem intervalos de classe: xi fi 2 1 3 1 5 1 6 1 7 2 8 3 9 3 10 2 21 1 22 1 23 3 24 1 25 2 27 2 48 1 60 1 70 1 ∑ 27 Com intervalos de classe: Classes fi 2|— 14 14 14|—26 8 26|—38 2 38|—50 1 50|—62 1 62|—74 1 Σ 27 72274 mínmáx lLAT Estatística Aplicada 90 Variância (s2) A variância mede o grau de variabilidade em torno da média. É a média aritmética dos quadrados dos desvios (cada valor menos a média). Diferente da amplitude total que se deixa influenciar pelos extremos, a variância leva em consideração todos os valores da variável em estudo. Ela baseia-se nos desvios em torno da média. Variância Amostral Para dados isolados: 1 ( 1 2 2 n Xx s n i i ix = cada valor observado. X = média dos valores observados. n = tamanho da amostra. Para dados agrupados: k i k i fi fiXxi s 1 1 2 2 1 . IMPORTANTE No denominador da fórmula da variância trabalhamos sempre com n-1 graus de liberdade para diminuir o erro do cálculo da variância com agrupamento da distribuição. Estatística Aplicada 91 Em que: ix = cada valor observado, no caso de dados agrupados com intervalos de classe, ix é o ponto médio do intervalo de classe. X = média dos valores observados. fi = somatório das frequências (n). fi = frequência de cada classe. EXEMPLIFICANDO Ex.: Ao analisarmos as idades dos pacientes atendidos num dia em duas clínicas de saúde A e B, temos: Clínica A 5,38 33 1272 X 81,135 133 43462 s Classes fi i x ).( ii fx )( Xxi 2)( Xxi ii fXx .)( 2 02|— 14 1 8 8 -30,5 930,25 930,25 14|—26 3 20 60 -18,5 342,25 1026,75 26|—38 10 32 320 -6,5 42,25 422,5 38|—50 16 44 704 5,5 30,25 484 50|—62 2 56 112 17,5 306,25 612,5 62|—74 1 68 68 29,5 870,25 870,25 33 1272 4346 Estatística Aplicada 92 Clínica B Classes fi i x ).( ii fx )( Xxi 2)( Xxi ii fXx .)( 2 02|— 14 5 8 40 -30,5 930,25 4651,25 14|—26 4 20 80 -18,5 342,25 1369 26|—38 7 32 224 -6,5 42,25 295,75 38|—50 7 44 308 5,5 30,25 211,75 50|—62 5 56 280 17,5 306,25 1531,25 62|—74 5 68 340 29,5 870,25 4351,25 33 1272 25,12410 5,38 33 1272 X 82,387 133 25,124102 s Podemos observar que a variância da Clínica A é bem menor do que a variância da Clínica B, apesar de as médias aritméticas serem iguais. Isso significa que os dados referentes às idades dos pacientes atendidos na primeira clínica são mais homogêneos, ou seja, mais concentrados em torno da média que os da segunda clínica, que são mais dispersos. Desvio Padrão O desvio padrão é a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo e o seu resultado está na mesma unidade de medida da variável, diferente da variância, que é uma medida quadrática. Quanto maior o desvio padrão mais
Compartilhar