Baixe o app para aproveitar ainda mais
Prévia do material em texto
Ana Lúcia Guimarães Carvalho ESTATÍSTICA 1 ESTATÍSTICA BÁSICA Podemos dividi-la em duas: Estatística descritiva, que apenas descreve e analisa um conjunto de dados, sem tirar conclusões; e Estatística indutiva ou Inferência Estatística, que trata das inferências e conclusões, isto é, a partir da análise de dados são tiradas conclusões. MÉTODO CIENTÍFICO Método científico é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dos métodos científicos, vamos destacar o método experimental e o estatístico. Método Experimental O Método experimental consiste em manter constante todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química etc. Método Estatístico Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Nesses casos, lançamos mão do método estatístico. O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Fases do Método Estatístico Podemos distinguir no método estatístico as seguintes fases: 1. Planejamento Consiste em determinar quais são os dados a serem levantados e como estes serão levantados, fazendo uma análise de material e custos necessários durante a pesquisa. 2. Coleta de dados Após cuidadoso planejamento, damos início à coleta de dados. A coleta pode ser direta e indireta. A coleta é direta quando os dados são coletados diretamente na fonte. A coleta direta de dados pode ser classificada relativamente ao fator tempo em; a. contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência dos alunos às aulas; b. periódica - quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos; c. ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta pode ser indireta quando os dados são levantados em órgãos que já tenham efetuado a pesquisa de campo. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 3. Crítica dos dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo A Estatística é a parte da Matemática Aplicada que trata dos métodos científicos para coleta, organização, resumo, apresentação e análise de dados. Ana Lúcia Guimarães Carvalho ESTATÍSTICA 2 vulto, que possam influir sensivelmente nos resultados. 4. Apuração dos dados É a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. 5. Exposição ou apresentação dos dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 6. Análise dos resultados É o objetivo último da Estatística que consiste em tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra).Assim, fazemos uma análise dos resultados obtidos e tiramos desses resultados conclusões e previsões. 7. Conclusão Significado matemático da pesquisa, podendo apresentar comentários e críticas aos resultados. Exercícios: 1) Defina Estatística e exemplifique a sua utilização. 2) Defina método científico. 3) Cite e explique detalhadamente as fases do método estatístico. POPULAÇÃO E AMOSTRA Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo: - para o fenômeno “sexo”são dois os resultados possíveis: sexo masculino e sexo feminino; - para o fenômeno “número de filhos”há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, ...,n; - para o fenômeno “estatura”temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Os exemplos nos dizem que uma variável pode ser: a. qualitativa – quando seus valores são expressos por atributos: sexo (masculino- feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.; b. quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua (exemplos: peso dos alunos de uma escola) ; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta ( exemplos: número de alunos de uma escola). De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis discretas. Exercícios: 1) Classifique as variáveis em qualitativas ou quantitativas (contínuas ou descontínuas): a) Universo: alunos de uma escola. Variável: cor dos cabelos – b) Universo: casais residentes em uma cidade. Variável: número de filhos – c) Universo: as jogadas de um dado. Variável: o ponto obtido em cada jogada – d)Universo: peças produzidas por certa máquina. Variável: número de peças produzidas por hora Ana Lúcia Guimarães Carvalho ESTATÍSTICA 3 e) Universo: peças produzidas por certa máquina Variável: diâmetro externo – 2) Diga quais das variáveis abaixo são discretas e quais são contínuas: a) População: alunos de uma cidade. Variável: cor dos olhos. b) P.: estação meteorológica de uma cidade. V.: precipitação pluviométrica, durante um ano. c) P.: Bolsa de Valores de São Paulo. V.: número de ações negociadas. d) P.: pregos produzidos por uma máquina. V.: comprimento. e) P.: casais residentes em uma cidade. V.: sexo dos filhos. f) P.: bibliotecas da cidade de São Paulo. V.: número de volumes. 3) Como se separa as variáveis em discretas e contínuas? Dê pelo menos, três exemplos de cada tipo de variáveis. População Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística ou universo estatístico. Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos uma característica comum: são os que estudam. Amostra Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente da população em estudo denominamos amostra. Uma amostra é um subconjunto finito de uma população. Para as inferências serem corretas, é necessário garantir que a amostra seja representativada população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. É preciso, pois, que a amostra ou as amostras que vão ser usadas sejam obtidas por processos adequados. Amostragem Consiste em uma técnica especial para recolher amostras, que garante, tanto quanto possível, o acaso na escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade, e isto é muito importante, pois nossas conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras dessa população. Principais técnicas de amostragem: 1- Amostragem casual ou aleatória simples Este tipo de amostragem é equivalente a um sorteio lotérico. Na prática, a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: a. Numeramos os alunos de 01 a 90. b. Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população. Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilita-lo, foi elaborada uma tabela – Tabela de Números Aleatórios - , construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas (Anexo I) Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da mesma, a partir do qual iremos Ana Lúcia Guimarães Carvalho ESTATÍSTICA 4 considerar números de dois, três ou mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa), verticalmente ( de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando desenhos de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo. 2 – Amostragem proporcional estratificada Muitas vezes a população se divide em subpopulações – estratos. Como é provável que a variável em estudo apresente, de estratos em estratos, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: SEXO POPUL. 10% AMOSTRA M F 54 36 4,5 100 5410 = × 6,3 100 3610 = × 5 4 TOTAL 90 0,9 100 9010 = × 9 Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas. Usando a tabela de números aleatórios retiramos os elementos da população. 3 – Amostragem sistemática Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Exemplo: No caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da população diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exercícios: 1) Descreva as técnicas de amostragens. Quando se utiliza cada uma delas? 2) O que é população estatística? 3) O que é amostra? 4) O que é amostragem? 5) O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra. Ana Lúcia Guimarães Carvalho ESTATÍSTICA 5 6) Uma cidade X apresenta o seguinte quadro relativo às suas escolas de 1º grau: Nº DE ESTUDANTES ESCOLAS MASCULINO FEMININO A B C D E F 80 102 110 134 150 300 95 120 92 228 130 290 Total 876 955 Obtenha uma amostra proporcional estratificada de 120 estudantes. 7) Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, 35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª. Obtenha uma amostra de 40 alunos e preencha o quadro seguinte. Série População Cálculo Proporcional Amostra 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª Total 250 40 SÉRIES ESTATÍSTICAS Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isto ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. Tabela Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se de: a. corpo – conjunto de linhas e colunas que contêm informações sobre a variável em estudo; b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas; c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas; d. linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; e. casa ou célula – espaço destinado a um só número; f. título – conjunto de informações, as mais completas possíveis, localizado no topo da tabela; g. rodapé – são os elementos complementares da tabela, tais como fonte, as notas e as chamadas, colocados, de preferência, no fecho da tabela. Exemplo: PRODUÇÃO DE CAFÉ BRASIL – 1996-2000 ANOS PRODUÇÃO (1.000 t) 1996 1997 1998 1999 2000 2.535 2.666 2.122 3.750 2.007 FONTE: Dados Hipotéticos Séries Estatísticas Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da série. Daí podemos concluir que numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie. Cabeçalho Coluna Indicadora Corpo Rodapé Cabeçalho Coluna Numérica Casa ou Célula Linhas Título Ana LúciaGuimarães Carvalho ESTATÍSTICA 6 Conforme varie um dos elementos da série, podemos classifica-la em histórica, geográfica e específica. Séries históricas Descrevem os valores da variável, em determinado local, descriminados segundo intervalos de tempo variáveis. Exemplo: PRODUÇÃO DE FERTILIZANTES FOSFATADOS – BRASIL 1995 – 1999 ANOS QUANTIDADE (t) 1995 1996 1997 1998 1999 3.570.115 4.504.201 5.448.835 4.373.226 4.024.813 Fonte: Dados Hipotéticos Séries Geográficas Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Exemplo: PRODUÇÃO DE OVOS DE GALINHA NO BRASIL – 2000 REGIÃO QUANTIDADE (1.000 dúzias) Norte Nordeste Sudeste Sul Centro-Oeste 66.092 356.810 937.463 485.098 118.468 Fonte: Dados hipotéticos Séries Específicas Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: REBANHOS BRASILEIROS 2000 ESPÉCIE QUANTIDADE (1.000 cabeças) Bovinos Eqüinos Suínos Ovinos Caprinos Coelhos 139.599 5.855 32.121 20.085 11.313 909 Fonte: Dados hipotéticos Séries Conjugadas – Tabela de Dupla Entrada Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Exemplo: TELEFONES INSTALADOS – 1997-99 REGIÃO 1997 1998 1999 Norte Nordeste Sudeste Sul Centro-Oeste 373.312 1.440.531 8.435.308 2.106.145 803.013 403.712 1.567.006 8.892.409 2.192.762 849.401 457.741 1.700.467 8.673.660 2.283.581 944.075 Total 13.158.309 13.905.290 14.059.524 Fonte: Dados Hipotéticos A conjugação, no exemplo dado, foi série geográfico-histórica. Exercícios 1) Classifique as séries a) PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL BRUTO 1998-00 ANO QUANTIDADE PRODUZIDA (1.000 t) 1998 1999 2000 22.700 18.115 20.984 Fonte: Dados Hipotéticos Ana Lúcia Guimarães Carvalho ESTATÍSTICA 7 b) AVICULTURA BRASILEIRA - 1999 ESPÉCIE NÚMERO (1.000 cabeças) Galinhas Patos, marrecos e gansos Perus 511.834 5.888 3.823 Fonte: Dados Hipotéticos c) CRIANÇAS NÃO-VACINADAS CONTRA A PÓLIO - 1999 REGIÕES QUANTIDADE Nordeste Sudeste Norte Centro-Oeste Sul 512.900 299.585 148.818 124.791 105.371 Total 1.191.465 Dados fictícios d) AQUECIMENTO DE UM MOTOR DE AVIÃO DE MARCA X MINUTOS TEMPERATURA (º C) 0 1 2 3 4 5 6 20 27 34 41 49 56 63 Dados Fictícios e) PRODUÇÃO DE LAMINADOS NÃO-PLANOS - BRASIL - 1998-2000 QUANTIDADE (1.000 t) TIPOS 1998 1999 2000 Barras Vergalhões Perfilados Tubos 1.414 2.203 526 390 1.272 2.140 538 344 1.139 2.209 425 330 Dados Fictícios f) PESSOAL DOCENTE DO ESTADO DE SÃO PAULO - 1999 REDES 1º GRAU 2º GRAU Estadual Municipal Particular 171.910 18.429 31.514 38.281 1.304 19.902 Total 221.853 59.487 Dados hipotéticos 2)(Enem)A tabela abaixo apresenta dados referentes à mortalidade infantil, à porcentagem de famílias de baixa renda com crianças menores de 6 anos e às taxas de analfabetismo das diferentes regiões brasileiras e do Brasil como um todo. Regiões do Brasil Mortalidade infantil* Famílias de baixa renda com crianças menores de 6 anos (em %) Taxa de analfabetismo em maiores de 15 anos (em %) Norte 35,6 34,5 12,7 Nordeste 59,0 54,9 29,4 Sul 22,5 22,4 8,3 Sudeste 25,2 18,9 8,6 Centro- Oeste 25,4 25,5 12,4 Brasil 36,7 31,8 14,7 Fonte: Folha de S. Paulo, 11/3/99 * A mortalidade infantil indica o número de crianças que morrem antes de completar um ano de idade para cada grupo de 1.000 crianças que nasceram vivas. Suponha que um grupo de alunos recebeu a tarefa de pesquisar fatores que interferem na manutenção da saúde ou no desenvolvimento de doenças. O primeiro grupo deveria colher dados que apoiasses a idéia de que, se combatendo agentes biológicos e químicos, garante-se a saúde. Já o segundo grupo deveria coletar informações que reforçassem a idéia de que a saúde de um indivíduo está diretamente relacionada à sua condição socioeconômica. Os dados da tabela podem ser utilizados apropriadamente para: a) apoiar apenas a argumentação do primeiro grupo. b) apoiar apenas a argumentação do segundo grupo. c) refutar apenas a posição a ser defendida pelo segundo grupo. d) apoiar a argumentação dos dois grupos. e) refutar as posições a serem defendidas pelos dois grupos. 3)(Enem)Lâmpadas incandescentes são normalmente projetadas para trabalhar com a tensão da rede elétrica em que serão ligadas. Em 1997, contudo, lâmpadas projetadas para funcionar com 127 V foram retiradas do mercado e, em seu lugar, colocaram-se lâmpadas concebidas para uma tensão de 120 V. Segundo dados recentes, essa substituição representou uma mudança significativa no consumo de Ana Lúcia Guimarães Carvalho ESTATÍSTICA 8 energia elétrica para cerca de 80 milhões de brasileiros que residem nas regiões em que a tensão da rede é de 127 V. A tabela abaixo apresenta algumas características de duas lâmpadas de 60 W, projetadas respectivamente para 127 V (antiga) e 120 V (nova), quando ambas se encontram ligadas numa rede de 127 V. Lâmpada (projeto original) Tensão da rede elétrica Potência medida (watt) Lumino sidade medida (lúmens) Vida útil média (horas) 60 W – 127 V 127 V 60 750 1.000 60 W – 120 V 127 V 65 920 452 Acender uma lâmpada de 60 W e 120 V em um local onde a tensão na tomada é de 127 V, comparativamente a uma lâmpada de 60 W e 127 V no mesmo local, tem como resultado: a) mesma potência, maior intensidade de luz e maior durabilidade. b) mesma potência, maior intensidade de luz e menor durabilidade. c) maior potência, maior intensidade deluz e maior durabilidade. d) maior potência, maior intensidade de luz e menor durabilidade. e) menor potência, menor intensidade de luz e menor durabilidade. GRÁFICOS ESTATÍSTICOS O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil: a) Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros. b)Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. c) Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo. Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas. DIAGRAMAS Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, fazemos uso do sistema cartesiano. Dentre os principais diagramas, destacamos: Gráfico em linha ou em curva; Gráfico em coluna ou em barras; Gráfico em colunas ou em barras múltiplas; Gráfico em setores. Gráfico em linha ou em curva Os dados, geralmente de uma série (tabela), são colocados num sistema cartesiano ortogonal. Graficamente, temos pontos ligados por segmentos de reta. Exemplos: a) VENDA DE TRATORES DE UMA FÁBRICA - 2000 Mês Unidades vendidas Janeiro 20 Fevereiro 12 Março 16 Abril 24 Maio 8 Junho 18 Dados fictícios Ana Lúcia Guimarães Carvalho ESTATÍSTICA 9 0 4 8 12 16 20 24 J F M A M J v e n da s mês b) DESEMPENHO DOS CANDIDATOS 1º SEMESTRE - 2001 Desempenho (%) Candidatos Mês A B C Janeiro 12 30 40 Fevereiro 16 25 36 Março 20 20 40 Abril 24 18 32 Maio 30 20 35 Dados fictícios 0 5 10 15 20 25 30 35 40 45 J F M A M A B C D e s e m pe n ho (% ) Mês Exercícios Construa o gráfico de linhas para as tabelas a seguir: a) VENDA DE AUTOMÓVEIS 1º SEMESTRE 2001 Mês Unidades vendidas Janeiro 12 Fevereiro 20 Março 18 Abril 24 Maio 16 Junho 8 Dados hipotéticos b) PRONTO SOCORRO – CASOS Dias da semana Atendimento Segunda 12 Terça 20 Quarta 18 Quinta 24 Sexta 16 Sábado 8 Dados fictícios c) DISCOS VENDIDOS (em milhões) Anos Vendas 1992 76,6 1993 44,8 1994 44,3 1995 34,5 1996 44 1997 60 Dados hipotéticos d) COMÉRCIO EXTERIOR BRASIL – 1989-98 Anos Quantidade (1.000 t) Exportação Importação 1989 98.010 75.328 1990 109.100 71.855 1991 123.994 64.066 1992 119.990 60.718 1993 178.790 55.056 1994 141.737 53.988 1995 146.351 48.870 1996 133.832 60.605 1997 142.382 61.975 1998 169.396 58.085 Fonte: Dados hipotéticos Gráfico em colunas ou em barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Ana Lúcia Guimarães Carvalho ESTATÍSTICA 10 Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. Exemplos: a) Gráfico em colunas CONSTRUÇÃO DE AERONAVES BRASIL - 1994-99 ANOS UNIDADES 1994 184 1995 171 1996 167 1997 203 1998 199 1999 197 Fonte: Dados Hipotético Construção de Aeronaves Brasil – 1994-99 0 50 100 150 200 250 1994 95 96 97 98 99 U n id a de s Anos b) Gráfico em barras PRODUÇÃO DE ALHO BRASIL – 2000 Estados Quantidade (t) Santa Catarina 13.973 Minas Gerais 13.389 Rio Grande do Sul 6.892 Goiás 6.130 São Paulo 4.179 Fonte fictícia Produção de Alho Brasil – 2000 0 2 4 6 8 10 12 14 São Paulo Goiás Rio Grande do Sul Minas Gerais Santa Catarina toneladas c) Gráfico em colunas ou em barras múltiplas Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. Exemplo: PÚBLICO NO BRASIL QUE FREQÜENTA CINEMA - 1994-2000 Ano Filmes nacionais % Filmes estrangeiros % 1994 16 84 1995 18 82 1996 21 79 1997 25 75 1998 30 70 1999 29 71 2000 31 69 Fonte hipotética Ana Lúcia Guimarães Carvalho ESTATÍSTICA 11 Público no Brasil que Freqüenta Cinema 0 10 20 30 40 50 60 70 80 90 100 94 95 96 97 98 99 00 Filmes nacionais Filmes estrangeiros Pe rc e n tu a l Ano Fonte hipotética Exercícios 1) Represente as tabelas usando o gráfico em colunas: a) CHEGADA DE VISITANTES BRASIL - 1997-2000 ANOS NÚMERO (milhares) 1997 1.450 1998 1.550 1999 1.700 2000 1.900 Fonte: hipotética b) ENTREGA DE GASOLINA PARA CONSUMO - BRASIL – 1997-00 ANOS QUANTIDADE (1.000 m3) 1997 9.700 1998 11.100 1999 9.727 2000 9.347 Dados hipotéticos 2) Usando o gráfico em barras, represente as tabelas: a) PRODUÇÃO DE OVOS DE GALINHA BRASIL - 1999 REGIÃO QUANTIDADE (1.000 dúzias) Norte 66.092 Nordeste 356.810 Sudeste 937.463 Sul 485.098 Centro-Oeste 118.468 Fonte: Hipotética b) MORADORES DO BAIRRO A, SEGUNDO O HÁBITO DE ASSISTIR A NOVELAS HÁBITO PERCENTUAL Sim 82% Não 18% Total 100% Fonte: fictícia 3) Represente as tabelas por meio de um gráfico de colunas múltiplas. a) NATALIDADE SEGUNDO AS REGIÕES DO PAÍS (em %) 1940 1960 1980 Norte 54,4 57,4 43,6 Nordeste 53,5 52,6 41,5 Sudeste 43,7 42,5 28,9 Sul 39,2 41,7 29,4 Centro-Oeste 46,8 47,0 35,9 Fonte: jornal Folha de S. Paulo, 21/7/88 Gráfico em Setores Este gráfico é construído com base em um círculo, e é empregado sempre que Ana Lúcia Guimarães Carvalho ESTATÍSTICA 12 desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a 360º. Exemplo: REBANHOS BRASILEIROS 1988 ESPÉCIE QUANTIDADE (milhões de cabeças) Bovinos 140 Suínos 32 Ovinos 20 Caprinos 11 Total 203 Fonte: IBGE Temos: x2 = 56,7 x2 = 57º x3 = 35,4 x3 = 35º x4 = 19,5 x4 = 20º Com esses dados (valores em graus), marcamos num círculo de raio arbitrário, com um transferidor, os arcos correspondentes, obtendo o gráfico: REBANHOS BRASILEIROS – 1988 Bovino Suíno Ovino Caprino Fonte: IBGE Exercícios: 1) Represente as tabelas por meio de gráficos em setores. a) QUEM DOMINA O SETOR FARMACÊUTICO % de participação no mercado Número de companhias Americana 22 Italiana 4 Inglesa 6 Francesa 5 Alemã 10 Austríaca/Holandesa 2 Suíça 6 Subtotal 280 Origem nacional 55 Total 335 Fonte: Jornal Folha de S, Paulo, 23/7/88 c) A OCUPAÇÃO DE CADAUM Fonte: Revista Veja, jun/87 c) ÁREA TERRESTRE BRASIL REGIÕES RELATIVA (%) Norte 45,25 Nordeste 18,28 Sudeste 10,85 Sul 6,76 Centro-Oeste 18,86 Total 100,00 Fonte: IBGE x1= 248,2 x1 = 248º 203 __ 360º 140 __ x1 Fazendeiros e empresários Executivos, profissionais liberais e outros Operários Total no Congresso 37% 62% 1% PMDB 39% 60% 0,3% PFL 37% 62% 0,0% PDS 50% 50% 0,0% PDT 19% 76% 4% PT 0% 80% 19% Ana Lúcia Guimarães Carvalho ESTATÍSTICA 13 Cartograma O cartograma é a representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Distinguimos duas aplicações: a) Representar dados absolutos (população) – neste caso, lançamos mão, em geral, dos pontos, em número proporcional aos dados. b) Representar dados relativos (densidade) – neste caso, lançamos mão, em geral, de hachuras. Exemplo: POPULAÇÃO PROJETADA DA REGIÃO SUL DO BRASIL - 1990 ESTADO POPULAÇÃO (hab.) ÁREA (Km2) DENSIDADE Paraná 9.137.700 199.324 45,8 Santa Catarina 4.461.400 95.318 46,8 Rio Grande do Sul 9.163.200 280.674 32,6 Fonte: IBGE POPULAÇÃO PROJETADA DA REGIÃO SUL DO BRASIL - 1990 DENSIDADE POPULACIONAL PROJETADA DA REGIÃO SUL DO BRASIL - 1990 Pictograma O pictograma constitui um dos processos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Exemplos: AUMENTA CONSUMO DE GÁS (Consumo mensal de gás de nafta na região metropolitana de São Paulo em milhões me m3) Fonte: Jornal Folha de S. Paulo, jul./88 Menos de 33,0 hab/Km2 Menos de 46,0 hab/Km2 Menos de 47,0 hab/Km2 • 400.000 habitantes 27,39 JAN./88 28,00 FEV./ 28,71 MAR./ 29,03 ABR./ 30,15 MAI./ Ana Lúcia Guimarães Carvalho ESTATÍSTICA 14 CRESCE O NÚMERO DE PASSAGEIROS NOS ÔNIBUS URBANOS DE CAMPINAS (SP) (em milhões) Fonte: Jornal Folha de São Paulo, jul./98 APURAÇÃO DOS VOTOS PARA PRESIDENTE Até 22h34, em % Fonte: jornal Folha de S. Paulo, 5 out. 1994 Exercícios 1)(Enem) Um estudo sobre o problema do desemprego na Grande São Paulo, no período 1985-1996, realizado pelo SEADE- DIEESE, apresentou o seguinte gráfico sobre taxa de desemprego. Pela análise do gráfico, é correto afirmar que, no período considerado: a) a maior taxa de desemprego foi de 14%. b) A taxa de desemprego no ano de 1995 foi a menor do período. c) A partir de 1992, a taxa de desemprego foi decrescente. d) No período 1985-1996, a taxa de desemprego esteve entre 8% e 16%. e) A taxa de desemprego foi crescente no período compreendido entre 1988 e 1991. MÉDIAS ANUAIS DA TAXA DE DESEMPREGO TOTAL GRANDE SÃO PAULO 1985-1996 0% 2% 4% 6% 8% 10% 12% 14% 16% 85 86 87 88 89 90 91 92 93 94 95 96 Fonte: SEP, Convênio SEADE-DIEESE 2)(Enem) Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns canais de televisão, entre 20h e 21h, durante uma determinada noite. Os resultados obtidos estão representados no gráfico de barras a seguir: 0 20 40 60 80 100 TvA TvB TvC TvD Nenhum canal N º de re s id e n c ia I. O número de residências atingidas nessa pesquisa foi, aproximadamente , de: a) 100 c) 150 e) 220 b) 135 d) 200 II. A percentagem de entrevistados que declararam estar assistindo à TvB é aproximadamente igual a: a) 15% c) 22% e) 30% b) 20% d) 27% 140,1 1993 152,4 1994 158,8 1995 162,1 1996 166,2 1997 FHC (PSDB) Lula (PT) Enéas (Prona) Quércia (PMDB) Amim (PPR) Brizola (PDT) 54,0 24,2 6,7 5,8 5,6 2,9 Ana Lúcia Guimarães Carvalho ESTATÍSTICA 15 3)(Univali) O gráfico mostra as vendas de televisores em uma loja: 0 10 20 30 40 50 60 Jan. Fev. Mar. Abr. Maio Jun. Mês U n id a de s v e n di da s Pode-se afirmar que: a) as vendas aumentaram mês a mês. b) foram vendidos 100 televisores até junho. c) as vendas do mês de maio foram inferiores à soma das vendas de janeiro e fevereiro. d) foram vendidos 90 televisores até abril. e) Se cada televisor é vendido por R$240,00, em maio a loja faturou, com as vendas desse produto, R$7.200,00. 4)(Enem) Para convencer a população local da ineficiência da Companhia Telefônica Vilatel na expansão da oferta de linhas, um político publicou no jornal local o gráfico I, abaixo representado. A companhia Vilatel respondeu publicando dias depois o gráfico II, onde pretende justificar um grande aumento na oferta de linhas. O fato é que, no período considerado, foram instaladas, efetivamente, 200 novas linhas telefônicas. Gráfico I 2.000 2.020 2.040 2.060 2.080 2.100 2.120 2.140 2.160 2.180 2.200 Jan. Abr. Ago. Dez.N º to ta l d e lin ha s te le fô n ic a s GRÁFICO II 2.000 2.050 2.100 2.150 2.200 Jan. Abr. Ago. Dez.Nº to ta l d e lin ha s te le fô n ic a s Analisando os gráficos, pode-se concluir que: a) o gráfico II representa um crescimento real maior do que o do gráfico I. b) o gráfico I apresenta o crescimento real. Sendo o II incorreto. c) o gráfico II apresenta o crescimento real, sendo o gráfico I incorreto. d) a aparente diferença de crescimento nos dois gráficos decorre da escolha das diferentes escalas. e) os dois gráficos são incomparáveis, pois usam escalas diferentes. 5) Analisando o gráfico responda: a) Quantas unidades do produto A foram vendidas em janeiro? E em fevereiro? b) Em que mês o produto B atingiu a venda de 70.000 unidades? c) Em que mês os dois produtos tiveram o mesmo número de unidades vendidas? d) Em que meses o produto B foi mais vendido que o produto A? 6) O gráfico nos mostra o número de chamadas telefônicas ocorridas numa determinada cidade de 1995 a 1999. Construa uma tabela que represente esse gráfico. 0 10 20 30 40 50 60 70 80 90 JAN FEV MAR ABR MAI JUN meses v e nd a ( e m mil Produto A Produto B Ana Lúcia Guimarães Carvalho ESTATÍSTICA 16 7) O gráfico a seguir fornece a evolução do preço médio de um videocassete brasileiro, de 1994 a 1999. Construa a tabela referente ao gráfico e responda: 0 200 400 600 800 1000 1200 1994 1995 1996 1997 1998 1999 anos pr e ço s (U S$ ) 8) O gráfico nos mostra o movimento de importações e das exportações de um país, de 1995 a 1999. Faça uma tabela que represente esse gráfico. 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 1995 1996 1997 1998 1999 Importação Exportação anos m il hõ e s de dó la r e s 9) O gráfico abaixo nos mostraa participação em 47 vôos semanais para o exterior de algumas empresas brasileiras (dados de outubro de 1991). Construa a tabela referente ao gráfico apresentado. 9% 23% 68% Varig Transbrasil Vasp TÉCNICA DE SOMATÓRIO Para indicarmos a soma dos xi (x índice i) valores de uma variável x, isto é, a soma de x1 + x2 + x3 + ... + xn, utilizamos o símbolo grego sigma (Σ), denominado, em Matemática, SOMATÓRIO. Assim, a soma x1 + x2 + x3 + ... + xn pode ser representado por ∑ = n 1i ix (somatório de xi, onde x varia de 1 a n). TÉCNICAS DE SOMATÓRIO são as técnicas que auxiliam na soma dos xi valores de uma variável x. VARIÁVEL é o conjunto de valores possíveis que representam um fenômeno. 0 50 100 150 200 250 300 350 400 450 1995 1996 1997 1998 1999 anos n úm e r o de c ha m a da s a) Que nome se dá a esse tipo de gráfico? b) Qual era o preço médio do videocassete brasileiro em 1987? c) Qual a variação do preço médio do videocassete brasileiro entre 1986 e 1991? Fonte: revista Veja Fonte: revista Isto É Ana Lúcia Guimarães Carvalho ESTATÍSTICA 17 Ex.: x = {0, 1, 2, 3, ..., 10} x = variável i = índice ou ordem que o elemento ocupa na seqüência x1 = 0 x3 = 2 x2 = 1 x4 = 3 , e assim por diante. SEQÜÊNCIA é uma função cujo domínio é o conjunto de números positivos que indicam a posição. Ex.: X = {x1, x2, x3, ... , xn} ⇒ {1, 2, 3, .. , n} é o conjunto das posições PROPRIEDADES: a) ∑ = n 1i ix = x1 + x2 + x3 + ... + xn Ex.: Sendo o conjunto X = {1, 3, 5, 6, 8, 9} faça: • ∑ = 6 1i ix = x1 + x2 + x3 + x4 + x5 + x6 = 1 + 3 + 5 + 6 + 8 + 9 = 32 • ∑ = 5 3i ix = x3 + x4 + x5 = 5 + 6 + 8 =19 b) ∑ = n 1i k = 44 344 21 vezesn k...kkk ++++ = n·k, onde k é uma constante real. Ex.: Determine 8 1 7 i = ∑ = 8 + 8 + 8 + 8 + 8 + 8 + 8 = 7·8 = 56 c) i n 1i xk∑ = = kx1 + kx2 + kx3 + kx4 + ...+ kxn = k·∑ = n 1i ix , onde k é uma constante real. Ex.: Sendo o conjunto x = {1, 3, 5, 6, 8, 9} determine: ∑ = 6 2i ix3 = 3x2 + 3x3 + 3x4 + 3x5 + 3x6 = 3·3 + 3·5 + 3·6 + 3·8 + 3·9 = 93 Aplicando a propriedade temos, ∑ = 6 2i ix3 = 3·∑ = 6 2i ix = 3(x2 + x3 + x4 + x5 + x6) = 3(3 + 5 + 6 + 8 + 9) = 3·31 = 93 d) xi jji ∑∑ = x11 + x12 + ... + xij Seja por exemplo a tabela J Níveis fator 2 i Níveis fator 1 1 2 3 1 X11 X12 X13 Σx1j 2 X21 X22 X23 Σx2j Σxi1 Σxi2 Σxi3 Σxij P N 1 2 3 1 28 35 46 109 2 36 48 62 146 64 83 108 255 xij ⇒ i → linha j → coluna como fica a notação de somatório: da 1ª coluna → x11 + x21 = ∑ = 2 1i x i1 = 28 + 36 = 64 da 1ª linha → x11 + x12 + x13 = ∑ = 3 1j x 1j = 28 + 35 + 46 = 109 Ana Lúcia Guimarães Carvalho ESTATÍSTICA 18 Ex. Seja a matriz M = 98 64 determine ∑∑ = =2i 2 1j ijx = x21 + x22 = 8 + 9 = 17 e)∑ = n 1i iiyx = x1·y1 + x2·y2 + ... + xn·yn Ex.: Sejam os conjuntos X={0,1,2,3,4,5,6} e Y = {5,6,7,8,9}, determine: ∑ = 5 3i iiyx = 2·7 + 3·8 + 4·9 = 14 + 24 + 36 = 74 f) ∑ = + n 1i ii )yx( = (x1 + y1)+(x2 + y2)+...+(xn + yn) = ∑ = n 1i ix + ∑ = n 1i iy Ex.: Sejam os conjuntos X = {0,1,2,3, 4,5,6} e Y = {5,6,7,8,9}, determine: ∑ = + 5 2i ii )yx( = ∑ = 5 2i ix + ∑ = 5 2i iy = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 = 44 g) ∑ = + n 1i t i )ax( = (x1 + a)t + (x2 + a)t + (x3 + a)t + ... + (xn + a)t , onde a é uma constante real Ex.: Seja X = {2, 3, 4, 5, 6}, determine: ∑ = + 4 1i 2 i )1x( = ( 2 + 1)2 + (3 + 1)2 + (4 + 1)2 + (5 + 1)2 = 32 + 42 + 52 + 62 = 9 + 16 + 25 + 36 = 86 EXERCÍCIOS 1) Desenvolva os seguintes somatórios: a) ∑ = 7 1i ix c) ∑ = 7 3i ix b) ∑ = 3 1i iy d) ∑ = 10 4i iy 2) Sendo X = {2, 5, 6, 7} calcule: a) ∑ = 4 1i ix b)∑ = 2 1i ix c) ∑ = + 3 1i i )1x( d)∑ = + 4 2i 2 i )3x( 3) Sendo X = {1, 2, 3, 6}, calcule: a) ∑ = ⋅ 4 1i ix10 b)∑ = ⋅+ 4 1i i)x102( 4) Calcule os seguintes somatórios, sendo Y = {0, 4, 3, 7} a) ∑ = 3 1i iy b) ∑ = 4 1i 8 c) ∑ = 4 1i iy4 d) ∑ = ⋅ 3 1i i 10y e)∑ = + 3 1i i)y125( f)∑ = − 3 1i i )y3( g) ∑ = −+ 4 1i ii )10y3y4( h) ∑ = +− 4 1i ii )y2y3( 5) Sendo X = {3, 7, 2, 1} e Y = {0, 3, 1, 2}, calcule: a) ∑ = + 4 1i ii )yx( b) ∑ = − 4 1i ii )yx( c) ∑ = + 2 1i 2 i )x2( d) ∑ = + 4 1i 2 ii )yx( Ana Lúcia Guimarães Carvalho ESTATÍSTICA 19 e) ∑ = 4 1i ii yx f) ∑ = + 4 1i i )1x( f) ∑ = 4 1i ix +∑ = 4 1i iy g) ∑ = ++ 4 1i ii )y2x( 6) Sendo ∑ = 4 1i ix =10 , ∑ = 4 1i iy =20 e ∑ = 4 1i 2 ix =30, calcule: a) ∑ = + 4 1i ii )yx( b) ∑ = + 4 1i 2 i )3x( c) ∑ = + 4 1i ii )yx4( 7) Sendo M = −− −− 1253 5421 3362 , determine: a) ∑ = 3 1i 2ix b) ∑ = 4 1j j3x c) ∑ ∑ = = 3 1i 3 2j ijx d)∑∑ = = 3 1i 4 1j ijx DISTRIBUIÇÃO DE FREQÜÊNCIA Exemplo: Tabela primitiva Estatura de 40 alunos do Colégio A 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Rol Estatura de 40 alunos do Colégio A 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 No exemplo dado, a variável em questão, estatura, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido.] Denominamos freqüência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de freqüência: Tabela I ESTATURA DE 40 ALUNOS DO COLÉGIO A ESTAT. (cm) FREQ. ESTAT. (cm) FREQ. 150 1 163 2 151 1 164 3 152 1 165 1 153 1 166 1 154 1 167 1 155 4 168 2 156 3 169 1 157 1 170 1 158 2 172 1 160 5 173 1 161 4 162 2 TOTAL 40 Freqüência – repetição de determinado dado. Tabela Primitiva – tabela cujos elementos não foram numericamente organizados Rol – tabela obtida após a ordenação dos dados . Ana Lúcia Guimarães Carvalho ESTATÍSTICA 20 O processo dado exige muito espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. A solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em váriosintervalos. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em estatística, preferimos chamar os intervalos de classes. Chamando de freqüência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela anterior podem ser dispostos em uma tabela denominada distribuição de freqüência com intervalos de classe. Tabela II ESTATURA DE 40 ALUNOS DO COLÉGIO A ESTATURAS (cm) FREQÜÊNCIA 150├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 Total 40 OBS: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando, para isso o símbolo ├ (inclusão de li e exclusão de Li). Ao agruparmos os valores da variável em classes, ganhamos em simplicidade mas perdemos em pormenores. Assim, na tabela I, podemos verificar, facilmente, que quatro alunos têm 161 cm de altura e que não existe nenhum aluno com 171 cm de altura. Já na tabela II não podemos ver se algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que onze alunos têm estatura compreendida entre 158 e 162 cm. O que se pretende com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade analisar o conjunto de valores, desinteressando-se por casos isolados. Exercício: 1) Observe a tabela seguinte. Algumas informações sociais sobre os 30 funcionários da Indústria Santo Afonso. Nº Estado Civil Nº de depen dentes Grau de instrução Salário (x mínimo) 1 casado 2 1º grau 3 2 casado 2 1º grau 3 solteiro 0 2º grau 6 4 divorc. 2 2º grau 6 5 casado 2 superior 15 6 solteiro 0 1º grau 3 7 casado 2 2º grau 6 8 casado 3 1º grau 3 9 solteiro 0 1º grau 3 10 casado 2 1º grau 3 11 divorc. 3 1º grau 3 12 casado 2 1º grau 3 13 casado 2 1º grau 3 14 casado 2 2º grau 15 15 solteiro 0 1º grau 4 16 solteiro 0 2º grau 8 17 solteiro 1 1º grau 4 18 casado 2 1º grau 4 19 casado 2 2º grau 8 20 divorc. 2 1º grau 4 21 solteiro 1 superior 15 22 casado 3 1º grau 4 23 casado 2 2º grau 8 24 solteiro 0 1º grau 4 25 casado 2 2º grau 8 26 solteiro 1 1º grau 4 27 solteiro 0 2º grau 8 28 casado 2 1º grau 4 29 solteiro 0 2º grau 8 30 solteiro 0 1º grau 4 Fonte: dados hipotéticos Elabore uma tabela de freqüência (absoluta e relativa) considerando como variável: a) o estado civil. b) o número de dependentes. Ana Lúcia Guimarães Carvalho ESTATÍSTICA 21 c) O grau de instrução. d) O salário. 2) As notas de Estatística de uma turma de 50 alunos estão anotadas na tabela a seguir. Faça uma tabela de freqüência (absoluta e relativa) para essas notas. NOTAS DE ESTATÍSTICA 4 6 8 5 8 5 7 4 10 6 7 5 6 4 6 7 10 10 5 10 5 7 5 8 7 4 5 6 7 6 7 9 9 6 5 9 6 5 9 8 10 8 5 6 7 5 6 8 5 4 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA 1 – Classe As classes são representadas simbolicamente por i, sendo i = 1,2,3, ... ,K (onde K é o número total de classes da distribuição). 2 – Limites de classe O menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da classe ( Li ) . 3 – Amplitude de um intervalo de classe Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi. Assim: 4 – Amplitude total da distribuição 5 – Amplitude amostral 6 – Ponto médio de uma classe Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos limites da classe ( média aritmética): 7 – Freqüência simples ou absoluta Classes de freqüência ou, simplesmente, classes são intervalos de variação da variável. Determinamos limites de classe os extremos de cada classe. Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. hi = L i - li Amplitude total da distribuição ( AT ) é a diferença da última classe ( limite superior máximo) e o limite inferior da primeira classe ( limite inferior mínimo). AT = L(máx.) – l(mín.) Amplitude amostral ( AA ) é a diferença entre o valor máximo e o valor mínimo da amostra. AA = x(max.) – x(min.) Ponto médio de uma classe ( xi ) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. 2 Ll x iii + = Freqüência simples ou freqüência absoluta ou, simplesmente freqüência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. Ana Lúcia Guimarães Carvalho ESTATÍSTICA 22 A freqüência simples é simbolizada por fi ( lemos: f índice i ou freqüência da classe i ). A soma de todas as freqüências é representada pelo símbolo de somatório: NÚMERO DE CLASSES INTERVALO DE CLASSE Para a determinação do número de classes de uma distribuição podemos lançar mão da regra de Sturger, que nos dá o número de classes em função do número de valores da variável: onde: i é o número de classe; n é o número total de dados. Decidido o número de classes que deve ter a distribuição, resta-nos resolver o problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo número de classes: Quando o resultado não é exato, devemos arredonda-lo para mais. Exercício: 1) As notas obtidas por 50 alunos de uma classe foram: 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 a) Complete a distribuição de freqüência : i Notas xi fi 1 0 ├ 2 2 2 ├ 4 3 4 ├ 6 4 6 ├ 8 5 8 ├10 ∑ =if b) Agora, responda: 1) Qual a amplitude amostral? 2) Qual a amplitude da distribuição? 3) Qual o número de classes da distribuição? 4) Qual o limite inferior da quarta classe? 5) Qual o limite superior da classe de ordem 2? 6) Qual a amplitude do segundo intervalo de classe? c) Complete: 1) h3 = _____ 2) l1 = _____ 3) x2 = ___ 4) n = _____ 5) L3 = ____ 6) f5 = ____ TIPOS DE FREQÜÊNCIA A soma das freqüências simples é igual ao número total dos dados: ∑ = k 1i fi i ≅ 1 + 3,3 . log n h ≅ i AT Freqüências simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe. nf i =∑ Freqüência relativa (fri) são os valores das razões entre as freqüências simples e a freqüência total ∑ = i i i f f fr Ana Lúcia Guimarães Carvalho ESTATÍSTICA 23 O propósito das freqüências relativas é o de permitir a análise ou facilitar as comparações. DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALODE CLASSE Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe e, nesse caso, a distribuição é chamada distribuição sem intervalo de classe, tomando a seguinte forma: xi fi x1 f1 x2 f2 : : xn fn ∑ = nf i Exemplo: Seja X a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”: i xi fi 1 2 4 2 3 7 3 4 5 4 5 2 5 6 1 6 7 1 ∑ = 20 Exercícios: 1) Considerando as notas de um teste de inteligência aplicado a 100 alunos: 64 78 66 82 74 103 78 86 103 87 73 95 82 89 73 92 85 80 81 90 78 86 78 85 98 75 73 90 86 101 86 84 86 76 76 83 86 84 85 103 76 80 92 73 87 70 85 79 93 102 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 71 73 63 74 98 78 78 83 96 105 95 94 88 62 91 83 98 93 83 76 94 75 67 95 708 98 71 92 72 73 Forme uma distribuição de freqüência. Determine: a) ∑ if b) fri c) Fi d) Fri 2) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nº acidentes 0 1 2 3 4 5 6 7 Nº motoristas 20 10 16 9 6 5 3 1 Determine: a) o número de motoristas que não sofreram nenhum acidente: b) o número de motoristas que sofreram pelo menos 4 acidentes; c) o número de motoristas que sofreram menos de 3 acidentes; d) o número de motoristas que sofreram no mínimo 3 e no máximo 2 acidentes; e) a percentagem dos motoristas que sofreram no máximo 2 acidentes. 3) Sejam as alturas (em centímetros) de 25 alunos de uma determinada classe: Freqüência acumulada (Fi) é o somatório de todas as classes anteriores da referida classe. Fk = f1 + f2 + ... + fk Freqüência acumulada relativa (Fri) de uma classe é a freqüência acumulada da classe, dividida pela freqüência total da distribuição. ∑ = i i i f F Fr Ana Lúcia Guimarães Carvalho ESTATÍSTICA 24 150 159 157 151 152 156 153 163 159 175 162 162 164 158 159 164 168 166 160 162 a) Calcule a amplitude do rol. b) Calcule a amplitude para cada intervalo de classe. c) Ache a distribuição de freqüência com intervalos de classe, a freqüência relativa, a freqüência acumulada e a freqüência acumulada relativa. 4) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: ÁREAS (m2) Nº DE LOTES 300 ├ 400 14 400 ├ 500 46 500 ├ 600 58 600 ├ 700 76 700 ├ 800 68 800 ├ 900 62 900 ├ 1000 48 1000 ├ 1100 22 1100 ├ 1200 6 Com referência a essa tabela, determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a freqüência da quarta classe; g) a freqüência relativa da sexta classe; h) a freqüência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700 m 2; j) o número de lotes cuja área atinge e ultrapassa 800 m2; k) a percentagem dos lotes cuja área não atinge 600 m2; l) a percentagem dos lotes cuja área seja maior ou igual a 900 m2; m) a percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1.000m2; n) a classe do 72º lote; o) até que classe estão incluídos 60% dos lotes. 5) Baseando que um amostra apresentou os resultados abaixo, clacule a amplitude do intervalo de classe ( h ) e o número total de classes ( i ). a) n=50 AA=150 b) n=70 AA=10 6) Complete os dados que faltam na distribuição de freqüência: a) I Xi fi fri fi 1 0 1 0.05 2 1 0.15 4 3 2 4 4 3 0.25 13 5 4 3 6 5 18 7 6 19 8 7 ∑ = 20 ∑ = 001. b) i Classes xi fi Fi fri 1 0 ├ 2 1 4 0,04 2 2 ├ 4 8 3 4 ├ 6 5 30 0,18 4 7 27 0,27 5 15 72 6 10 ├ 12 83 7 13 10 93 0,10 8 14 ├ 16 0,07 ∑ = ∑ = REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Uma distribuição de freqüência pode ser representada graficamente pelo histograma, pelo polígono de freqüência e pelo polígono de freqüência acumulada (ogiva de Galton). Ana Lúcia Guimarães Carvalho ESTATÍSTICA 25 Construímos qualquer um dos gráficos mencionados utilizando o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical ( eixo das ordenadas), as freqüências. HISTOGRAMA As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. As alturas dos retângulos devem ser proporcionais às freqüências das classes, sendo a amplitude dos intervalos iguais. Isso nos permite tomar as alturas numericamente iguais às freqüências. Exemplo: À distribuição da tabela corresponde o seguinte histograma: ESTATURA DE 40 ALUNOS DO COLÉGIO A i ESTATURAS (cm) fi 1 150├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 Total ∑ = 40f i 0 2 4 6 8 10 12 150 158 162 166 170 174 fre qu ên ci a classes 154 O histograma goza de uma propriedade da qual faremos considerável uso: a área de um histograma é proporcional à soma das freqüências. POLÍGONO DE FREQÜÊNCIA Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Exemplo: ESTATURA DE 40 ALUNOS DO COLÉGIO A i ESTATURAS (cm) fi 1 150├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 Total ∑ = 40f i 0 2 4 6 8 10 12 148 152 156 160 164 168 172 176 fre qu ên ci a Estatura No caso de termos uma variável essencialmente positiva, cuja distribuição se inicie no valor zero, devemos considerar um intervalo anterior localizado no semi-eixo negativo. Porém consideraremos apenas a parte positiva do segmento que liga o ponto médio O histograma é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. O polígono de freqüência é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Ana Lúcia Guimarães Carvalho ESTATÍSTICA 26 desse intervalo com a freqüência do intervalo 0├ ... . POLÍGONO DE FREQÜÊNCIA ACUMULADA Exemplo: ESTATURA DE 40 ALUNOS DO COLÉGIO A i ESTATURAS (cm) fi 1 150├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 Total ∑ = 40f i 0 10 20 30 40 150 154 158 162 166 170 174 Fr e qü e n c ia Estatura GRÁFICO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALO DE CLASSE Uma distribuição de freqüência sem intervalo de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva freqüência. Exemplo: i xi fi Fi 1 2 4 4 2 3 7 11 3 4 5 16 4 5 2 18 5 6 1 19 6 7 120 ∑ = 20 0 2 4 6 8 1 2 3 4 5 6 7 Fr e qü ên c ia Também podemos representar a distribuição pelo gráfico da freqüência acumulada, o qual se apresentará com pontos de descontinuidade nos valores observados da variável: Exercícios: 1) Dada a distribuição abaixo, construa para os dados apresentados: Áreas (m2) nº de lotes 300 ├ 400 14 400 ├ 500 46 500 ├ 600 58 600 ├ 700 76 700 ├ 800 68 800 ├ 900 62 900 ├ 1000 48 1000 ├ 1100 22 1100 ├ 1200 6 O polígono de freqüência acumulada é traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Ana Lúcia Guimarães Carvalho ESTATÍSTICA 27 a) O histograma; b) o polígono de freqüência; c) o polígono de freqüência acumulada. 2) Dada a distribuição abaixo, construa para os dados apresentados: i Classes fi 1 4 ├ 8 2 2 8 ├ 12 5 3 12 ├ 16 9 4 16 ├ 20 6 5 20 ├ 24 2 6 24 ├ 28 1 Σ = 25 3) Conhecidas as notas de 50 alunos: 68 85 33 52 66 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 88 66 66 73 42 65 94 88 89 pede-se: a) A distribuição de freqüência começando por 30 e adotando-se o intervalo de classe de amplitude igual a 10. b) A freqüência acumulada. c) O histograma. d) O polígono de freqüência. f) O polígono de freqüência acumulada. 4) A tabela abaixo apresenta os coeficientes de liquidez obtidos da análise de balanço em 50 indústrias 3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6 18,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4 4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 7,5 8,7 4,4 7,9 16,0 pede-se: a) Formar com esses dados uma distribuição com intervalos de classe igual a 3, tais que os limites inferiores sejam múltiplos de 3. b) Confeccionar o histograma. c) O polígono de freqüência. d) O polígono de freqüência acumulada correspondente. 5) Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo: Nebulo sidade 0 ├ 0,5├ ,5├ 2,5├ 3,5├ 4,5├ 5,5 ├ 6,5├ 7,5├ 8,5├ 9,5├ 10 fi 320 125 75 65 45 45 55 65 90 145 676 Pede-se: a) A freqüência acumulada. b) O histograma. c) O polígono de freqüência. d) O polígono de freqüência acumulada. 6) Dado o histograma abaixo, construa: 0 2 4 6 8 10 12 8 10 12 14 16 18 20 22 fre qu ên ci a classes 7) Dado o polígono de freqüência abaixo, construa: 0 2 4 6 8 10 12 14 16 10 14 18 22 26 30 34 36 fre qu ên ci a X a) O histograma. b) O polígono de freqüência. c) O polígono de freqüência acumulada a) Uma tabela de freqüência para os dados apresentados. b) O polígono de freqüência. c) O polígono de freqüência acumulada. a)Uma tabela de freqüência para os dados apresentados. b) O histograma. c) O polígono de freqüência acumulada. Ana Lúcia Guimarães Carvalho ESTATÍSTICA 28 8) Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de alunos, responda: a) Qual é o intervalo de classe que tem maior freqüência? b) Qual a amplitude total da distribuição? c) Qual o número total de alunos? d) Qual é a freqüência do intervalo de classe 110 ├ 120? e) Quais os dois intervalos de classe que têm a mesma freqüência? f) Quais são os dois intervalos de classe tais que a freqüência de um é o dobro da freqüência do outro? g) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110? h) Quantos alunos receberam notas não- inferiores a 100? 0 5 10 15 20 25 30 40 60 80 100 120 160 fre qu ên ci a classes 140 9) O gráfico mostra a distribuição de uma amostra de garrafas de refrigerantes e seus respectivos volumes em mililitros: 0 100 200 300 400 500 280 300 320 Volume (ml) Fr e qü ên c ia (nº de ga rr a fa s a) Quantas garrafas compõem essa amostra? b) Qual a freqüência relativa da classe “300 ml”? MEDIDAS DE POSIÇÃO As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos a média aritmética, a mediana e a moda. MÉDIA ARITMÉTICA ( _ X ) sendo: _ x a média aritmética; ix os valores da variável; n o número de valores. Dados não-agrupados Quando desejamos conhecer a média dos dados não-agrupados, determinamos a média aritmética simples. Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para produção média da semana: 14 7 98 7 12181615131410 x == ++++++ = _ Logo: 14x = _ litros Dados agrupados Sem intervalo de classe Média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles. n x x i ∑ = _ Ana Lúcia Guimarães Carvalho ESTATÍSTICA 29 Neste caso, como as freqüências são números indicadores de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: Exemplo: Considere a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: Nº DE FILHOS fi xifi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 ∑= 34 ∑= 78 Temos, então: 32x292 34 78 x f fx x i ii ,, ___ =⇒==⇒= ∑ ∑ isto é: 32x , _ = meninos Com intervalo de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: Onde xi é o ponto médio da classe. Exemplo: Consideremos a distribuição: i ESTATURAS (cm) fi xi xifi 1 150 ├ 154 4 152 608 2 154├ 158 9 156 1.404 3 158├ 162 11 160 1.760 4 162├ 166 8 164 1.312 5 166├ 170 5 168 840 6 170├ 174 3 172 516 ∑= 40 ∑= 4406. cm161x161 40 4406 f fx x i ii =⇒=== ∑ ∑ __ . Exercícios: 1) As idades dos jogadores de um time de basquetebol são 18, 23, 19, 20 e 21 anos. Qual é a média de idade desses jogadores? 2) Entre sessenta números, vinte são iguais a 5, dez são iguais a 6, quinze são iguais a 8, dez são iguais a 12, e cinco são iguais a 1. Determine a média aritmética desses números. 3) Quatro funcionários A, B, C e D de uma empresa têm respectivamente 8, 6, 10 e 16 anos de trabalho nessa empresa. O funcionário A recebeu um prêmio de R$ 500,00 por ano de casa; B recebeu um prêmio de R$ 600,00 por ano de casa; e C e D receberam, cada um, R$ 800,00 de prêmio por ano de casa. Qual foi o prêmio médio recebido por ano de casa por esses funcionários? 4) As classes A, B e C da segunda série do ensino médio tiveram respectivamenteas seguintes médias na prova de matemática: 6,5; 6,0 e 7,0. Sabendo que a classe A é formada por 28 alunos, B é formada por 25 alunos e C, por 22 alunos, calcule a nota média de todos os 75 alunos. 5) A tabela mostra a distribuição de freqüência da carga, em toneladas, dos caminhões que passaram por uma estrada num certo período. Calcule a carga média desses caminhões. ∑ ∑ = i ii f fx x _ ∑ ∑ = i ii f fx x _ Ana Lúcia Guimarães Carvalho ESTATÍSTICA 30 Carga (em toneladas) Número de caminhões [ 9,5;14,5 [ 18 [ 14,5;19,5 [ 33 [ 19,5;25,5 ] 9 A MODA ( Mo ) Dados não-agrupados Quando lidamos com valores não- agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete. Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 tem moda igual a 10. Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 12, 13 que não apresenta moda ( amodal ). Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 temos duas modas: 4 e 7 ( bimodal ). Dados agrupados Sem intervalo de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Exemplo: Dada a distribuição Nº DE FILHOS fi 0 2 1 6 2 10 3 12 4 4 ∑= 34 A freqüência máxima ( 12 ) corresponde o valor 3 da variável. Logo: Mo = 3 Com intervalo de classe A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Temos, então: onde: l é o limite inferior da classe modal; L é o limite superior da classe modal. Exemplo: Para a distribuição: i Estaturas fi Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. 2 LlMo += Ana Lúcia Guimarães Carvalho ESTATÍSTICA 31 (cm) 1 150 ├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 ∑ = 40 2 LlMo += 160 2 320 2 162158Mo ==== Logo: Mo = 160 cm A MEDIANA ( Md ) Dados não-agrupados Dada uma série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, o primeiro passo é o da ordenação ( crescente ou decrescente ) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18 em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro elementos acima dele e quatro abaixo. Temos, então: Md = 10 Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio. Assim, a série de valores: 2, 6, 7, 10, 12, 13, 18, 21 tem para mediana a média aritmética entre 10 e 12 Logo: 11 2 22 2 1210Md ==== donde: Md = 11 Dados agrupados Se os dados agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das freqüências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: Sem intervalo de classe Neste caso, basta identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Exemplo: Dada a distribuição de freqüência: Nº DE MENINOS fi Fi 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 ∑= 34 A mediana é definida como o número que se encontra no centro de um série de números, estando estes dispostos segundo uma ordem.. É o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. 2 f Pos i∑= Ana Lúcia Guimarães Carvalho ESTATÍSTICA 32 Sendo: 17 2 34 2 f i == ∑ a menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo: Md = 2 meninos No caso de existir uma freqüência acumulada (Fi), tal que: 2 f F ii ∑ = , a mediana será dada por: isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e o seguinte. Exemplo: Dada a distribuição de freqüência: xi fi Fi 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 ∑ = 8 Temos: 4 2 8 2 f Pos i ===∑ Logo: 515 2 31 2 1615Md ,==+= Donde: Md = 15,5 Com intervalo de classe Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe mediana. Tal classe será, evidentemente, aquela correspondente à freqüência acumulada imediatamente superior a 2 f i∑ . Seguimos os seguintes passos: 1º) Determinamos as freqüências acumuladas. 2º) Calculamos 2 f i∑ 3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à 2 f i∑ - classe mediana – e, em seguida, empregamos a fórmula: na qual: l é o limite inferior da classe mediana; F(ant) é a freqüência acumulada da classe anterior à classe mediana; f é a freqüência simples da classe mediana; h é a amplitude do intervalo da classe mediana. Exemplo: Dada a distribuição de freqüência: i Estaturas (cm) fi Fi 1 150 ├ 154 4 4 2 154 ├ 158 9 13 3 158 ├ 162 11 24 4 162 ├ 166 8 32 5 166 ├ 170 5 37 6 170 ├ 174 3 40 ∑ = 40 2 xx Md 1ii ++= f hantF 2 f lMd i − += ∑ )( Classe mediana Ana Lúcia Guimarães Carvalho ESTATÍSTICA 33 Temos: 20 2 40 2 f i == ∑ Logo, a classe mediana é a de ordem 3. Então: l = 158, F(ant) = 13, f = 11 e h = 4 substituindo na fórmula: ( ) 11 28158 11 41320158Md +=−+= Md 54160542158 ,, =+= isto é: Md = 160,5 cm Exercícios 1) Considerando os conjuntos de dados: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 b) 51,6; 48,7; 50,3; 49,5; 48,9 c) 20, 9, 7, 2, 12, 7, 20, 15, 7 d) 15, 18, 20, 13, 10, 16, 14 calcule: I - a média; II - a mediana; III - a moda. 2) Os salários-hora de cinco funcionários de uma companhia são: R$ 75,00; R$ 90,00; R$ 83,00;R$ 142,00 e R$ 88,00.
Compartilhar