Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. DSc. Jefferson de Souza Pinto 0 Prof. DSc. Jefferson de Souza Pinto 1 PREFÁCIO Esta apostila foi elaborada com o objetivo principal de apresentar aos alunos os conceitos e o conhecimento da Estatística, e sua utilização na solução de diversos problemas que envolvem o atual contexto profissional. BOA SORTE EM SEUS ESTUDOS!!! Prof. DSc. Jefferson de Souza Pinto Doutor em Engenharia Mecânica - DEF/FEM/UNICAMP Pós-doutor em Engenharia Mecânica - DEF/FEM/UNICAMP Professor Concursado do IFSP desde 2010. Fevereiro/2018 Contato: jeffsouzap@gmail.com Prof. DSc. Jefferson de Souza Pinto 2 SUMÁRIO CAPÍTULO 1 - INTRODUÇÃO ......................................................................................................... 5 1.1 DADOS ESTATÍSTICOS ........................................................................................................... 5 1.2 POPULAÇÃO E AMOSTRA ...................................................................................................... 5 1.3 VARIÁVEIS CONTÍNUAS OU DISCRETAS ............................................................................ 6 1.4 ARREDONDAMENTO .............................................................................................................. 6 EXERCÍCIOS – CAPÍTULO 01 - INTRODUÇÃO ........................................................................... 7 CAPÍTULO 2 - APRESENTAÇÃO DOS DADOS ATRAVÉS DE TABELAS ............................. 8 EXERCÍCIOS - CAPÍTULO 2 - APRESENTAÇÃO DOS DADOS / TABELAS ........................... 10 CAPÍTULO 3 - APRESENTAÇÃO GRÁFICA .............................................................................. 11 3.1 GRÁFICOS PARA VARIÁVEIS QUALITATIVAS OU QUANTITATIVAS DISCRETAS .... 11 3.2 DISTRIBUIÇÃO DE FREQÜÊNCIAS ..................................................................................... 13 EXERCÍCIOS CAPÍTULO 3 - APRESENTAÇÃO GRÁFICA ....................................................... 20 CAPÍTULO 4 - MEDIDAS DE POSIÇÃO, DISPERSÃO E OUTRAS MEDIDAS .................... 25 4.1 MEDIDAS DE POSIÇÃO ......................................................................................................... 25 4.1.1 MÉDIA ARITMÉTICA .......................................................................................................... 25 4.1.2 MÉDIA GEOMÉTRICA ........................................................................................................ 26 4.1.3 MÉDIA HARMÔNICA .......................................................................................................... 27 4.1.4 MEDIANA ............................................................................................................................. 27 4.1.5 QUARTIS .............................................................................................................................. 29 4.1.6 DECIS .................................................................................................................................... 30 4.1.7 PERCENTIS ........................................................................................................................... 30 4.1.8 MODA ................................................................................................................................... 31 4.1.9 UMA ANÁLISE CONJUNTA DE ALGUMAS MEDIDAS ................................................... 33 4.1.10 “BOX AND WHISKERS PLOT” = “CAIXA COM PATAS” .............................................. 33 4.2 MEDIDAS DE DISPERSÃO..................................................................................................... 35 4.2.1 AMPLITUDE ......................................................................................................................... 35 4.2.2 VARIÂNCIA, DESVIO-PADRÃO E COEFICIENTE DE VARIAÇÃO ................................ 35 4.2.3 DESVIO PADRÃO ................................................................................................................ 36 4.2.4 COEFICIENTE DE VARIAÇÃO ........................................................................................... 37 4.2.5 AMPLITUDE INTERQUARTILÍCA (AIQ) ........................................................................... 37 4.2.6 DESVIO MÉDIO (DM) .......................................................................................................... 38 4.2.7 DESVIO QUARTÍLICO OU INTERQUARTÍLICO .............................................................. 39 4.2.8 ERRO PADRÃO (SX) ............................................................................................................ 40 4.3 MEDIDAS DE ASSIMETRIA .................................................................................................. 40 4.3.1 PRIMEIRO COEFICIENTE DE PEARSON .......................................................................... 40 4.3.2 SEGUNDO COEFICIENTE DE PEARSON .......................................................................... 41 4.4 MEDIDAS DE CURTOSE ........................................................................................................ 41 EXERCÍCIOS - CAPÍTULO 04 - MEDIDAS POSIÇÃO, DISPERSÃO E OUTRAS MEDIAS ...... 43 CAPÍTULO 5 - PROBABILIDADE ................................................................................................. 47 5.1 ESPAÇO AMOSTRAL ............................................................................................................. 47 5.2 PROBABILIDADE E SUAS PROPRIEDADES ....................................................................... 49 5.3 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE .................................................................... 49 5.4 PROBABILIDADE CONDICIONADA OU CONDICIONAL .................................................. 50 5.4.1 TEOREMAS .......................................................................................................................... 50 5.4.4.1 REGRA DO PRODUTO (TEOREMA DO PRODUTO) ...................................................... 50 5.4.4.2 TEOREMA DE PROBABILIDADE TOTAL ...................................................................... 50 5.4.4.3 TEOREMA DE BAYES ...................................................................................................... 50 EXERCÍCIOS - CAPÍTULO 5 – PROBABILIDADE ..................................................................... 53 CAPÍTULO 6- DISTRIBUIÇÕES .................................................................................................... 55 Prof. DSc. Jefferson de Souza Pinto 3 6.1 FUNÇÃO DE PROBABILIDADE ............................................................................................ 55 6.2 DISTRIBUIÇÕES DISCRETAS ............................................................................................... 56 6.2.1 DISTRIBUIÇÃO BINOMIAL ................................................................................................ 56 6.2.2 DISTRIBUIÇÃO DE POISSON ............................................................................................. 57 6.2.3 APROXIMAÇÕES DA DISTRIBUIÇÃO BINOMIAL .......................................................... 57 6.3 DISTRIBUIÇÕES CONTÍNUAS .............................................................................................. 58 6.3.1 DISTRIBUIÇÃO NORMAL .................................................................................................. 58 6.3.2 APROXIMAÇÕES PELA DISTRIBUIÇÃONORMAL......................................................... 60 EXERCÍCIOS – CAPÍTULO 6 – DISTRIBUIÇÕES DE PROBABILIDADE ................................. 61 CAPÍTULO 7 - AMOSTRAGEM .................................................................................................... 65 7.1 ETAPAS DE UM LEVANTAMENTO POR AMOSTRAGEM ................................................. 66 7.2 TIPOS DE AMOSTRAGEM ..................................................................................................... 66 7.4 AMOSTRAGEM PROBABILÍSTICA ...................................................................................... 67 7.4.1 AMOSTRAGEM CASUAL SIMPLES ................................................................................... 67 7.4.2 AMOSTRAGEM SISTEMÁTICA ......................................................................................... 67 7.4.3 AMOSTRAGEM POR CONGLOMERADOS........................................................................ 68 7.4.4 AMOSTRAGEM ESTRATIFICADA ..................................................................................... 68 7.4.5 AMOSTRAGEM POR ETAPA DUPLA (OU ESTÁGIO DUPLO) ........................................ 69 7.4.6 AMOSTRAGEM MÚLTIPLA ............................................................................................... 69 EXERCÍCIOS - CAPÍTULO 7 - AMOSTRAGEM ......................................................................... 70 CAPÍTULO 8 - DISTRIBUIÇÃO AMOSTRAL DA MÉDIA: TEOREMA CENTRAL DO LIMITE ............................................................................................................................................... 71 8.1. TEOREMA CENTRAL DO LIMITE ....................................................................................... 71 8.2. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO ................................................................. 72 8.3. GRAUS DE LIBERDADE DE UMA ESTATÍSTICA .............................................................. 72 EXERCÍCIOS - CAPÍTULO 8 -DISTRIBUIÇÃO POR AMOSTRAGEM ...................................... 74 CAPÍTULO 9 – INTERVALOS DE CONFIANÇA ....................................................................... 75 9.1 INTERVALOS DE CONFIANÇA PARA UMA POPULAÇÃO ............................................... 75 9.1.1 INTERVALO DE CONFIANÇA PARA A MÉDIA ............................................................... 75 9.1.2. INTERVALO DE CONFIANÇA PARA PROPORÇÃO ....................................................... 76 EXERCÍCIOS - CAPÍTULO 9 - INTERVALOS DE CONFIANÇA ............................................... 77 CAPÍTULO 10 – TESTES DE HIPÓTESE ..................................................................................... 79 10.1 TESTES PARA A MÉDIA POPULACIONAL........................................................................ 80 10.1.1 TESTE PARA A MÉDIA POPULACIONAL COM DESCONHECIDO E CONHECIDO ........................................................................................................................................................ 80 10.1.2 TESTE PARA A MÉDIA POPULACIONAL COM E CONHECIDO ............................ 81 10.2 TESTES PARA PROPORÇÃO POPULACIONAL ................................................................. 82 EXERCÍCIOS - CAPÍTULO 10 – TESTES DE HIPÓTESE ........................................................... 84 CAPÍTULO 11 – DETERMINAÇÃO DE TAMANHO DE AMOSTRA ..................................... 85 11.1 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA A MÉDIA POPULACIONAL . 85 11.1.1 CONHECIDO ................................................................................................................... 85 11.1.2 DESCONHECIDO ............................................................................................................ 85 11.1.3 CONHECIDO ................................................................................................................... 86 11.1.4 DESCONHECIDO ............................................................................................................ 87 11.2 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA A PROPORÇÃO POPULACIONAL .......................................................................................................................... 87 11.2.1 POPULAÇÕES INFINITAS ................................................................................................. 87 11.2.1 POPULAÇÕES FINITAS ..................................................................................................... 88 EXERCÍCIOS - CAPÍTULO 11 – DETERMINAÇÃO DE TAMANHO DE AMOSTRA ............... 90 CAPÍTULO 12 - CORRELAÇÃO E REGRESSÃO ...................................................................... 91 12.1 CORRELAÇÃO ...................................................................................................................... 91 12.2 REGRESSÃO .......................................................................................................................... 92 Prof. DSc. Jefferson de Souza Pinto 4 EXERCÍCIOS - CAPÍTULO 12 - CORRELAÇÃO E REGRESSÃO .............................................. 97 CAPÍTULO 13 – ANÁLISE DE VARIÂNCIA ............................................................................. 102 13.1 A ANOVA DE UM CRITÉRIO ............................................................................................ 103 13.2 CÁLCULOS COM TAMANHOS DE AMOSTRAS IGUAIS ............................................... 103 13.3 CÁLCULOS COM TAMANHOS DE AMOSTRAS DIFERENTES ..................................... 104 13.4 ANÁLISE DE VARIÂNCIA USANDO O EXCEL –ANÁLISE DE DADOS – ANOVA: FATOR ÚNICO ............................................................................................................................ 105 EXERCÍCIOS - CAPÍTULO 13 – ANÁLISE DE VARIÂNCIA ................................................... 106 BIBLIOGRAFIA .............................................................................................................................. 107 TABELA – DISTRIBUIÇÃO t - STUDENT .............................................................................. 108 TABELA DE PROBABILIDADES DA NORMAL PADRONIZADA - P(Z < z) ..................... 110 TABELA DE NÚMEROS ALEATÓRIOS (5000 dígitos aleatórios) ........................................ 111 TABELA F – NÍVEL 0,05 ........................................................................................................... 112 TABELA F – NÍVEL 0,01 ........................................................................................................... 113 Prof. DSc. Jefferson de Souza Pinto 5 CAPÍTULO 1 - INTRODUÇÃO A palavra estatística está associada a ideia de coleção de números. A estatística trata da organização e da apresentação de contagens e de medições. As informações são obtidas com a finalidade de acumular informações para a tomada de decisões. Exemplos: índice de audiência: modificar o final da novela ou tirar o programa do ar. pesquisas de opinião: o candidato pode modificar certas atitudes ou maneiras de se vestir. quantidade vendida de um produto: o supermercado pode aumentar ou diminuir o seu estoque. Os números não falam por si mesmos, precisam ser organizados, discutidos e interpretados. 1.1 DADOS ESTATÍSTICOS Toda informação devidamente coletada e registrada, quer seja na forma de contagem ou medição, é um dado estatístico. Não existe necessidade de coletar mais de um valor quando ele é uma constante. Assim, trabalharemos com o conceito de variável que exatamente o oposto do de constante. Existem três tipos básicos de variáveis: Variável Nominal ou Qualitativa: quanto indivíduos ou elementossão classificados em um determinado número de categorias mutuamente exclusivas. Exemplo: alfabetização (é nominal, uma pessoa só pode pertencer a uma de duas categorias mutuamente exclusivas), classificação segundo o estado onde o indivíduo nasceu. Variável Ordinal: quando os elementos podem ser distribuídos em determinado número de categorias mutuamente exclusivas, mas tais categorias se apresentam segundo uma ordem lógica. Exemplo: Grau de instrução (1- sem instrução; 2- primário incompleto; 3- primário completo; 4- secundário incompleto; 5- secundário completo; 6- superior incompleto; 7-superior completo. Observação: a ordem dos números é apenas de interesse não se deve fazer operações aritméticas com eles, como por exemplo: 2 X primário curso superior incompleto. Variável Cardinal ou Quantitativa: é expressa através de números, com todas as suas propriedades. Exemplo: renda de uma pessoa em R$ 400 = 4 X 100. 1.2 POPULAÇÃO E AMOSTRA Em linguagem comum população significa o conjunto de habitantes de um território, país, região, cidade, etc. Em estatística o conceito de população é mais amplo. População é o conjunto de elementos que tem em comum uma determinada característica. A população pode ser: finita: Exemplo: alunos matriculados em uma escola. infinita: Exemplo: Conjunto dos resultados obtidos quando se joga um dado sucessivamente. Existem populações que embora finitas são consideradas infinitas. Es: número de peixes que há no mar. Este número é finito em um dado instantes, mas é tão grande que pode ser considerado infinito. Amostra é qualquer subconjunto de elementos retirados da população, desde que este conjunto não seja vazio e tenha menor número de elementos que a população. Exemplo: População: Ana, Pedro, Luís e Clara. a) Amostras de tamanho 3: (Ana, Pedro, Luís); (Ana, Pedro, Clara); (Pedro, Luís, Clara); (Luís, Clara, Ana). Prof. DSc. Jefferson de Souza Pinto 6 b) Amostras de tamanho 2: (Ana, Pedro); (Ana, Luís); (Ana, Clara); (Pedro, Luís); (Pedro, Clara); (Luís, Clara). c) Amostras de tamanho 1: (Ana); (Pedro); (Luís); (Clara). Recenseamentos: são dados sobre todos os elementos da população. No Brasil é o IBGE quem coleta. Tendenciosidade da amostra: quando a amostra que não é representativa da população. Ex.: Um professor pede 3 voluntários para uma corrida. Só se apresentarão os que são bons corredores. Logo, não é uma amostra representativa da turma, é uma amostra tendenciosa, viciada. Se a amostra é representativa da população, conclusões importantes sobre a população podem ser inferidas através da amostra. Num capítulo posterior denominado Amostragem, a determinação da amostra será discutida com maior profundidade. A parte da estatística que trata das condições sob as quais essas inferências são válidas chama- se estatística indutiva ou inferencial. A probabilidade é utilizada para o estabelecimento das conclusões. E a parte da estatística que procura somente descrever e analisar um certo grupo sem tirar conclusões ou inferências sobre o grupo maior, é chamada estatística descritiva ou dedutiva. A estatística descritiva é a que primeiro será tratada nesta apostila, nunca devemos esquecer de trabalhar um dado descritivamente, uma vez que a descrição dos dados pode nos dar pistas muito importante sobre o comportamento dos mesmos. A estatística inferencial será tratada numa segunda parte desta apostila, que como já foi mencionado anteriormente é através dela que podemos tirar conclusões sobre a nossa população através da amostra. 1.3 VARIÁVEIS CONTÍNUAS OU DISCRETAS As variáveis são denotadas por letras maiúsculas como: X, Y, Z. As variáveis quantitativas podem ser classificadas em 2 grupos. Quando a variável assume qualquer valor entre 2 pontos é denominada contínua e caso contrário é dita discreta. Exemplos: O número de crianças em uma família é discreta, assume os valores: 1, 2, 3, 4, ... A altura de um indivíduo é contínua conforme a precisão da medida. Se a altura é medida em metros teremos, por exemplo os seguintes valores: 1,65; 1,662; 1.6622; ... 1.4 ARREDONDAMENTO Os números podem ser arredondados conforme o número de casas decimais que se deseja, este assunto já foi tratado no curso de matemática, logo aqui só será feita uma rápida revisão. Uma regra é “arredondar” para mais quando o dígito seguinte é maior ou igual a cinco” e simplesmente truncar ao se alcançar o número de dígitos desejados. Exemplo: 72,465 72,46 72,8 73 183,575 183,58 Prof. DSc. Jefferson de Souza Pinto 7 EXERCÍCIOS – CAPÍTULO 01 - INTRODUÇÃO 1.) Classifique as seguintes variáveis como nominal, ordinal ou cardinal: a) idade; b) sexo; c) renda familiar; d) religião; e) cor; tempo disponível para estudo; f) atividades recreativas de interesse. 2.) Dê 2 exemplos de variável nominal; 2 de ordinais e 2 de cardinais. 3.) Dada uma população de 3 elementos: A, B, C, identifique todas as amostras possíveis que podem ser obtidas desta população. 4.) Qual destas pesquisas levaria as melhores respostas: a) Você concordaria com Ruy Barbosa “É preciso lutar por nossas ideias, até as últimas consequências” ou b) Com Hitler “É preciso lutar por nossas ideias, até as últimas consequências”. 5.) Experimento: lançar uma moeda 20 vezes (amostra de tamanho 20, população infinita). Obtenha 3 amostras deste tipo, compare com a proporção de caras obtidas nas 3 amostras. Prof. DSc. Jefferson de Souza Pinto 8 CAPÍTULO 2 - APRESENTAÇÃO DOS DADOS ATRAVÉS DE TABELAS As principais finalidades para se representar os dados através de uma tabela são: apresentar os dados de forma ordenada; resumir os dados; auxiliar o pesquisador na análise dos dados; facilitar a compreensão das conclusões. Uma tabela deve ser autossuficiente. Algumas sugestões sobre o que uma tabela deve apresentar: 1) Uma tabela possui elementos essenciais e complementares. Os essenciais são: o título, o corpo, o cabeçalho e a coluna indicadora. Título: é colocado na parte superior da tabela. Deve ser preciso, claro e conciso. Deve indicar a natureza do fato estudado, as variáveis escolhidas na análise do fato o local e a época em que o mesmo foi observado. Corpo da Tabela: é o conjunto de linhas e colunas que contém as informações. Casa, casela ou célula é o cruzamento de uma linha com uma coluna, onde se tem a frequência com que a categoria aparece. Cabeçalho: é a parte da tabela onde é designada o conteúdo de cada coluna. Coluna Indicadora: é a parte da tabela onde é designada a natureza do conteúdo de cada linha. 2) Os elementos complementares são: Fonte: é o indicativo, no rodapé da tabela, da entidade fornecedora (e/ou organizadora) dos dados primários. Dá a outras pessoas a possibilidade de consultar o trabalho original. Notas: são colocadas no rodapé da tabela para esclarecimentos de ordem geral. São enumeradas, podendo-se também usar símbolos gráficos, como o asterisco. Chamadas: são também colocadas no rodapé, servem para esclarecer minúcias em relação às casas, colunas e linha. São numeradas, geralmente em algarismos arábicos (ou letras minúsculas ou ainda símbolos gráficos). 3) Nenhuma casa da tabela deve ficar em brando, apresentando sempre um sinal: - (hífen), quando o valor numérico é nulo; ... (reticência), quando não se dispõe de dado; ? (ponto de interrogação), quando há dúvidas quanto à exatidão do valor numérico; § (parágrafo), quando o dado retifica informação anteriormente publicada; 0; 0,0; 0,00 (zero), quandoo valor numérico é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em números decimais, acrescenta-se o mesmo número de casas decimais ao valore zero; x (letra x), quando o dado for omitido a fim de evitar individualização da informação. 4) Em publicações que compreendam muitas tabelas, estas devem ser numeradas em ordem crescente, conforme a ordem de aparecimento. 5) As tabelas devem ser fechadas no alto e embaixo por linhas horizontais, não sendo fechadas à direita e à esquerda por linhas verticais. É facultativo o emprego de traços verticais para a separação de colunas no corpo da tabela. 6) Os totais e subtotais devem ser destacados. Prof. DSc. Jefferson de Souza Pinto 9 7) Deverá ser mantida uma uniformidade quanto ao número de casa decimais na tabela. Exemplos de Tabelas: tabela com elementos essenciais e fonte Tabela 1 Vendas da Companhia Alfa em U$, no período de 1970 a 1971. Ano Vendas (em U$ 1.000.000) 1970 2.181 1971 2.948 1972 5.642 1973 7.550 1974 10.009 1975 11.728 1976 18.873 1977 29.076 Fonte: Departamento de Marketing da Companhia tabela com elementos essenciais e complementares Tabela 2 Número e percentagem de insetos capturados em domicílio na Escola Agrícola de Iguape, São Paulo, segundo espécie e tipo de captura, Iguape, março a junho e setembro de 1977. Tipo de Captura Espécies Manual¹ Armadilha tipo New Jersey² Total No. % No. % No. Aedes seapularis 108 6,8 1 1,2 109 Anopholes avansae 191 12,1 12 14,8 203 Anopholes triannulatus 48 3 - - 48 Cules pipiens quinquefasciatus 105 6,6 21 25,9 126 Culex (Culex) sp. 61 3,9 5 6,2 66 Culex (Melanoconium) sp. 160 10,1 5 6,2 165 Mansonia chrysonotum 139 8,8 13 16 152 Mansonia titillans 689 43,7 19 23,5 708 Psorophora confinnis 51* 3,2 - - 51 Outras espécies³ 29 1,8 5 6,2 34 Total 1581 100,0 81 100,0 1662 Fonte: Forattini, O P. et. Al., “Estudos ecológicos sobre mosquitos Culicidae no sistema da Serra do Mar, Brasil, 2 - Observações no ambiente Domiciliar”, Rev. Saúde Publ., São Paulo, 12: 476-96,1978. ¹ 30 dias de captura ² 9 dias de captura ³ Aedes Serratus Aedeomyia squamipennis Anopheles slbitarsis Anopheles mediopunctatus Anopheles oswaldoi Culex lygrus Culex (microculex) sp. Limatus flavisetosus Mansonia juxtamansonia Mansonia venezuelenis *Inclui 2 insetos capturados quando deixavam o domicílio. Prof. DSc. Jefferson de Souza Pinto 10 EXERCÍCIOS - CAPÍTULO 2 - APRESENTAÇÃO DOS DADOS / TABELAS Os exercícios deste capítulo serão integrados com os do próximo, Capítulo 03 – Apresentação Gráfica. Prof. DSc. Jefferson de Souza Pinto 11 CAPÍTULO 3 - APRESENTAÇÃO GRÁFICA A apresentação dos dados e resultados pode ser feita sob a forma de figuras, em geral gráficos ou diagramas. Os gráficos devem ser autoexplicativos e de fácil compreensão, de preferência sem comentários inseridos. Devem ser simples, atrair a atenção do leitor e inspirar confiança. Alguns pontos devem ser respeitados: o tamanho deve ser adequado à sua publicação em revistas, periódicos, cartazes ou livros; deve ter sempre um título; deve ser construído em uma escala que não desfigure os fatos ou as relações que se deseja destacar. Os gráficos podem ser cartogramas ou diagramas: Cartograma: mapa geográfico ou topográfico em que as frequências das categorias são projetadas nas áreas específicas do mapa, utilizando cores ou traçados cujos significados constam em legendas. Diagrama: são gráficos em que a magnitude das frequências é representada por uma certa mensuração de uma determinada figura geométrica. Existem vários tipos de diagramas: diagrama de ordenadas, diagrama de barras, histograma, setores, etc. Para a utilização adequada de um gráfico deve se levar em conta a natureza da variável. 3.1 GRÁFICOS PARA VARIÁVEIS QUALITATIVAS OU QUANTITATIVAS DISCRETAS 3.1.1 Diagrama de Colunas Tabela 3 Distribuição da população, por regiões, Brasil, 1991. Regiões População % Norte 10.030.566 6,83 Nordeste 42.497.540 28,94 Sudeste 62.740.401 42,73 Sul 22.129.377 15,07 Centro Oeste 9.427.601 6,42 Brasil 146.825.475 100,00 Fonte: FIBGE 0 10000000 20000000 30000000 40000000 50000000 60000000 70000000 N or te N or de st e Su de st e Su l C .O es te regiões p o p u la ç ã o Figura 3 Distribuição da população, por regiões, Brasil, 1991 Prof. DSc. Jefferson de Souza Pinto 12 3.1.2 Diagrama de Barras 6,83 28,94 42,73 15,07 6,42 0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00 40,00 45,00 Norte Nordeste Sudeste Sul Centro Oeste re g iõ e s % Figura 4 Distribuição da população, por regiões, Brasil, 1991 3.1.3 Diagrama dos Setores Circulares Para Região: Norte: 146.825.475 - 360° 10.030.466 - x x = 25° Nordeste: 146.825.475 - 360° 42.497.540 - x x = 104° Sudeste: 146.825.475 - 360° 62.740.401 - x x = 154° Sul: 146.825.475 - 360° 22.129.377 - x x = 54° Centro Oeste: 146.825.475 - 360° 9.427.601 - x x = 23° 7% 29% 43% 15% 6% Norte Nordeste Sudeste Sul C.Oeste Prof. DSc. Jefferson de Souza Pinto 13 Figura 5 Distribuição da população, por regiões, Brasil, 1991 3.1.4 Diagrama Linear Tabela 4 Vendas da Companhia Beta 1971 a 1977 Anos Vendas (em U$ 1.000.000) 1971 230 1972 260 1973 380 1974 300 1975 350 1976 400 1977 450 Fonte: Departamento de Marketing da Companhia 0 100 200 300 400 500 1971 1972 1973 1974 1975 1976 1977 Ano Vendas (em U$1.000.000) Figura 4 Vendas da Companhia Beta 1971 a 1977 Fonte: Departamento de Marketing da Companhia 3.2 DISTRIBUIÇÃO DE FREQÜÊNCIAS A distribuição de frequências é uma das maneiras de representar um variável discreta ou contínua, é um arranjo dos valores obtidos e suas respectivas frequências. Por exemplo: 3.2.1 Variável Discreta Em uma amostra de 50 famílias anotamos os números de filhos (que denominaremos de X), que poderá assumir os valores 0, 1, 2, 3, ... . A partir dos dados brutos, número de filhos de cada família, faremos uma contagem de cada um dos resultados possíveis, obtendo: Tabela 4 Distribuição do número de filhos de 50 famílias Número de Filhos (Xi) Frequência (fi) 0 15 1 10 2 13 3 6 4 3 5 3 Prof. DSc. Jefferson de Souza Pinto 14 Um tipo de gráfico adequado para representar esse tipo de distribuição seria o diagrama de Barras, ou o de Colunas ou o de Setores Circulares. 0 2 4 6 8 10 12 14 16 0 1 2 3 4 5 Número de filhos Frequência Figura 5 Distribuição do número de filhos de 50 famílias Exemplos: Dados Não Agrupados Exemplo 1: “Número de balas defeituosas” por pacote de bala, de uma amostra de 20 pacotes de balas (200 g cada), retirados de uma linha produção: Variável: “número de defeitos por pacote de bala “ = X X é quantitativa discreta xi 2 4 2 1 2 3 1 0 5 1 0 1 1 2 0 1 3 0 1 2 Rol x(i) 0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 5 Dados agrupados Tabela 1 Distribuição do número de balas defeituosas de uma amostra de 20 pacotes (de200 g cada) de balas de caramelo retirados de uma linha de produção No. de Defeitos No. de pacotes 0 4 1 7 2 5 3 2 4 1 5 1 Total 20 Prof. DSc. Jefferson de Souza Pinto 15 Tabela 1 Distribuição do número de balas defeituosas de uma amostra de 20 pacotes (de 200 g cada) de balas de caramelo retirados de uma linha de produção No. de Defeitos fi Fi pi Pi % 0 4 4 0,20 0,20 20 1 7 11 0,35 0,55 35 2 5 16 0,25 0,80 25 3 2 18 0,10 0,90 10 4 1 19 0,05 0,95 5 5 1 20 0,05 1,00 5 Total 20 - 1,00 - 100 Notação n = tamanho da amostra (no exemplo n=20) xi = valor atribuído a variável na linha i k = número de linhas na tabela (no exemplo k =6) fi = frequência da linha i (no exemplo f1=4; f2=7) onde n fi i k 1 Fi = frequência acumulada da linha i (no exemplo F1=4; F2=11) pi = proporção (ou frequência relativa) da linha i (no exemplo p1=0,20; p2=0,35) % = pi. 100 Pi = frequência acumulada da linha i (no exemplo P1=0,20; P2=0,55) Tabela 1 Distribuição do número de balas defeituosas de uma amostra de 20 pacotes (de 200 g cada) de balas de caramelo retirados de uma linha de produção xi fi Fi xi . fi xi2 . fi 0 4 4 0 0 1 7 11 7 7 2 5 16 10 20 3 2 18 6 18 4 1 19 4 16 5 1 20 5 25 Total 20 - 32 86 3.2.2 Variável Contínua Suponhamos que tomemos uma amostra de 200 homens e anotemos a altura de cada um em centímetros (X), a altura é uma variável contínua, pois pode tomar qualquer valor, como por exemplo 170,613 cm. Assim já não tem mais sentido em falar da frequência deste ou daquele valor específico de X, registraremos as frequências das alturas dentro de uma classe. Assim Tabela 5 Alturas dos alunos de uma classe Prof. DSc. Jefferson de Souza Pinto 16 Altura (Classe) Frequência(fi) 130 |-- 135 4 135 |-- 140 8 140 |-- 145 10 145 |-- 150 30 150 |-- 155 64 155 |-- 160 56 160 |-- 165 16 165 |-- 170 12 Para melhor organizar o nosso trabalho devemos ter em mente que: 1. Partimos dos dados brutos, que é o conjunto de dados numéricos coletados na amostra. 2. Podemos ter os dados em “rol”, que nada mais é do que os dados brutos ordenados de uma forma crescente ou decrescente. 3. A amplitude total (H) é definida como a diferença entre o maior e o menor valor. 4. Frequência Absoluta é o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe. 5. O número de classes (k), deve estar razoavelmente compreendido entre as situações de demasiado detalhe e pouco detalhe. Mas temos algumas regras para obté-la: a) k = 5 para n 25 e k n para n > 25; b) Fórmula de Sturges, k1 + 3,22.log n. 6. Amplitude das Classes (h), h H/k. 7. Limites das Classes, existem várias maneiras de expressar os limites das classes, como por exemplo: a) 135 |--| 140, compreende todos os valores entre 135 e 140; b) 135 |-- 140, compreende todos os valores ente 135 e 140, excluindo o 140. 8. Pontos médios das classes (xi), é a média aritmética entre o limite superior e o limite inferior da classe. Ex.: 135 |-- 140, xi =137,5. O ponto médio será o valor que representará a classe. 9. Frequência Acumulada ou frequência absoluta acumulada (Fi), é a soma das frequências das classes inferiores ou iguais a i. 10.Frequência Relativa (pi) é a proporção daquele valor na amostra, pi = fi/n. 11.Frequência Relativa Acumulada (Pi) é a soma das frequências relativas das classes inferiores ou iguais a i. Assim, para o exemplo anterior teremos: Classe fi xi Fi pi Pi 130 |-- 135 4 132,5 4 0,02 0,02 135 |-- 140 8 137,5 12 0,04 0,06 140 |-- 145 10 142,5 22 0,05 0,11 145 |-- 150 30 147,5 52 0,15 0,26 150 |-- 155 64 152,5 116 0,32 0,58 155 |-- 160 56 157,5 172 0,28 0,86 160 |-- 165 16 162,5 188 0,08 0,94 165 |-- 170 12 167,5 200 0,06 1,00 Total 200 1,00 Para representar a distribuição de frequências são utilizados dois tipos de gráficos: o histograma e o polígono de frequências. Prof. DSc. Jefferson de Souza Pinto 17 Histograma 0 20 40 60 132,5 137,5 142,5 147,5 152,5 157,5 162,5 167,5 Alturas (em cm) Frequência Figura 6 Alturas dos alunos de uma classe Polígono de Frequência 0 10 20 30 40 50 60 70 128,5 132,5 137,5 142,5 147,5 152,5 157,5 162,5 167,5 172,5 alturas (cm) fr e q u ê n c ia Figura 7 Alturas dos alunos de uma classe Polígono de Frequência Acumulada Prof. DSc. Jefferson de Souza Pinto 18 0 40 80 120 160 200 240 132,5 137,5 142,5 147,5 152,5 157,5 162,5 167,5 Alturas (em cm) Frequência Acumulada Figura 8 Alturas dos alunos de uma classe Veja o seguinte exemplo: “Idade dos empregados”, de uma amostra de 30 empregados da empresa Variável: “idade dos empregados“ = X X é quantitativa contínua 15 30 39 18 33 21 42 23 49 46 38 29 59 57 58 35 53 29 34 39 45 49 43 33 22 22 35 27 32 19 Rol 15 18 19 21 22 22 23 27 29 29 30 32 33 33 34 35 35 38 39 39 42 43 45 46 49 49 53 57 58 59 Dados agrupados em Intervalos de Classe Tabela 2 Distribuição das idades de uma amostra de 20 empregados da empresa X, 1997. Idades No. de empregados 15 ├ 25 7 25 ├ 35 8 35 ├ 45 7 45 ├ 55 5 55 ├ 65 3 Total 30 Notação: n = tamanho da amostra (no exemplo n=30) Prof. DSc. Jefferson de Souza Pinto 19 k = número de linhas na tabela ou o número de intervalos de classe (no exemplo k =5) h = amplitude das classes (no exemplo h =10) Limites das Classes - existem várias maneiras de expressar os limites das classes: a) 35 ├┤ 45, compreende todos os valores entre 35 (inclusive) e 45 inclusive); b) 35 ├ 45, compreende todos os valores ente 35(inclusive) até no limite de 45 (excluindo o 45). LIi = Limite Inferior da classe i LSi= Limite Superior da classe i Algumas regras para k k = 5 para n 25 e k n para n > 25 Fórmula de Sturges, k1 + 3,22.log n. se n<50 então 5 k 7; se 50 n < 100 então 6 k 10; se 100 n < 250 então 7 k 12; se n 250 então 12 k 20 e assim, h H/k Tabela 2 Distribuição das idades de uma amostra de 20 empregados da empresa X, 1997. Idades xi fi Fi pi Pi % xi . fi xi2 . fi 15 ├ 25 20 7 7 0,23 0,23 23 140 2800 25 ├ 35 30 8 15 0,27 0,50 27 240 7200 35 ├ 45 40 7 22 0,23 0,73 23 280 11200 45 ├ 55 50 5 27 0,17 0,90 17 250 12500 55 ├ 65 60 3 30 0,10 1,00 10 180 10800 Total 30 - 1,00 - 100 1090 44500 Notação n = tamanho da amostra (no exemplo n=30 xi = ponto médio da classe i; onde x LI LS i i i 2 k = número de linhas ou classes da tabela (no exemplo k =5) fi = frequência da linha i (no exemplo f1=7; f2=8) onde n fi i k 1 Fi = frequência acumulada da linha i (no exemplo F1=4; F2=11) pi = proporção (ou frequência relativa) da linha i (no exemplo p1=0,20; p2=0,35) % = pi . 100 Pi = frequência acumulada da linha i (no exemplo P1=0,20; P2=0,55) Prof. DSc. Jefferson de Souza Pinto 20 EXERCÍCIOS CAPÍTULO 3 - APRESENTAÇÃO GRÁFICA 1.) Construa um gráfico adequado Tabela 1 Distribuição da população, por regiões, Brasil, 1991. Regiões População Norte 10.030.566 Nordeste 42.497.540 Sudeste 62.740.401 Sul 22.129.377 Centro Oeste 9.427.601 Brasil 146.825.475 Fonte:FIBGE 2.) Construa um gráfico adequado Tabela 2 Número de inscrições ao concurso vestibular da Universidade X, 1974-1983 Anos Número de Inscrições 1974 3044 1975 4313 1976 6502 1977 7821 1978 9451 1979 14458 1980 17793 1981 10624 1982 8170 1983 7672 Fonte: Secretaria da Universidade Y 3.) Considere o consumo de água em 50 residências na Cidade X no ano de 1988 450 600 700 400 600 800 990 750 500 600 990 400 600 700 500 500 990 800 600 700 459 500 500 700 800 800 800 900 990 600 700 450 400 500 750 600 700 990 900 800 600 400 800 750 500 990 450 460 900 990 a) Construa uma tabela; b) calcule: o ponto médio, a frequência, a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; c) construa um gráfico adequado. Prof. DSc. Jefferson de Souza Pinto 21 4.) Tabela 3 Amostra de 126 notas de Matemática do Concurso Vestibular da Universidade X em 1988 Notas frequência 0 |-- 1 36 1 |-- 2 20 2 |-- 3 25 3 |-- 4 18 4 |-- 5 13 5 |-- 6 9 6 |-- 7 5 Total 126 a) calcule: o ponto médio, a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; b) que proporção de candidatos que foram aprovados? c) quantos candidatos tiveram nota inferior a 2,0? d) construa um gráfico adequado. 5.) Construa uma tabela e um gráfico para os dados abaixo: Os dados abaixo dizem respeito ao petróleo bruto processado (em 1.000 m³) Ano Nacional Importado 1976 9457 45465 1977 9554 46494 1978 9628 52780 1979 9113 55504 1980 10206 52950 1981 10963 49941 os dados foram fornecidos pelo Conselho Nacional de Petróleo 6.) Tabela 4 Amostra de 100 medidas de um mesmo tipo de cápsula - 1988 Peso (mg) No. de cápsulas 81 |-- 82 1 82 |-- 83 3 83 |-- 84 10 84 |-- 85 30 85 |-- 86 37 86 |-- 87 14 87 |-- 88 3 88 |-- 89 2 Total 100 a) calcule: o ponto médio, a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; b) construa um gráfico adequado. Prof. DSc. Jefferson de Souza Pinto 22 7.) Dadas as estaturas de 140 alunos, conseguiu-se a seguinte distribuição: Tabela 1 Distribuição das estaturas de 140 alunos de uma escola Estaturas(cm) frequência 145 |-- 150 2 150 |-- 155 10 155 |-- 160 27 160 |-- 165 38 165 |-- 170 27 170 |-- 175 21 175 |-- 180 8 180 |-- 185 7 Total 140 a) calcule: o ponto médio, a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; b) qual é a variável e de que tipo ela é; c) construa um gráfico adequado. 8.) Dada a distribuição dos aluguéis de 65 casas. Tabela 2 Distribuição dos aluguéis de 65 casas Aluguel (em R$ X100) frequência 1,5 |-- 3,5 12 3,5 |-- 5,5 18 5,5 |-- 7,5 20 7,5 |-- 9,5 10 9,5 |-- 11,5 5 Total 65 a) calcule: o ponto médio, a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; b) qual é a variável e de que tipo ela é; c) construa um gráfico adequado. 9.) Dada a seguinte amostra das idades de alunos: 28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24 31 33 30 32 30 33 27 33 31 33 23 29 30 24 28 34 30 30 18 17 18 15 16 17 17 18 19 19 20 29 a) Agrupe os dados, construindo uma distribuição de frequências (sugestão usar h=5 e iniciar com 15); b) calcule: o ponto médio, a frequência, a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; c) qual é a variável e de que tipo ela é; d) construa um gráfico adequado. Prof. DSc. Jefferson de Souza Pinto 23 10.) Dada a seguinte distribuição Tabela 3 Distribuição do número de acidentes por dia na Rodovia X no Rio de Janeiro em 1977. No. de Acidentes No. de Dias 0 8 1 9 2 3 3 5 4 3 5 2 Total 30 a) calcule: a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; b) qual é a variável e de que tipo ela é; c) construa um gráfico adequado. 11.) Dada a seguinte distribuição, faça um gráfico adequado Tabela 4 Matrículas no ensino de Terceiro Grau, Brasil -1975 Área de Ensino Matrículas Ciências biológicas 32109 Ciências Exatas e Tecnologia 65949 Ciências Agrárias 2419 Ciências Humanas 148842 Letras 9883 Artes 7464 Duas ou mais áreas 16323 12.) Um pesquisador aplicou um teste aos alunos de um colégio e obteve os seguintes resultados: 31 13 14 20 23 21 22 12 30 20 16 25 21 29 17 25 21 21 15 22 19 22 22 19 28 15 27 25 26 19 20 10 22 31 22 21 26 13 23 23 29 26 30 15 36 19 29 12 22 30 21 27 22 16 16 17 20 16 23 19 11 33 15 17 27 21 23 32 12 22 22 22 22 23 38 38 19 19 34 24 17 20 31 11 11 30 20 15 24 17 37 31 16 18 21 40 24 20 34 17 40 18 36 29 21 24 31 35 a) faça um rol crescente para os dados; b) fazer uma distribuição por frequência; c) calcule: o ponto médio, a frequência, a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; d) faça um gráfico adequado. Prof. DSc. Jefferson de Souza Pinto 24 13.) Dada a seguinte distribuição: Tabela 5 População dos alunos de cinco escolas do município X, 1995 Escola No. de Alunos A 400 B 300 C 350 D 450 E 520 Total 2020 a) calcule: a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; b) faça um gráfico adequado. 14.) Dada a seguinte distribuição Tabela 6 Vendas de bebidas leves em um dia na Cidade X, 1995 Tipo Vendas Cola 600 Limão 200 Laranja 100 Uva 50 Cereja 40 Outros 10 Total 1000 a) calcule: a frequência acumulada, a proporção, a proporção acumulada e a porcentagem; b) faça um gráfico adequado. Prof. DSc. Jefferson de Souza Pinto 25 CAPÍTULO 4 - MEDIDAS DE POSIÇÃO, DISPERSÃO E OUTRAS MEDIDAS Como vimos anteriormente estamos buscando a sintetização de um conjunto de dados normalmente obtidos por uma amostra. Neste capítulo vamos aprender o cálculo de medidas resumo que possibilitem representar estes dados de uma forma resumida. 4.1 MEDIDAS DE POSIÇÃO Essas medidas apresentam a posição dos dados, ou seja, a sua localização. 4.1.1 MÉDIA ARITMÉTICA Média Aritmética - Dados Não Agrupados Seja x1, x2, x3, ... ,xn os valores obtidos de uma amostra de tamanho n. A média aritmética x é dada por: x xi n Exemplo 1: Determinar a média da seguinte amostra: 3,7,8,10,11. 8,7 5 1110873 x Média Aritmética - Dados Agrupados Quando os valores estiverem agrupados numa distribuição de frequência usaremos para estimar a média os valores de x1, x2, x3, ... ,xk ponderados pelas respectivas frequências absolutas f1, f2, f3, ..., fk. Assim: x xi.fi n , onde n = fi Exemplo 2: Dada a seguinte distribuição: xi fi xi.f i 1 1 1 2 3 6 3 5 15 4 1 4 Total 10 26 Uma forma prática para o cálculo é construirmos a coluna xi.f i, assim: x 26 10 2,6 Exemplo 3: Dada a distribuição dos salários da Companhia Beta: Prof. DSc. Jefferson de Souza Pinto 26 Tabela 6 Distribuição dos salários (em número de salários mínimos) da Companhia Beta Salários No. de funcionários 3 |-- 6 12 6 |-- 9 18 9 |-- 12 20 12 |-- 15 10 15 |-- 18 5 18 |-- 21 3 Neste caso: Salários fi xi xi.fi 3 |-- 6 12 4,5 54,0 6 |-- 9 18 7,5 135,0 9 |-- 12 20 10,5210,0 12 |-- 15 10 13,5 135,0 15 |-- 18 5 16,5 82,5 18 |-- 21 3 19,5 58,5 68 675,0 9,9265 68 675 x 4.1.2 MÉDIA GEOMÉTRICA Média Geométrica - Dados Não Agrupados Seja x1, x2, x3, ... ,xn os valores obtidos de uma amostra de tamanho n. A Média Geométrica mg é dada por: mg x .x .x .....x1 2 3 nn Exemplo 4: Determinar a média geométrica dos valores: 3,6,12,24,48 mg 3.6.12.24.48 248.832 12n n Média Geométrica - Dados Agrupados Quando os valores estiverem agrupados numa distribuição de frequência usaremos para estimar a média geométrica os valores de x1, x2, x3, ... ,xk ponderados pelas respectivas frequências absolutas f1, f2, f3, ... ,fk. Assim: mg x .x .x .....x1 f1 2 f2 3 f3 k fkn onde n = fi Exemplo 5: Calcular a média geométrica para a distribuição: xi | 1 2 3 5 ________________________ fi | 2 3 1 2 mg 1 .2 .3 .5 mg 600 2,904 2 3 1 28 8 onde n = 8 Prof. DSc. Jefferson de Souza Pinto 27 4.1.3 MÉDIA HARMÔNICA Média Harmônica - Dados Não Agrupados Seja x1, x2, x3, ..., xn os valores obtidos de uma amostra de tamanho n. A Média Harmônica (mh) é dada por: mh n 1 xi Exemplo 6: Calcular a média harmônica para 2,5,8 mh 3 1 2 1 5 1 8 3,64 Média Harmônica - Dados Agrupados Quando os valores estiverem agrupados numa distribuição de frequência usaremos para estimar a média harmônica os valores de x1, x2, x3, ..., xk ponderados pelas respectivas frequências absolutas f1, f2, f3, ... ,fk. Assim: mh n fi xi onde n = fi Obs.: A média harmônica é particularmente recomendada para série de valores que são inversamente proporcionais, como para o cálculo da velocidade média, custo médio de bens comprados com uma quantia fixa, etc. Exemplo 7: xi | 1 2 3 5 ________________________ fi | 2 3 1 2 mh 4 4,23 mh = 0,94 4.1.4 MEDIANA Se os valores obtidos com a amostra são colocados em ordem crescente, a mediana será o elemento que ocupa a posição central. A mediana é definida como o elemento onde 50% dos valores estão abaixo dele e 50% estão acima. 0% 50% 100% |-------------------------------------------|---------------------------------------------| md Prof. DSc. Jefferson de Souza Pinto 28 Mediana - Dados Não Agrupados Seja x1, x2, x3, ... ,xn os valores obtidos de uma amostra de tamanho n. E sendo x(1), x(2), x(3), ... x(n) os valores ordenados de forma crescente, a Mediana (md) será dada por: Se n for ímpar: md = x( n+1/2 ) Se n for par: 2 xx md 2 2 n 2 n Exemplos 8 e 9: Ex.8) 35 36 37 38 40 40 41 43 46 n = 9 ímpar md = x ( 9 + ½ ) = x ( 5 ) = 40 Ex. 9) 12 14 14 15 16 16 17 20 n = 8 par 15,5= 2 16+15 2 x+x 2 x+x =md 542 10 2 8 Mediana - Dados Agrupados em Intervalo de Classes Quando os valores estiverem agrupados numa distribuição de frequência usaremos para estimar a mediana os valores de x1, x2, x3, ... ,xk ponderados pelas respectivas frequências absolutas f1, f2, f3, ... ,fk. Procedimento: 1 - Calcula-se n/2 2- Acumulando-se a frequência, determina-se a classe onde se encontra a mediana, 3 - Utiliza-se a fórmula: .h f Fa 2 n LImd md onde: LI = limite inferior da classe que contém a mediana, n = tamanho da amostra ou número de elementos = fi, Fa = soma das frequências anteriores a classe que contém a mediana, fmd = frequência da classe que contém a mediana. Exemplo 3: Salários fi xi Fi 3 |-- 6 12 4,5 12 6 |-- 9 18 7,5 30 9 |-- 12 20 10,5 50 12 |-- 15 10 13,5 60 15 |-- 18 5 16,5 65 18 |-- 21 3 19,5 68 68 - - Prof. DSc. Jefferson de Souza Pinto 29 1 - n/2= 68/2 =34 2 - Identifica-se a classe que contém a mediana, pela frequência acumulada. Neste caso a terceira classe. 3- Substituindo na fórmula: .3 20 3034 9md 9,6 4.1.5 QUARTIS Quartis - Dados Não Agrupados Os quartis dividem um conjunto de dados em quatro partes iguais. Assim: Q1 = 1 quartil, deixa 25% dos elementos abaixo dele; Q2 = 2 quartil, deixa 50% dos elementos, é a mediana ; Q3 = 3 quartil, deixa 75% dos elementos abaixo dele; 0% 25% 50% 75% 100% |-----------------|-----------------|-----------------|-----------------| Q1 Q2 Q3 Quartis - Dados Agrupados em Intervalos de Classe Determinação de Q1: 1- Calcula-se n/4. 2- Identifica-se a classe Q1 pela frequência acumulada. 3- Aplica-se a fórmula: Q Li n 4 Fa f .h1 q1 Determinação de Q3: 1- Calcula-se 3n/4. 2- Identifica-se a classe Q3 pela frequência acumulada. 3- Aplica-se a fórmula: Q Li 3n 4 Fa f .h3 q3 Exemplo 3: Dada a distribuição, determinar os quartis (Q1 e Q3) e a mediana Salários fi xi Fi 3 |-- 6 12 4,5 12 6 |-- 9 18 7,5 30 9 |-- 12 20 10,5 50 12 |-- 15 10 13,5 60 15 |-- 18 5 16,5 65 18 |-- 21 3 19,5 68 68 - - Prof. DSc. Jefferson de Souza Pinto 30 1- Q1 md Q3 n/4=68/4=17 n/2=68/2=34 3n/4=51 2- Uso das fórmulas 83,6.3 18 1217 6Q1 .3 20 3034 9md 9,6 3,12.3 10 5051 12Q3 4.1.6 DECIS Decis - Dados Não Agrupados Continuando o estudo das medidas separatrizes: mediana e quartis, temos os decis. Que são os valores que dividem a série em 10 partes iguais. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% |--------|--------|--------|--------|--------|--------|--------|--------|--------|--------| D1 D2 D3 D4 D5 D6 D7 D8 D9 Decis - Dados Agrupados em Intervalos de Classe A formula, neste caso, também é semelhante às separatrizes anteriores. Onde: Determinação de Di: 1- Calcula-se i.n/10, onde i=1,2,3,4,5,6,7,8,9. 2- Identifica-se a classe Di pela frequência acumulada. 3- Aplica-se a fórmula: Di Li i.n 10 Fa f .h D i 4.1.7 PERCENTIS Pecentis - Dados Não Agrupados São medidas que dividem a amostra em 100 partes iguais. Assim: 0% 1% 2% 3% 50% 97% 98% 99% |------|------|------|--------------------|--------------------|------|------|------| P1 P2 P3 P50 P97 P98 P99 Percentis - Dados Agrupados em Intervalos de Classe Determinação de Pi: 1- Calcula-se i.n/100, onde i=1,2, 3,..., 98,99. Prof. DSc. Jefferson de Souza Pinto 31 2- Identifica-se a classe Pi pela frequência acumulada. 3- Aplica-se a fórmula: Di Li in 100 Fa f .h Di Exemplo 3: Determinar o 10 Decil e o 90 Percentil da seguinte distribuição: Salários fi xi Fi 3 |-- 6 12 4,5 12 6 |-- 9 18 7,5 30 9 |-- 12 20 10,5 50 12 |-- 15 10 13,5 60 15 |-- 18 5 16,5 65 18 |-- 21 3 19,5 68 68 - - 1- D4 P10 i.n/10=4.68/10=27,2 i.n/100=10.68/100=6,8 2- Uso das fórmulas 53,8.318 122,27 6D1 7,4.3 12 08,6 3P10 4.1.8 MODA Moda - Dados Não Agrupados Dentre as principais medidas de posição, destaca-se a Moda. E é definida como o valor mais frequente da distribuição. Para distribuição simples, sem agrupamento em classes, a identificação da Moda é facilitada pela simples observação do elemento que apresenta maior frequência. Assim, para a distribuição xi | 234 | 245 | 248 | 251 | 307 ------------------------------------------------------ fi | 7 | 17 | 23 | 20 | 8 a moda será 248. Indica-se mo=248. Moda - Dados Agrupados em Intervalos de Classe Determinação de mo: 1 - Identifica-se a classe modal (aquela que possuir maior frequência) 2 - Aplica-se a fórmula: Prof. DSc. Jefferson de Souza Pinto 32 mo Li d d d .h1 1 2 onde: Li = limite inferior da classe modal d1 =diferença entre a frequência da classe modal e a imediatamente anterior d2 =diferença entre a frequência da classe modal e a imediatamente posterior h = amplitude da classe modal Exemplo 13: Salários No. de funcionários 3 |-- 6 12 6 |-- 9 18 9 |-- 12 20 12 |-- 15 10 15 |-- 18 5 18 |-- 21 3 1 - A classe modal é 9 |-- 12 2 - Aplica-se a fórmula d1= 20- 18 d2= 20- 10 mo 9 2 2 10 .3 9,50 Figura 1. Representação Gráfica da Moda Prof. DSc. Jefferson de Souza Pinto 33 4.1.9 UMA ANÁLISE CONJUNTA DE ALGUMAS MEDIDAS Vejamos o que se pode concluir acerca dos quartis e da mediana a partir de seu posicionamento no gráfico das frequências acumuladas da amostra: A frequência relativa acumulada anterior ao primeiro quartil é 25%, dado o fato de ¼ da amostra possuir menor ou igual conhecimento de informática que o estudante situado nessa posição. A frequência relativa acumulada posteriormente é 100% - 25% = 75%, dado o fato de ¾ da amostra possuírem maior ou igual conhecimento de informática que o primeiro quartil. O primeiro quartil amostral, assim, divide a imagem de forma tal que ¼ dos dados é igual ou inferior a ele e ¾ lhe é superior ou igual. A frequência acumulada anterior ao conhecimento de informática do estudante mediano é 50%, valor igual à frequência posteriormente acumulada e correspondendo à divisão da imagem em duas partes de forma tal que a mediana é superior ou igual aos valores da primeira parte e igual ou inferior aos valores da segunda. De fato, a mediana nada mais é do que o segundo quartil amostral: 2d qm A frequência acumulada anterior ao terceiro quartil é 75% e a que se acumula posteriormente é 25%. O conhecimento de informática do estudante situado no terceiro quartil, assim, é superior ou igual a ¾ dos valores do rol e igual ou inferior aos ¼ restantes. Ou seja, o terceiro quartil amostral divide a imagem de forma tal que ¾ dos dados é igual ou inferior a ele e ¼ lhe é superior ou igual. 4.1.10 “BOX AND WHISKERS PLOT” = “CAIXA COM PATAS” O gráfico da página seguinte é chamado de “Box and Whiskers Plot” ou “box-plot”. A expressão em inglês pode ser traduzida, ao pé da letra, como “diagrama da caixa com bigodes” ou então traduzida livremente como “diagrama da caixa com patas”. 18% 68% 71% 94% 91% 97% 100% 38% 50% 59% 79% 24% 0% 25% 50% 75% 100% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% F re q u ên ci as R el at iv a s A cu m u la d as ( % ) 1o quartil = 15% Mediana = 22,5% 3o Quartil = 45% Conhecimento de Informática (%) 1/4 do rol 3/4 do rol 1/2 do rol A Mediana e os Quartis dividem a Distribuição de Freqüências Acumuladas em 4 Partes Iguais Prof. DSc. Jefferson de Souza Pinto 34 O “box-plot” representa graficamente a estrutura dos dados de conhecimento de informática da amostra, podendo-se observar os limites mínimo e máximo, as posições intermediárias situadas no primeiro e o terceiro quartis e, no centro, o conhecimento de informática do estudante mediano. Analisando o box-plot, podemos visualizar se uma amostra possui distribuição de frequências simétrica ou assimétrica, bem como, após certo treino, inferir o grau de assimetria da distribuição. Na caixa central do “box-plot” estão agrupados 50% dos valores amostrais, sendo 25% na parte acima da mediana e 25% na parte abaixo. Na parte inferior da caixa temos outros 25% dos valores amostrais e, na pata superior, encontramos o restante 25% dos dados. Podemos concluir o seguinte: A amplitude de variação dos 25% (1/4) dos dados que se situam entre a mediana e o primeiro quartil é igual a 22,5% - 15% = 7,5% de conhecimento de informática, indicando que dentro desses limites se dá a mais alta concentração de ocorrência de valores amostrais. A amplitude dos 25% (1/4) dos dados que se situam entre o mínimo e o primeiro quartil é igual a 15% - 0% = 15% de conhecimento de informática. Dentro desses limites se dá a segunda mais alta concentração de valores amostrais. Já a amplitude dos 25% (1/4) dos dados entre a mediana e o terceiro quartil é bem maior, igual a 45% - 22,5% = 22,5% de conhecimento, indicando uma baixa concentração de valores amostrais nessa faixa da imagem. Maior ainda é a amplitude dos 25% (1/4) dos dados entre o terceiro quartil e o valor máximo da amostra, 80% - 45% = 35% Nessa faixa mais alta de conhecimento de informática os valores amostrais são mais raros. Resumindo tais observações, notamos que os dados amostrais se concentram mais nos valores de conhecimento de informática mais baixos e são mais rarefeitos entre os valores mais altos, indicando que a distribuição de frequências da amostra é assimétrica positiva. Outra forma de se perceber a assimetria positiva da distribuição é notar que a mediana está abaixo do meio da caixa central e que a pata inferior é menor que a pata superior. A amplitude da caixa superior é mais que o dobro da amplitude da caixa inferior, e uma relação semelhante ocorre entre a amplitude da pata superior e a da pata inferior. O box-plot é assimétrico, achatado na parte inferior e alongado na parte superior. O que normalmente ocorre em uma amostra é o box-plot ser simétrico. Novamente, notamos que nossa amostra não possui um comportamento normal. Prof. DSc. Jefferson de Souza Pinto 35 4.2 MEDIDAS DE DISPERSÃO Essas medidas apresentam a dispersão dos dados, ou seja, a sua variabilidade. 4.2.1 AMPLITUDE É a diferença entre os 2 valores extremos da amostra. Só tem sentido se os dados não estiverem agrupados em intervalos de classe. H = xmáx - xmin Exemplos 14 e 15: Ex. 14) 4, 6, 6, 6, 8 H = 8 - 4 = 4 Ex. 15) 4, 5, 6, 7, 8, H = 8 - 4 = 4 Obs.: Apesar da amplitude ser a mesma, a dispersão dos dados não, é diferente. A amplitude é uma medida precária. 4.2.2 VARIÂNCIA, DESVIO-PADRÃO E COEFICIENTE DE VARIAÇÃO Variância - Dados Não Agrupados Seja x1, x2, x3, ... ,xn os valores obtidos de uma amostra de tamanho n. A variância s² é dada por: 1n x.xi 1n xxi s 222 2 n Retomando o exemplo 1: 3,7,8,10,11 70,9 15 8,7.53431n x.xi s 222 2 n Variância - Dados Agrupados Se os valores estiverem agrupados numa distribuição de frequência usaremos para estimar a variância os valores de x1, x2, x3, ... ,xk ponderados pelas respectivas frequências absolutas f1, f2, f3, ... ,fk. Assim: 1n xn.fx s 2 i 2 i2 Voltando ao exemplo 2: xi fi xi.fi xi2.f i 1 1 1 1 2 3 6 12 3 5 15 45 4 1 4 16 10 26 74 Prof. DSc. Jefferson de Souza Pinto 36 7111,0 110 6,21074 1n xnfx s 22 i 2 i2 ou no exemplo 3: Salários fi xi xi.fi xi2.f i 3 |-- 6 12 4,5 54,0 243,00 6 |-- 9 18 7,5 135,0 1012,50 9 |-- 12 20 10,5 210,0 2205,00 12 |-- 15 10 13,5 135,0 1822,50 15 |-- 18 5 16,5 82,5 1361,25 18 |-- 21 3 19,5 58,5 1140,75 68 - 675,0 7785,00 x 675 68 9,9265 1885,16 168 9265,9687785 1n xnfx s 22 i 2 i2 4.2.3 DESVIO PADRÃO Como a variância é uma medida que pode causar alguns problemas de interpretação, pois, expressa um desvio quadrático médio, costuma-se usar o desvio padrão que é definido como a raiz quadrada positiva da variância. Assim temos uma medida de variabilidade expressa na mesma unidade dos valores do conjunto de dados: s s 2 Exemplos no exemplo 1: Média = Ponto que Anula a Soma dos Desvios 1 1 1 1 6 2 4 3 3 4 5 3 0% 10% 20% 30% 40% 50% 60% 70% 80% Conhecimento de Informática (%) = Braços da Alavanca F re q ü ên ci a s A b so lu ta s = P es o s Média = 27,1% Desvios à Média (Negativos) x Frequências + Desvios à Média (Positivos) x Frequências = Zero Desvios Positivos Desvios Negativos Prof. DSc. Jefferson de Souza Pinto 37 no exemplo 2: no exemplo 3: 4.2.4 COEFICIENTE DE VARIAÇÃO É uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dada por: CV s x Exemplos: no exemplo 1: no exemplo 2: no exemplo 3: Numa empresa, o salário médio dos homens é de R$ 4.000,00 com desvio padrão de R$ 1.500,00, e o das mulheres é em média de R$ 3.000,00 com desvio padrão de R$1.200,00. Assim: para os homens CV= para as mulheres CV= Logo, podemos concluir que os salários das mulheres apresentam maior dispersão relativa que o dos homens. No caso temos uma análise com a literatura da seguinte maneira: Baixa dispersão: CV 15% Média dispersão: CV 15-30% Alta dispersão: CV 30% E ainda, uma desvantagem do C.V. é que ele deixa de ser útil quando a média está próximo de zero. 4.2.5 AMPLITUDE INTERQUARTILÍCA (AIQ) É o intervalo para 50% valores dos dados do meio, ou seja, concentra nesse intervalo 50% dos valores da variável em análise. Prof. DSc. Jefferson de Souza Pinto 38 AIQ = Q3 -Q1 Exemplo: Para os dados de salário inicial temos: Amplitude = 2825 - 2210 = 615 Q3 = 2500 Q1 = 2365 Assim, AIQ = 2500 - 2365 = 135 50% dos valores estão concentrados nesse intervalo entre os dois quartis, Q1 e Q3, onde a dispersão é de R$ 135,00. 4.2.6 DESVIO MÉDIO (DM) O conceito estatístico de Desvio Médio ou também chamado Desvio Médio Absoluto (DMA) corresponde ao conceito matemático de distância. O desvio médio é dado por i x x DM n para o caso de considerarmos os dados brutos. Considerando as variáveis discreta e contínua temos i i x x F DM n Exemplos: 1) Calcule o desvio médio para a sequência :2,8,5,6X . 2) Determine o desvio médio das seguintes séries: a) ix iF 1 2 3 5 4 2 Prof. DSc. Jefferson de Souza Pinto 39 b) Obs: Como o desvio médio depende de cada elemento da série, sua sensibilidade é perfeita. 4.2.7 DESVIO QUARTÍLICO OU INTERQUARTÍLICO O desvio quartílico dos valores da amostra é calculado através da expressão: 2 Quartil 1 - Quartil 3 d oo ou: 2 qq d 13 O desvio quartílico, como a amplitude, é uma medida de dispersão dos dados. Veja o prezado leitor o box-plot para se certificar disso. Alterando um pouco a fórmula do desvio quartílico podemos obter uma interpretação para essa estatística: 2 )qm()mq( 2 qq d 1dd313 Observamos nessa nova fórmula que o desvio quartílico é a média das amplitudes das duas caixas centrais do box-plot. Concluímos que o desvio quartílico nos informa quanto em média os quartis se desviam da mediana. Tomando os valores da pesquisa que estamos analisando, temos o desvio quartílico amostral do conhecimento de informática: %15 2 %15%45 d Pode-se concluir o seguinte: A distância média entre o conhecimento de informática dos estudantes situados nos quartis e o estudante mediano é de 15%. Os estudantes situados nos quartis sabem, em média, 15% a mais ou a menos informática que o estudante mediano. A amplitude média das caixas do box-plot é igual a 15% de conhecimento de informática. Em média, ¼ dos dados centrais da amostra (25%) se distribuem em uma amplitude igual a 15% de conhecimento de informática. Classes iF 2 ├ 4 5 4 ├ 6 10 6 ├ 8 4 8 ├ 10 1 Prof. DSc. Jefferson de Souza Pinto 40 4.2.8 ERRO PADRÃO (SX) Quando se obtém uma amostra aleatória de tamanho n, estima-se a média populacional. É bastante intuitivo supor que se uma nova amostra aleatória for realizada a estimativa obtida será diferente daquela primeira. Desta forma, reconhece-se que as médias amostrais estão sujeitas à variação e formam populações de médias amostrais, quando todas as possíveis amostras são retiradas de uma população. O erro padrão analisa a variabilidade de uma média. Fornecendo um mecanismo de medir a precisão com que a média populacional foi estimada. Sua fórmula é dada por: 4.3 MEDIDAS DE ASSIMETRIA Numa distribuição simétrica, coincidem a média, a moda e a mediana e os quartis ficam equidistantes da mediana, o que não ocorre com uma distribuição assimétrica. Para sua análise temos a seguinte apresentação gráfica: Figura 1. Análise da assimetria Portanto, assimetria é o grau de deformação de uma distribuição de frequências (Polígono de Frequências). Para se mensurar a assimetria são utilizados os dois Coeficientes de Pearson. 4.3.1 PRIMEIRO COEFICIENTE DE PEARSON O Primeiro Coeficiente de Pearson utiliza-se da seguinte fórmula: AS x mo s Assimetria Positiva Simétrica Assimetria Negativa n s Sx Prof. DSc. Jefferson de Souza Pinto 41 O critério de análise é o seguinte: Se AS= 0 a distribuição é simétrica. Se AS > 0 a distribuição é assimétrica positiva. Se AS < 0 a distribuição é assimétrica negativa. 4.3.2 SEGUNDO COEFICIENTE DE PEARSON O Segundo Coeficiente de Pearson utiliza-se da seguinte fórmula: AS Q Q 2md Q Q 3 1 3 1 onde: AS = Grau de Assimetria ou enviesamento. Vale o mesmo critério do Primeiro Coeficiente de Pearson, ou seja: Se AS= 0 a distribuição é simétrica. Se AS > 0 a distribuiçãoé assimétrica positiva. Se AS < 0 a distribuição é assimétrica negativa. 4.4 MEDIDAS DE CURTOSE Algumas distribuições seriam bem caracterizadas, do ponto de vista da Estatística Descritiva, com as duas primeiras medidas apresentadas (tendência central e dispersão). Vimos que as medidas de assimetria complementavam as informações verificando se os seus pesos eram distribuídos igualmente dos dois lados da média. Uma medida menos usada, mas que completaria nossa discussão seria aquela chamada de curtose. Ela tenta medir o grau de achatamento das distribuições em relação à distribuição normal. Com referência ao grau de achatamento podemos ter: Figura 1. Representação Gráfica da Curtose das distribuições Para medirmos o grau de curtose utilizamos o coeficiente: 1090 13 PP2 QQ K Se: Prof. DSc. Jefferson de Souza Pinto 42 Se 0,263K a curva correspondente à distribuição de frequência é mesocúrtica. Se 0,263K a curva correspondente à distribuição de frequência é leptocúrtica. Se 0,263K a curva correspondente à distribuição de frequência é platicúrtica. No exemplo a seguir, calcule os dois coeficientes de assimetria e o coeficiente de curtose: Tabela 1. Idade dos funcionários de uma empresa. Idades fi 7 ├ 17 6 17 ├ 27 15 27 ├ 37 20 37 ├ 47 10 47 ├ 57 5 Total 56 Prof. DSc. Jefferson de Souza Pinto 43 EXERCÍCIOS - CAPÍTULO 04 - MEDIDAS POSIÇÃO, DISPERSÃO E OUTRAS MEDIAS 1) Considere o consumo de água em 50 residências na Cidade X no ano de 1988 450 600 700 400 600 800 990 750 500 600 990 400 600 700 500 500 990 800 600 700 459 500 500 700 800 800 800 900 990 600 700 450 400 500 750 600 700 990 900 800 600 400 800 750 500 990 450 460 900 990 a) Calcular a média aritmética, a mediana, a moda, a amplitude, a variância e o desvio padrão dos dados não agrupados. b) Agrupar os dados, construindo uma distribuição de frequências; c) Calcular a média aritmética, a mediana, a moda, a variância e o desvio padrão dos dados agrupados no item b) d) Comparar os resultados obtidos em a) e em c) 2) Calcular a média aritmética, a mediana, a moda, a variância e o desvio padrão Tabela E2 Amostra de 126 notas de Matemática do Concurso Vestibular da Universidade X em 1988 Notas frequência 0 ├─1 36 1 ├─2 20 2 ├─3 25 3 ├─4 18 4 ├─5 13 5 ├─6 9 6 ├─7 5 Total 126 3) Calcular a média aritmética, a mediana, a moda, a variância e o desvio padrão Tabela E3 Amostra de 100 medidas de um mesmo tipo de cápsula - 1988 Peso (mg) No. de cápsulas 81├─82 1 82├─83 3 83├─84 10 84├─85 30 85├─86 37 86├─87 14 87├─ 88 3 88├─89 2 Total 100 4) Determinar a média aritmética, a mediana, a moda, a variância, o desvio padrão e a amplitude dos seguintes conjuntos de dados: a) 3, 4, 1, 3, 6, 5, 6 b) 7, 8, 8, 10, 12 c) 3,20; 4,00; 0,75; 5,00; 2,13; 4,75 Prof. DSc. Jefferson de Souza Pinto 44 d) 70, 75, 76, 80, 82, 83, 90 5) Determinar a média aritmética, a mediana, a moda, a variância e o desvio padrão das seguintes distribuições: a) b) c) d) x i f i x i f i x i f i x i f i 3 2 10 5 2 3 85 5 4 5 11 8 3 9 87 1 7 8 12 10 4 19 88 10 8 4 13 6 5 25 89 3 12 3 6 28 90 5 6) Dadas as estaturas de 140 alunos, conseguiu-se a seguinte distribuição. Calcular a média aritmética, a mediana, a moda, a variância e o desvio padrão da seguinte distribuição: Tabela E6 Distribuição das estaturas de 140 alunos de uma escola Estaturas(cm) frequência 145├─150 2 150├─155 10 155├─160 27 160├─165 38 165├─170 27 170├─175 21 175├─180 8 180├─185 7 Total 140 7) Dadas a distribuição dos aluguéis de 65 casas. Determinar a média aritmética, a mediana, a moda, a variância e o desvio padrão da seguinte distribuição: Tabela E7 Distribuição dos aluguéis de 65 casas Aluguel (em R$ x 100) frequência 1,5├─3,5 12 3,5├─5,5 18 5,5├─7,5 20 7,5├─9,5 10 9,5├─11,5 5 Total 65 8) Dada a seguinte amostra de idades de alunos: 28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24 31 33 30 32 30 33 27 33 31 33 23 29 30 24 28 34 30 30 18 17 18 15 16 17 17 18 19 19 20 29 a) Calcular a média aritmética, a mediana, a moda, a amplitude, a variância e o desvio padrão dos dados não agrupados. Prof. DSc. Jefferson de Souza Pinto 45 b) Agrupar os dados, construindo uma distribuição de frequências (sugestão usar h=5 e iniciar com 15) c) Calcular a média aritmética, a mediana, a moda, a variância e o desvio padrão dos dados agrupados no item b) d) Comparar os resultados obtidos em a) e em c) 9) Dado a seguinte distribuição, determinar a média aritmética, a mediana, a moda, a variância e o desvio padrão; Tabela E9 Distribuição do número de acidentes por dia na Rodovia X no Rio de Janeiro em 1977. No. de Acidentes No. de Dias 0 8 1 9 2 3 3 5 4 3 5 2 Total 30 Outras medidas 10) Calcular os quartis (Q1 e Q3), os decis (D1 e D9), os percentis (P10 e P90) e os coeficientes de assimetria e de curtose: Tabela E1 Amostra de 126 notas de Matemática do Concurso Vestibular da Universidade X em 1988 Notas frequência 0 ├ 1 36 1 ├ 2 20 2 ├ 3 25 3 ├ 4 18 4 ├ 5 13 5 ├ 6 9 6 ├ 7 5 Total 126 11) Calcular os quartis (Q1 e Q3), os decis (D7e D9), o percentil (P99) e os coeficientes de assimetria e de curtose: Tabela E2 Amostra de 100 medidas de um mesmo tipo de cápsula - 1988 Peso (mg) No. de cápsulas 81├ 82 1 82├ 83 3 83├ 84 10 84├ 85 30 85├ 86 37 86├ 87 14 87├ 88 3 88├ 89 2 Total 100 Prof. DSc. Jefferson de Souza Pinto 46 12) Dadas as estaturas de 140 alunos, conseguiu-se a seguinte distribuição. Calcular os quartis (Q1 e Q3), os decis (D4 e D7), o percentil (P88) e os coeficientes de assimetria e de curtose: Tabela E3 Distribuição das estaturas de 140 alunos de uma escola Estaturas(cm ) frequência 145├ 150 2 150├ 155 10 155├ 160 27 160├ 165 38 165├ 170 27 170├ 175 21 175├ 180 8 180├ 185 7 Total 140 13) Dadas a distribuição dos aluguéis de 65 casas. Calcular os quartis (Q1 e Q3), os decis (D4 e D9), o percentil (P72) e os coeficientes de assimetria e de curtose: Tabela E4 Distribuição dos aluguéis de 65 casas Aluguel (em R$ X100) frequência 1,5├ 3,5 12 3,5├ 5,5 18 5,5├ 7,5 20 7,5├ 9,5 10 9,5├ 11,5 5 Total 65 Prof. DSc. Jefferson de Souza Pinto 47 CAPÍTULO 5 - PROBABILIDADE Teve origem com os jogos de azar, como girar roleta, lançar dados ou retirar cartas do baralho. As duas características mais importantes são a incerteza e a regularidade. Uma vez que o resultado em um jogo é incerto, mas tem uma regularidade. Ex.: Ao se lançar um dado várias vezes espera-se que o mesmo número de faces Vamos supor que desejamos saber a probabilidade de sair cara quando se lança uma moeda. Se a moeda for honesta, espera-se que numa série muito grande de lançamentos ocorram caras e coroas em igual número de vezes. Logo a probabilidade de ocorrer cara é 1/2. 5.1 ESPAÇO AMOSTRAL Em um fenômeno aleatório ou probabilístico, isto é, sujeito às leis do acaso, chamamos de espaço amostral ao conjunto (em geral
Compartilhar