Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* * * DESCRIÇÃO DAS DISTRIBUIÇÕES ATRAVÉS DOS NÚMEROS * * * Exemplo A diabetes é uma doença causada por um deficiente funcionamento do pâncreas. Dado que existe nos ratos uma doença análoga, muita experimentação e estudo são feitos em ratos. Num estudo foram obtidos os seguintes valores para o peso do corpo (g) de 48 ratos de uma linhagem: 35 31 35 30 30 31 24 26 33 30 34 35 29 32 29 35 30 27 30 33 33 26 43 29 29 33 28 34 31 28 33 32 29 27 32 30 35 35 28 26 31 28 34 35 30 31 34 28 * * * A descrição de uma distribuição deve incluir sua forma e números que definam seu centro e sua dispersão. Forma: histograma ou um ramo-e-folhas Centro: ??? Dispersão:????? * * * Importante!!!! Os números, assim como os gráficos, ajudam a entender, mas não constituem a “resposta” por si só. * * * Como caracterizar um grupo?? Qual o peso típico de bezerros Guzerá ao desmane no Brasil? Qual o padrão de rendimento que a poupança oferece? Qual o consumo de matéria seca esperado de um cavalo em 24 horas? * * * Medidas de centro: a média e a mediana A média é o valor médio A mediana é o valor do meio Dão idéias diferentes para “centro” e se comportam de forma diferente. * * * A média de um conjunto de observações é uma medida de localização obtida a partir da seguinte expressão: * * * Abaixo estão dispostas o núemro de leitões por leitega de porcas de uma granja Grupo I: 5, 6, 6,7,4,8,9,8, 4,4,7,7 Grupo II: 3,7,9,9,7,7,2,4,7,4,4,9 Qual a média observada nesses grupos? * * * Média ponderada * * * Foi feita a estatística dos acidentes ocorridos em um frigorífico * * * Média usando tabela de distribuição de freqüências * * * Na tabela abaixo estão dispostos os salários pagos aos funcionários de uma certa empresa * * * A média será sempre uma medida representativa dos dados ? * * * Este exemplo ilustra o ponto fraco da média como medida de centro: ela é sensível à presença de observações extremas, ainda que sejam poucas. Estas podem ser outliers, mas uma distribuição assimétrica sem outliers também terá sua média alterada em direção a sua cauda mais longa. * * * Esquematicamente podemos posicionar a média da forma seguinte, tendo em conta a representação gráfica na forma de histograma. Figura aproximadamente simétrica, pelo que o centro está bem definido O enviesamento para a esquerda provoca uma deslocação da média para a esquerda. * * * Suponha que numa região começaram a aparecer pessoas com uma virose desconhecida Foi recolhida uma amostra de 34 desses doentes a quem se perguntou, entre outras características, a idade. Depois de analisados os dados os médicos foram informados que a idade média dos doentes era de 32 anos. Um dos médicos, mais curioso que os outros pediu que lhe mostrassem a distribuição dos dados, tendo-lhe sido apresentada a seguinte distribuição. * * * Medidas de localização - Mediana A mediana M é o ponto médio de uma distribuição – um número tal que metade das observações é inferior a ele, e a outra metade é superior. Para a sua determinação utiliza-se a seguinte regra: a) Dispor as observações em ordem crescente; b) Se n é ímpar, a mediana é a observação do centro na lista ordenada. Localize a mediana contendo (n+1)/2 observações a partir do início da lista. c) Se n é par, a mediana é a semi-soma dos dois elementos médios. * * * Abaixo estão dispostas o núemro de leitões por leitega de porcas de uma granja Grupo I: 5, 6, 6,7,4,8,9,8, 4,4,7,7 Grupo II: 3,7,9,9,7,7,2,4,7 Qual a mediana observada nesses grupos? * * * Foi feita a estatística dos acidentes ocorridos em um frigorífico * * * Dado um histograma é fácil obter a posição da mediana, pois esta está na posição em que passando uma linha vertical por esse ponto o histograma fica dividido em duas partes com áreas iguais * * * 1- Quando a distribuição é simétrica, a média e a mediana coincidem. 2- A mediana não é tão sensível, como a média, às observações que são muito maiores ou muito menores do que as restantes (outliers). Por outro lado a média reflete o valor de todas as observações. * * * Emprego da Mediana Deseja-se obter o ponto que divide a distribuição em duas partes iguais; Há valores extremos que afetam de uma maneira acentuada a média; A variável em estudo é salário. * * * Posição relativa da média e mediana Quando a distribuição é simétrica, as duas medidas coincidem. Em distribuições assimétricas a diferença é tanto maior quanto maior for a assimetria M<Media, no caso de curva assimétrica positiva Média<M, no caso de curva assimétrica negativa * * * * * * Medidas de localização - Moda O valor que surge com mais frequência se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana (se não forem susceptíveis de ordenação). * * * Medidas de Posição Muitas vezes se quer caracterizar alguns pontos observados em uma população ou amostra Exemplo: 25% dos alunos de veterinária obtiveram nota acima 8 no provão. 90% da população estudou menos de 10 anos. 10% da população ganha mais de R$ 4000,00 * * * Percentis O p-ésimo percentil de uma distribuição é o valor que tem p por cento das observações nele ou abaixo dele. 20% percentil 60% percentil * * * Localização do p-ésimo percentil a) calcula-se i: i= (p/100) x n b) Se i não for inteiro, aproxima-se i para o próximo inteiro e o percentil esta localizado na iésima posição c) Se i for inteiro, percentil é o valor médio dos elementos nas posições i e (i+1) - * * * Exemplo 1 2,3,3,4,4,5,5,5,6,6,6,7,8,9 N = 14 P30 I=30/100 x 14 = 4,2~5 P30 = elemento na quinta posição 4 30% da amostra apresenta valores inferiores ou iguais a 4 * * * Exemplo 2 2,5,5,5,6,6,6,7,8,9 N = 10 P70 = ? i= 70/100 x 10 = 7 i + 1 = 8 Elemento na sétima posição = 6 Elemento na oitava posição = 7 P70 = (6+7)/2 = 6,5 70% da amostra apresenta valores iguais ou inferiores a 6,5 * * * Abaixo estão dispostas o núemro de leitões por leitega de porcas de uma granja Grupo I: 5, 6, 6,7,4,8,9,8, 4,4,7,7, 3,7,9,9,7,7,2,4 Qual o P25? Qual o P77? Qual o P10? Qual o P39? * * * Quartis: valores que dividem a série em quatro partes iguais. Primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele. Segundo quartil (Q2) – igual a mediana Terceiro quartil - valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores que ele. * * * DECIS Valores que dividem a série em dez partes iguais. D1 = P10 D4 = P40 * * * Intervalo Interquartil IIQ IIQ=Q3-Q1 Os quartis e o IIQ não são afetados por variações em qualquer uma das caudas das distribuições. * * * Critério 1,5 x IIQ para Outliers Uma observação será considerada outlier se estiver 1,5 x IIQ acima do terceiro quartil ou baixo do primeiro quartil * * * Valor adjacente inferior VAI = Q1 – 1,5(Q3-Q1) * * * Valor adjacente superior VAS=Q3 + 1,5(Q3-Q1) * * * Resumo dos cinco números: Mínimo Q1 M Q3 Máximo * * * Gráfico Caixa de Bigodes * * * II Q Valor mínimo ou VAI quando houver Valor máximo ou VAI quando houver * * * Considere os seguintes dados referentes ao peso (em Kg) de 40 animais: 4,3 6,8 9,2 7,2 8,7 8,6 6,6 5,2 8,1 10,9 7,4 4,5 3,8 7,6 6,8 7,8 8,4 7,5 10,5 6,0 7,7 8,1 7,0 8,2 8,4 8,8 6,7 8,2 9,4 7,7 6,3 7,7 9,1 7,8 7,9 7,9 9,4 8,2 6,7 8,2 a) Construa o diagrama de caule-e-folhas. b) Calcule o peso: i. mais frequente; ii. mediano; iii. máximo; iv. mínimo. c) Determine o intervalo dos 25% menores pesos e o intervalo dos 25% maiores pesos da amostra. d) Se tivesse que apresentar um valor tal que 68% dos animais tivessem um peso inferior ou igual a esse valor, qual apresentaria? e) Represente a caixa-de-bigodes e identifique possíveis outliers. Comente a distribuição dos dados. f) Após agrupar os dados em classes, calcule a média e o desvio padrão para os dados agrupados.
Compartilhar