Buscar

Apre3_2009

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
*
*
DESCRIÇÃO DAS DISTRIBUIÇÕES ATRAVÉS DOS NÚMEROS
*
*
*
Exemplo
A diabetes é uma doença causada por um deficiente funcionamento do pâncreas. Dado que existe nos ratos uma doença análoga, muita experimentação e estudo são feitos em ratos. Num estudo foram obtidos os seguintes valores para o peso do corpo (g) de 48 ratos de uma linhagem:
35 31 35 30 30 31 24 26 33 30 34 35
29 32 29 35 30 27 30 33 33 26 43 29
29 33 28 34 31 28 33 32 29 27 32 30
35 35 28 26 31 28 34 35 30 31 34 28
*
*
*
A descrição de uma distribuição deve incluir sua forma e números que definam seu centro e sua dispersão.
Forma: histograma ou um ramo-e-folhas
Centro: ???
Dispersão:?????
*
*
*
Importante!!!!
Os números, assim como os gráficos, ajudam a entender, mas não constituem a “resposta” por si só.
*
*
*
Como caracterizar um grupo??
Qual o peso típico de bezerros Guzerá ao desmane no Brasil?
Qual o padrão de rendimento que a poupança oferece?
Qual o consumo de matéria seca esperado de um cavalo em 24 horas?
*
*
*
Medidas de centro: a média e a mediana
 A média é o valor médio
A mediana é o valor do meio
Dão idéias diferentes para “centro” e se comportam de forma diferente.
*
*
*
A média de um conjunto de observações é uma medida de localização obtida a partir da seguinte expressão:
*
*
*
Abaixo estão dispostas o núemro de leitões por leitega de porcas de uma granja
Grupo I: 5, 6, 6,7,4,8,9,8, 4,4,7,7
Grupo II: 3,7,9,9,7,7,2,4,7,4,4,9
Qual a média observada nesses grupos?
*
*
*
Média ponderada
*
*
*
Foi feita a estatística dos acidentes ocorridos em um frigorífico 
*
*
*
Média usando tabela de distribuição de freqüências
*
*
*
Na tabela abaixo estão dispostos os salários pagos aos funcionários de uma certa empresa
*
*
*
A média será sempre uma medida representativa dos dados ?
*
*
*
Este exemplo ilustra o ponto fraco da média como medida de centro: ela é sensível à presença de observações extremas, ainda que sejam poucas.
Estas podem ser outliers, mas uma distribuição assimétrica sem outliers também terá sua média alterada em direção a sua cauda mais longa.
*
*
*
Esquematicamente podemos posicionar a média da forma seguinte, tendo em conta a representação gráfica na forma de histograma.
Figura aproximadamente simétrica, pelo que o centro está bem definido
O enviesamento para a esquerda provoca uma deslocação da média para a esquerda.
*
*
*
Suponha que numa região começaram a aparecer pessoas com uma virose desconhecida
Foi recolhida uma amostra de 34 desses doentes a quem se perguntou, entre outras características, a idade. Depois de analisados os dados os médicos foram informados que a idade média dos doentes era de 32 anos. Um dos médicos, mais curioso que os outros pediu que lhe mostrassem a distribuição dos dados, tendo-lhe sido apresentada a seguinte distribuição.
*
*
*
Medidas de localização - Mediana
A mediana M é o ponto médio de uma distribuição – um número tal que metade das observações é inferior a ele, e a outra metade é superior.
 Para a sua determinação utiliza-se a seguinte regra:
a) Dispor as observações em ordem crescente;
b) Se n é ímpar, a mediana é a observação do centro na lista ordenada. Localize a mediana contendo (n+1)/2 observações a partir do início da lista.
c) Se n é par, a mediana é a semi-soma dos dois elementos médios.
*
*
*
Abaixo estão dispostas o núemro de leitões por leitega de porcas de uma granja
Grupo I: 5, 6, 6,7,4,8,9,8, 4,4,7,7
Grupo II: 3,7,9,9,7,7,2,4,7
Qual a mediana observada nesses grupos?
*
*
*
Foi feita a estatística dos acidentes ocorridos em um frigorífico
*
*
*
Dado um histograma é fácil obter a posição da mediana, pois esta está na posição em que passando uma linha vertical por esse ponto o histograma fica dividido em duas partes com áreas iguais
*
*
*
1- Quando a distribuição é simétrica, a média e a mediana coincidem.
2- A mediana não é tão sensível, como a média, às observações que são muito maiores ou muito menores do que as restantes (outliers). Por outro lado a média reflete o valor de todas as observações. 
*
*
*
Emprego da Mediana
 Deseja-se obter o ponto que divide a distribuição em duas partes iguais;
 Há valores extremos que afetam de uma maneira acentuada a média;
 A variável em estudo é salário.
*
*
*
Posição relativa da média e mediana
 Quando a distribuição é simétrica, as duas medidas coincidem. 
 Em distribuições assimétricas a diferença é tanto maior quanto maior for a assimetria
M<Media, no caso de curva assimétrica positiva
Média<M, no caso de curva assimétrica negativa
*
*
*
*
*
*
Medidas de localização - Moda
O valor que surge com mais frequência  se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos.
Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana (se não forem susceptíveis de ordenação).
*
*
*
Medidas de Posição
Muitas vezes se quer caracterizar alguns pontos observados em uma população ou amostra
Exemplo:
25% dos alunos de veterinária obtiveram nota acima 8 no provão.
90% da população estudou menos de 10 anos. 
10% da população ganha mais de R$ 4000,00
*
*
*
Percentis
 O p-ésimo percentil de uma distribuição é o valor que tem p por cento das observações nele ou abaixo dele.
20% percentil
60% percentil
*
*
*
Localização do p-ésimo percentil
a) calcula-se i:
i= (p/100) x n
b) Se i não for inteiro, aproxima-se i para o próximo inteiro e o percentil esta localizado na iésima posição
c) Se i for inteiro, percentil é o valor médio dos elementos nas posições i e (i+1)
-
*
*
*
Exemplo 1
2,3,3,4,4,5,5,5,6,6,6,7,8,9
N = 14 P30
I=30/100 x 14 = 4,2~5
P30 = elemento na quinta posição  4
30% da amostra apresenta valores inferiores ou iguais a 4
*
*
*
Exemplo 2
2,5,5,5,6,6,6,7,8,9
N = 10 P70 = ?
		i= 70/100 x 10 = 7
		i + 1 = 8
Elemento na sétima posição = 6
Elemento na oitava posição = 7
P70 = (6+7)/2 = 6,5
 70% da amostra apresenta valores iguais ou inferiores a 6,5			
*
*
*
Abaixo estão dispostas o núemro de leitões por leitega de porcas de uma granja
Grupo I: 5, 6, 6,7,4,8,9,8, 4,4,7,7, 3,7,9,9,7,7,2,4
Qual o P25?
Qual o P77? 
Qual o P10?
Qual o P39?
*
*
*
Quartis: valores que dividem a série em quatro partes iguais.
Primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele.
Segundo quartil (Q2) – igual a mediana
Terceiro quartil - valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores que ele. 
*
*
*
DECIS
Valores que dividem a série em dez partes iguais.
D1 = P10
D4 = P40
*
*
*
Intervalo Interquartil IIQ
IIQ=Q3-Q1
Os quartis e o IIQ não são afetados por variações em qualquer uma das caudas das distribuições.
*
*
*
Critério 1,5 x IIQ para Outliers
Uma observação será considerada outlier se estiver 1,5 x IIQ acima do terceiro quartil ou baixo do primeiro quartil
*
*
*
Valor adjacente inferior
VAI = Q1 – 1,5(Q3-Q1) 
*
*
*
Valor adjacente superior
VAS=Q3 + 1,5(Q3-Q1)
*
*
*
Resumo dos cinco números:
Mínimo Q1 M Q3 Máximo
*
*
*
Gráfico Caixa de Bigodes
*
*
*
II Q
Valor mínimo ou VAI quando houver
Valor máximo ou VAI quando houver
*
*
*
Considere os seguintes dados referentes ao peso (em Kg) de 40 animais:
4,3 6,8 9,2 7,2 8,7 8,6 6,6 5,2 8,1 10,9
7,4 4,5 3,8 7,6 6,8 7,8 8,4 7,5 10,5 6,0
7,7 8,1
7,0 8,2 8,4 8,8 6,7 8,2 9,4 7,7
6,3 7,7 9,1 7,8 7,9 7,9 9,4 8,2 6,7 8,2
a) Construa o diagrama de caule-e-folhas.
b) Calcule o peso:
i. mais frequente;
ii. mediano;
iii. máximo;
iv. mínimo.
c) Determine o intervalo dos 25% menores pesos e o intervalo dos 25% maiores pesos da amostra.
d) Se tivesse que apresentar um valor tal que 68% dos animais tivessem um peso inferior ou igual a esse valor, qual apresentaria?
e) Represente a caixa-de-bigodes e identifique possíveis outliers. Comente a distribuição dos dados.
f) Após agrupar os dados em classes, calcule a média e o desvio padrão para os dados agrupados.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais