Baixe o app para aproveitar ainda mais
Prévia do material em texto
18/09/2014 1 Curso de Análise Estatística - Ângela T. Paes Existem várias formas de distribuições de freqüências. Muitas variáveis quantitativas contínuas apresentam distribuições nas quais os valores centrais são mais freqüentes e os valores extremos são menos freqüentes.Além disso, os valores acima ou abaixo do centro ocorrem na mesma proporção. Exemplo: hemoglobina Se desenharmos uma linha contínua representando esta tendência, temos uma curva em forma de sino. A forma dessa curva sino é conhecida como curva Normal e pode ser A forma dessa curva sino é conhecida como curva Normal e pode ser expressa matematicamente em termos de dois conceitos estatísticos já expressa matematicamente em termos de dois conceitos estatísticos já discutidos discutidos –– média (média (µµµµ) e e desvio padrão (desvio padrão (σσσσ).. 4,0 6,0 8,0 10,0 12,0 Hemoglobina (g/100mL) 0 5 10 15 20 Fr e qu en ci a ab s o lu ta Distribuição NormalDistribuição Normal Curso de Análise Estatística - Ângela T. Paes Propriedades da Distribuição NormalPropriedades da Distribuição Normal �Média (µµµµ ) = Mediana (Md), ou seja, a curva de freqüência é simétrica em torno de µµµµ. A distância entre a média e mediana pode dar uma indicação sobre a simetria da distribuição. Se a média e mediana são muito distantes provavelmente existem valores extremos que distorcem a média para cima ou para baixo. O coeficiente de assimetria mede o grau de desvio ou afastamento da simetria da distribuição. Na distribuição normal o coeficiente de assimetria é 0. Na análise dos dados, podemos ser mais tolerantes e considerar valores entre -2 e +2. � O achatamento é padrão. O coeficiente de curtose mede o achatamento da distribuição. Na distribuição Normal o valor da curtose é 3 (alguns programas centralizam a curtose em 0).Na análise de dados consideramos que o achatamento é aproximadamente normal se o coeficiente de curtose estiver entre 1 e 5 ou, caso esteja centrado em 0, se estiver entre -2 e +2. Curso de Análise Estatística - Ângela T. Paes � 68% dos valores individuais estão entre µµµµ - σσσσ e µµµµ + σσσσ � 80% dos valores individuais estão entre µµµµ - 1,28σσσσ e µµµµ + 1,28σσσσ � 90% dos valores individuais estão entre µµµµ - 1,64σσσσ e µµµµ + 1,64σσσσ � 95% dos valores individuais estão entre µµµµ - 1,96σσσσ e µµµµ + 1,96σσσσ � 98% dos valores individuais estão entre µµµµ - 2,33σσσσ e µµµµ + 2,33σσσσ � 99% dos valores individuais estão entre µµµµ - 2,58σσσσ e µµµµ + 2,58σσσσ � 99,7% dos valores individuais estão entre µµµµ - 3σσσσ e µµµµ + 3σσσσ Distribuição Normal com média Distribuição Normal com média µ e µ e desviodesvio padrãopadrão σσ interpretação para “intervalos de normalidade” 68,3% dos valores individuais estão entre ( µ - σ ) e ( µ + σ ) 95,4% dos valores individuais estão entre ( µ - 2σ ) e ( µ + 2σ ) 99,7% dos valores individuais estão entre ( µ - 3σ ) e ( µ + 3σ ) Distribuição Normal com média Distribuição Normal com média µ e µ e desviodesvio padrãopadrão σσ Fonte: http://www.portalaction.com.br/content/62-distribuição-normal Distribuição Normal Distribuição Normal PadrãoPadrão Fonte: Modelos probabilísticos contínuos - Modelo Normal – Carine Savalli e Lilian Natis. Curso de verão IME-USP, 2004 Fonte: Modelos probabilísticos contínuos - Modelo Normal – Carine Savalli e Lilian Natis. Curso de verão IME-USP, 2004 Mudança de escala após padronizaçãoMudança de escala após padronização 18/09/2014 2 Gráfico Normal de Probabilidades Gráfico Normal de Probabilidades –– Normal Normal PlotPlot Contrasta os valores observados na amostra com os valores esperados caso a distribuição seja Normal. O que se espera são pontos em torno de uma reta. Mesmo que os dados originais não tenham distribuição Normal, a distribuição das médias amostrais irá se aproximando da distribuição Normal conforme o tamanho da amostra vai aumentando. Visualização do Teorema do Limite CentralVisualização do Teorema do Limite Central A “ v e lo ci d a d e d e c o n v e rg ê n ci a ” d e p e n d e d a d is tr ib u iç ã o o ri g in a l. Curso de Análise Estatística - Ângela T. Paes Bilirrubina serica D e n si da de de fre qu e n ci a 0 50 100 150 200 250 300 350 400 450 500 550 600 0. 0 0. 00 5 0. 01 0 0. 01 5 Bilirrubina serica (log) D en si da de de fre qu e n ci a 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 0. 0 0. 1 0. 2 0. 3 0. 4 0. 5 Transformação de variávelTransformação de variável Às vezes a distribuição de uma variável é assimétrica. Isto acontece com freqüência em dosagens de laboratório, nas quais há muita variabilidade, mas uma grande concentração nos valores próximos a zero. Nesse caso, podemos utilizar uma transformação logarítimica para “normalizar” a distribuição.
Compartilhar