Baixe o app para aproveitar ainda mais
Prévia do material em texto
DISTRIBUIÇÃO NORMAL Universidade Federal de Goiás Escola de Agronomia ESA0139 –Experimentação e Estatística Prof.ª Bruna Mendes de Oliveira brunamendesdeoliveira@gmail.com Por que é tão importante na Bioestatística? 1. Inúmeros são os fenômenos aleatórios (variáveis biológicas) cujos comportamentos podem ser descritos precisamente ou de forma muito aproximada pelo modelo probabilístico normal; Ex: caracteres quantitativos contínuos (produtividade, altura de plantas, peso dos animais, ...) DISTRIBUIÇÃO NORMAL Por que é tão importante na Bioestatística? 2. A maioria dos testes estatísticos partem do princípio que os dados possuem a distribuição normal (Testes paramétricos). 3. Testes para verificar a Normalidade. Shapiro-Wilk Kolmogorov-Smirnov Outros. DISTRIBUIÇÃO NORMAL Por que é tão importante na Bioestatística? 4. Variáveis que não seguem a distribuição normal podem ser transformadas para atingir a normalidade. Ex: X log (X) X raiz quadrada (X) X arco seno (X) Etc. 5. A distribuição dos dados se aproxima da normal à medida que o tamanho da amostra cresce. DISTRIBUIÇÃO NORMAL → → → Não atendem a distribuição normal Atendem a distribuição normal Variável aleatória contínua: altura das plantas de milho (m) x f( x) x f( x) x f( x) x f( x) x f( x) x f( x) x f( x) x f( x) FUNÇÃO DENSIDADE DE PROBABILIDADE DA DISTRIBUIÇÃO NORMAL 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 X~N μ, σ2 A variável aleatória X tem distribuição normal com média μ e variância σ2 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 PROPRIEDADES DA DISTRIBUIÇÃO NORMAL 1. f(x) possui um ponto de máximo para x = µ. 2. f(x) tem dois pontos de inflexão cujas abscissas (eixo x) valem µ + σ e µ - σ. 1. f(x) é simétrica em relação à x = µ. E ainda µ = Moda = Mediana. 4. f(x) tende a zero quando x tende para ± ∞ (assintótica em relação ao eixo x). A curva abriga 100% da população, ou seja, toda a população está sob a curva. PROPRIEDADES DA DISTRIBUIÇÃO NORMAL A média, a mediana e a moda coincidem e estão no centro da distribuição. PROPRIEDADES DA DISTRIBUIÇÃO NORMAL A curva é simétrica em torno da média. Logo, 50% dos valores são iguais ou maiores do que a média e 50% dos valores são iguais ou menores do que a média. PROPRIEDADES DA DISTRIBUIÇÃO NORMAL 68% dos dados estarão a mais ou menos um desvio padrão de distância da média. 𝑃*(𝜇 − 𝜎) ≤ 𝑋 ≤ (𝜇 + 𝜎)+= 0,68 PROPRIEDADES DA DISTRIBUIÇÃO NORMAL 95% dos dados estarão a mais ou menos de 1,96 desvio padrão de distância da média. 𝑃*(𝜇 − 1,96 𝜎) ≤ 𝑋 ≤ (𝜇 + 1,96 𝜎)+= 0,95 PROPRIEDADES DA DISTRIBUIÇÃO NORMAL 𝑓 𝑥 = 1 0,3 2𝜋 𝑒 − 1 2 𝑥−2 0,3 2 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 X = altura das plantas (m) µ = 2,0m σ = 0,3m X = altura das plantas (m) µ = 2,0m σ = 0,3m 𝑓 𝑥 = 1 0,3 2𝜋 𝑒 − 1 2 𝑥−2 0,3 2 f( x) f( x) 𝑓 𝑥 = 1 0,3 2𝜋 𝑒 − 1 2 𝑥−2 0,3 2 2,5 −∞ f( x) f( x) 𝑓 𝑥 = 1 0,3 2𝜋 𝑒 − 1 2 𝑥−2 0,3 2 1,5 −∞ f( x) f( x) f( x) 𝑓 𝑥 = 1 0,3 2𝜋 𝑒 − 1 2 𝑥−2 0,3 2 2,4 1,8 𝑓 𝑧 = 1 2𝜋 𝑒− 𝑧2 2 média μ = 0 e desvio padrã𝑜 σ = 1 DISTRIBUIÇÃO NORMAL PADRONIZADA 𝑧𝑖 = 𝑥𝑖 − 𝜇 𝜎 f( x) x Padronização da variável X em Z x z f( x) x Padronização da variável X em Z 𝑧𝑖 = 𝑥𝑖 − 𝜇 𝜎 x z 4. Distribuição Normal Padrão f( x) μ = 2,0 m e σ = 0,3 m Qual a probabilidade de que uma planta apresente altura menor do que 2,5 m? 𝑧𝑖 = 𝑥 − 𝜇 𝜎 = 2,5 − 2,0 0,3 = 1,67 𝑧𝑖 = 1,67 -> 0,4525 P(X < 2,5)= 0,5 + 0,4525 = 0,9525 μ = 2,0 m e σ = 0,3 m f( x) μ = 2,0 m e σ = 0,3 m μ = 2,0 m e σ = 0,3 m Qual a probabilidade de que uma planta apresente altura menor do que 1,5 m? 𝑧𝑖 = 𝑥 − 𝜇 𝜎 = 1,5 − 2,0 0,3 = 1,67 𝑧𝑖 = 1,67 -> 0,4525 P(X < 1,5)= 0,5 - 0,4525 = 0,0475 f( x) μ = 2,0 m e σ = 0,3 m μ = 2,0 m e σ = 0,3 m Qual a probabilidade de que uma planta apresente altura menor entre 1,8 e 2,4m? 𝑧𝑖 = 𝑥−𝜇 𝜎 = 1,8−2,0 0,3 = 0,67 𝑧𝑖 = 0,67 -> 0,2486 𝑧𝑖 = 𝑥 − 𝜇 𝜎 = 2,4 − 2,0 0,3 = 1,33 𝑧𝑖 = 1,33 -> 0,4082 P(1,8< X < 2,4)= 0,2486 + 0,4082 = 0,6568 Exercício 1: Calcule: a) P(Z < 1,82) b) P(Z < -2,03) c) P(-2,55 < Z < 1,20) d) P (Z > 1,93) Exercício 1: Calcule: a) P(Z < 1,82) = 0,9656 b) P(Z < -2,03) = 0,0212 c) P(-2,55 < Z < 1,20) = 0,8795 d) P (Z > 1,93) = 0,0268 Exercício 2: Se X ~ N (100, 25) a) P(X ≥110) b) P(95 ≤ X ≤ 105) c) Encontre x tal que P(X ≤ x) = 0,3446 Exercício 2: Se X ~ N (100, 25) a) P(X ≥110) = 0,0228 b) P(95 ≤ X ≤ 105) = 0,6826 c) Encontre x tal que P(X ≤ x) = 0,3446. Resp: x=98 Exercício 3: A quantidade de chuva observada no mês de janeiro em Goiânia é normalmente distribuída com μ = 225 mm e σ = 20 mm. a) Qual a probabilidade de que em Goiânia , em um mês de janeiro, se observe mais do que 250 mm de chuva? b) Qual a probabilidade de que em Goiânia, em um mês de janeiro, se observe menos do que 150 mm de chuva? Exercício 3: X ~N µ = 225 mm σ = 20 mm a) P(X > 250)=? z = x−μ σ = 250 −225 20 = 1,25 -> 0,3944 P(X > 250)= 0,5 – 0,3944 = 0,1056 b) P(X < 150)=? z = x−μ σ = 150 −225 20 = -3,75 -> 0,4999 P(X > 250)= 0,5 – 0,4999 = 0,0001 = 0,01% Exercício 4: O diâmetro arames utilizados para fazer cercas em propriedades rurais é uma variável aleatória normalmente distribuída, com média de 0,8 mm e variância de 0,0004 mm2. Em uma amostra de 1000 arames, quantos esperamos que tenha diâmetro: a) Maior ou igual a 0,81mm. b) Entre 0,73 e 0,86 mm. c) Menor que 0,78 mm. Exercício 4: X ~N µ = 0,8 mm σ2 = 0,0004mm2 n =1000 cabos a) P(X > 0,81)=? z = x − μ σ = 0,81 − 0,8 0,02 = 0,5 P(X > 0,81) = 0,5 – 0,1915 = 0,3085 1000 - 100% X - 30,85% X ≅309 arames Exercício 4: X ~N µ = 0,8 mm σ2 = 0,0004mm2 n =1000 cabos b) P(0,73 < X < 0,86)=? 𝑧1 = 𝑥1−μ σ = 0,73−0,8 0,02 = −3,5 𝑧2 = 𝑥2−μ σ = 0,86−0,8 0,02 = 3,0 P(0,73 < X < 0,86) = 0,5 + 0,4989 = 0,9989 1000 - 100% X - 99,89 % X ≅ 999 arames Exercício 4: X ~N µ = 0,8 mm σ2 = 0,0004mm2 n =1000 cabos c) P(X < 0,78)=? z = x − μ σ = 0,78 − 0,8 0,02 = −1,0 P(X < 0,78) = 0,5 – 0,3413 = 0,1587 1000 - 100% X - 15,87% X ≅ 159 arames Exercício 5: Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com média 18 e variância 2,25. Um lote de 5000 cabeças, com essa característica, foi destinado ao frigorífico que abate só a partir de um peso mínimo “w”. Sabendo-se que foram abatidas 4200 cabeças, pede-se: a) O número esperado de bovinos com peso entre 17 e 19 arrobas. b) Qual o valor de “w”? Exercício 5: X ~N µ = 18 σ2 = 2,25 -> σ = 1,5 n = 5000 w = peso mínimo 4200 cabeças foram abatidas a) P(17 < X < 19)=? 𝑧1 = 𝑥1−μ σ = 17−18 1,5 = −0,67 -> 0,2486 𝑧2 = 𝑥2−μ σ = 19 −18 1,5 = 0,67 -> 0,2486 P(17 < X < 19)= 0,2486 + 0,2486 = 0,4972 5000 - 100% X - 49,72% X = 2486 cabeças Exercício 5: X ~N µ = 18 σ2 = 2,25 -> σ = 1,5 n = 5000 w = peso mínimo 4200 cabeças foram abatidas b) 5000 - 100%4200 - X X = 84% = 0,84 0,5 0,34 -> olhar na tabela -> z = -0,99 Z = x−μ σ -> -0,99 = x−18 1,5 x = (-0,99.1,5)+18 x = 16,52 arrobas Exercício 6: Em um povoamento florestal os diâmetros à altura do peito (DAP) apresentam distribuição normal com média 18,2 cm e desvio padrão 3,4 cm. a) Foram cortadas 1200 árvores que tinham DAP acima de 20 cm. Quantas árvores existiam no povoamento? b) Quantas árvores tem DAP menor que 16 cm? Exercício 6: X ~N µ = 18,2 σ = 3,4 a) 1200 -> DAP > 20,0 cm P(X > 20)=? z = x−μ σ = 20 −18,2 3,4 = 0,53 -> 0,2019 P(X > 20)= 0,5 – 0,2019 = 0,2981 1200 – 29,81% X - 100% X = 4025 árvores Exercício 6: X ~N µ = 18,2 σ = 3,4 b) P(X < 16)=? z = x−μ σ = 16 −18,2 3,4 = −0,65 -> 0,2422 P(X < 16)= 0,5 – 0,2422 = 0,2578 4025 – 100% X - 25,78% X = 1038 árvores Exercício 7: Um pesquisador decidiu que, para facilitar a classificação das aves em experimentos de nutrição, deve-se dividir as poedeiras, no início da postura, em três grupos de peso equiprováveis, a saber: poedeiras pesadas, poedeiras médias e poedeiras leves. Encontre os pesos correspondentes a cada classe, sabendo-se que o peso médio das aves nessa idade é 1,5 kg, com desvio padrão de 0,170 kg e essa variável segue distribuição normal. Exercício 7: X ~N µ = 1,5 kg σ = 0,170 kg pesadas = 1/3 = 0,33 leves = 1/3 = 0,33 médias = 1/3 = 0,33 0,33/2=0,165 -> z1= -0,43 e z2= 0,43 ________z1________0________z2_________ ________x1_______1,5_______x2_________ 𝑧 = 𝑥 − 𝜇 𝜎 -0,43= 𝑥1−1,5 0,170 𝑥1 = 1,43 0,43= 𝑥2−1,5 0,170 𝑥2 = 1,57 pesadas: peso <1,43kg leves: 1,43kg ≤peso ≤ 1,57kg médias: peso >1,57kg BINOMIAL SE APROXIMA DA DISTRIBUIÇÃO NORMAL Considere: n=135 e p=0,6 • P (X ≥ 98)? P (X = 98) + P (X = 99) + P (X = 100) + ... + P (X = 135) Muito laborioso! Considere: X é uma variável aleatória, que apesar de discreta, pode ser razoavelmente descrita pela distribuição normal. • P (X ≥ 98)? por meio da variável Z Bem mais simples! 𝑃 𝑥 = 𝐶𝑛,𝑥𝑝 𝑥(1 − 𝑝)𝑛−𝑥 BINOMIAL SE APROXIMA DA DISTRIBUIÇÃO NORMAL Aumentando-se o tamanho da amostra, a distribuição de probabilidades binomial se aproxima da normal, mesmo a variável sendo do tipo discreta, ela passa a ser “tratada” como uma variável do tipo contínua. EXEMPLO 1: O gerente de uma fazenda produtora de café precisa selecionar mão de obra para a colheita do café e para tanto terá que avaliar candidatos na região e contratar pelo menos 40 colaboradores. Suponha que a probabilidade de que um candidato seja qualificado ao trabalho (evento sucesso) seja de 0,6. Durante um dia ele vai avaliar 60 candidatos, e deseja saber qual a probabilidade de encontrar 40 colaboradores ou mais aptos ao serviço. P (X ≥ 40) = ? p = 0,6 q = 0,4 n = 60 EXEMPLO 1: p = 0,6 q = 0,4 n = 60 𝑃 𝑋 = 𝑥 = 𝐶𝑛,𝑥 𝑝 𝑥(1 − 𝑝)𝑛−𝑥 Nº de colaboradores Gráfico de barras verticais representando a distribuição de probabilidade da variável aleatória “número de colaboradores aptos”, em um total de 60 candidatos. Aproximação normal a uma distribuição binomial com parâmetros n = 60 e p = 0,6. 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 p = 0,6 q = 0,4 n = 60 μ = n.p = 60 x 0,6 = 36 σ2 = n. p. q = 60 x 0,6 x 0,4 = 14,4 EXEMPLO 1: p = 0,6 q = 0,4 n = 60 μ = n.p = 60 x 0,6 = 36 σ2 = n. p. q = 60 x 0,6 x 0,4 = 14,4 σ = σ2 = 14,4 = 3,79 EXEMPLO 1: Pela normal padrão: P (X ≥ 40) = ? 40 [39,5] correção P (X ≥ 39,5) = ? z = 39,5 − 36 3,79 = 0,92 P (X ≥ 39,5) = 0,5 – 0,3212 = 0,1788 Pela binomial : 𝑃 X ≥ 40 = 𝐶𝑛,𝑥 𝑝𝑥(1 − 𝑝)𝑛−𝑥= 0,1786 Existe uma probabilidade de 17,88% de se encontrar 40 colaboradores, ou mais, aptos para o serviço, em um total de 60 candidatos. 1) Subtrair 0,5 de x quando procuramos P(X ≥ x). 2) Somar 0,5 em x quando procuramos P(X ≤ x). Recomenda-se essa correção por se tratar de uma variável discreta (distribuição binomial), quando é feita a correspondência para o caso contínuo (distribuição normal). RECOMENDAÇÃO
Compartilhar