Prévia do material em texto
Slide 1 Ana M. Abreu - 2006/07 Capítulo 3 Modelos Estatísticos Resenha Variáveis Aleatórias Distribuição Binomial Distribuição de Poisson Distribuição Normal Distribuição t de Student Distribuição Qui-quadrado Slide 2 Ana M. Abreu - 2006/07 Resenha Este capítulo aborda as distribuições de probabilidade tendo em conta os conhecimentos de estatistica descritiva apresentados no Capítulo 1 e os de probabilidade apresentados no Capítulo 2 . As Distribuições de Probabilidade descrevem o que provavelmente acontecerá em vez de o que realmente aconteceu. Slide 3 Ana M. Abreu - 2006/07 Definições �Uma variável aleatória é uma variável (usualmente representada por X) que toma um certo valor numérico, determinado pelo acaso, de cada vez que a experiência é realizada. � Uma distribução de probabilidade é um gráfico, tabela, ou fórmula que indica a probabilidade correspondente a cada valor da variável aleatória. Slide 4 Ana M. Abreu - 2006/07 Definições Uma variável aleatória discreta toma um nº finito ou infinito numerável de valores. Uma variável aleatória contínua toma um nº infinito não numerável de valores, os quais podem ser associados com medidas numa escala contínua. Slide 5 Ana M. Abreu - 2006/07 Propriedades das Distribuições de Probabilidade P(x) = 1 onde x toma todos os valores possíveis. Σ 0 ≤≤≤≤ P(x) ≤≤≤≤ 1 para qualquer valor de x. Slide 6 Ana M. Abreu - 2006/07 Média, Variância e Desvio Padrão de uma Variável Aleatória µ = ΣΣΣΣ [x • P(x)] Média σσσσ2 = ΣΣΣΣ [(x – µ)2 • P(x)] Variância σσσσ 2 = [ΣΣΣΣ x2 • P(x)] – µ 2 Variância (forma reduzida) σσσσ = ΣΣΣΣ [x 2 • P(x)] – µ 2 Desvio Padrão Slide 7 Ana M. Abreu - 2006/07 Definição E = ΣΣΣΣ [x • P(x)] O Valor Esperado de uma variável aleatória discreta é denotado por E, e representa a média dos resultados. Determina-se através do valor de ΣΣΣΣ [x • P(x)]. Slide 8 Ana M. Abreu - 2006/07 Em resumo Até agora aprendemos sobre: � Combinar os métodos da estatística descritiva com os da probabilidade. � Propriedades da distribuição de probabilidade. � Média, variância e desvio padrão de uma variável aleatória. � Variáveis aleatórias e distribuições de probabilidade. � Valor esperado. Slide 9 Ana M. Abreu - 2006/07 A Distribuição Binomial Slide 10 Ana M. Abreu - 2006/07 Definições A distribuição binomial verifica as seguintes condições: 1. A experiência tem um nº fixo de provas, n. 2. As provas são independentes. (O resultado de uma prova não afecta a probabilidade de ocorrência das restantes.) 3. Cada prova origina um de dois resultados possíveis: sucesso ou insucesso. 4. A probabilidade de sucesso, denotada por p, é constante em cada prova. Slide 11 Ana M. Abreu - 2006/07 Notação para a Distribuição Binomial n denota o nº de provas (valor fixo à partida). x denota um nº específico de sucessos em n provas, logo x pode ser qualquer nº entre 0 e n, inclusive. p denota a probabilidade de sucesso em cada uma das n provas. q denota a probabilidade de insucesso em cada uma das n provas. P(x) denota a probabilidade de obter exactamente x sucessos em n provas (P(x)=P(X=x)). Slide 12 Ana M. Abreu - 2006/07 Métodos para Determinar as Probabilidades com a Distribuição Binomial Vejamos três métodos possíveis para determinar as probabilidades correspondentes à variável aleatória X com distribuição binomial. Slide 13 Ana M. Abreu - 2006/07 Método 1: Usando a Fórmula da Probabilidade na Distribuição Binomial P(X=x) = • px • qn-x(n – x)!x!n ! para x = 0, 1, 2, . . ., n onde n = nº de provas x = nº de sucessos nas n provas p = probabilidade de sucesso em cada prova q = probabilidade de insucesso em cada prova (q = 1 – p) Slide 14 Ana M. Abreu - 2006/07 Método 2: Usando uma Tabela de Probabilidades Reproduz-se em baixo parte da tabela da binomial que vamos usar. Com n = 5 e p = 0.2 na distribuição binomial, as probabilidades de obter 0, 1, 2, 3, 4 e 5 sucessos são 0.3277, 0.4096 (=0.7373-0.3277), 0.2048 (=0.9421- 0.7373), 0.0512, 0.0064 e 0.0003, respectivamente. n = 5 p x .01 .05 .10 .20 0 .3277 1 .7373 2 .9421 3 .9933 4 .9997 Slide 15 Ana M. Abreu - 2006/07 Método 3: Usando a Tecnologia Software Estatístico, Excel e algumas calculadoras fornecem-nos as probabilidades da distribuição binomial. Slide 16 Ana M. Abreu - 2006/07 Distribuição Binomial: Fórmulas Desvio Padrão σσσσ = n • p • q Média µ = n • p Variância σσσσ 2 = n • p • q onde n = nº de provas p = probabilidade de sucesso em cada uma das n provas q = probabilidade de insucesso em cada uma das n provas Slide 17 Ana M. Abreu - 2006/07 Esta situação pode ser resolvida através da distribuição binomial onde: n = 14 p = 0.5 q = 0.5 Usando as fórmulas da distribuição binomial, temos : µ = (14)(0.5) = 7 raparigas σ σ σ σ = (14)(0.5)(0.5) = 1.871 raparigas Exemplo Determine a média e o desvio padrão para o nº de raparigas em 14 nascimentos. Slide 18 Ana M. Abreu - 2006/07 Interpretação dos Resultados Valores Máximos Usuais = µ + 2 σσσσ Valores Mínimos Usuais = µ – 2 σσσσ É especialmente importante interpretar os resultados. Os valores dizem-se pouco usuais se se encontrarem para além dos seguintes limites: Slide 19 Ana M. Abreu - 2006/07 Para esta distribuição binomial, µ = 50 raparigas σσσσ = 5 raparigas µ + 2 σσσσ = 50 + 2(5) = 60 µ - 2 σσσσ = 50 - 2(5) = 40 Em 100 nascimentos, é usual nascerem entre 40 e 60 raparigas. Assim, não é usual nascerem 68 raparigas. Exemplo Determine se é usual em 100 nascimentos, 68 serem raparigas. Slide 20 Ana M. Abreu - 2006/07 A Distribuição de Poisson Slide 21 Ana M. Abreu - 2006/07 Definição A distribuição de Poisson é uma distribuição discreta que se aplica quando ocorre um acontecimento num intervalo especificado. A variável aleatória X representa o nº de ocorrências num determinado intervalo. O intervalo pode se referir a tempo, distância, área, volume, ou algum tipo de medida similar. P(X=x)= onde e ≈≈≈≈ 2.71828µ x • e -µ x! Fórmula Slide 22 Ana M. Abreu - 2006/07 Condições da Distribuição de Poisson �A variável aleatória X designa o nº de acontecimentos nalgum intervalo. Assim, pode tomar quaisquer dos valores 0, 1, 2, …) �Os acontecimentos têm que ser aleatórios. �Os acontecimentos são independentes. • Parâmetros �A média é µ. � O desvio padrão é σσσσ = µ . Slide 23 Ana M. Abreu - 2006/07 Diferenças em relação à Distribuição Binomial A distribuição de Poisson difere da distribuição binomial nos seguintes aspectos fundamentais: � A distribuição binomial é caracterizada pela dimensão da amostra n e pela probabilidade de sucesso p, enquanto que a distribuição de Poisson é caracterizada apenas pela média µ. � Numa distribuição binomial, os valores que a variável aleatória X pode tomar são 0, 1, . . . n, enquanto que na distribuição de Poisson a variável X toma os valores 0, 1, . . . , sem limite superior. Slide 24 Ana M. Abreu - 2006/07 Exemplo Bombas da 2ª Guerra Mundial Em 1945 os alemães bombardearam Londres com as bombas V2. A região londrina está dividida em 576 distritos de superfícies semelhantes, pelo que admitimos que cada distrito tem igual probabilidade de ser bombardeado. Calcula-se que o nº de bombas recebidas por Londres foi de 535. Se um distrito for seleccionado ao acaso, determine a probabilidade de ter sido bombardeado com exactamente 2 bombas. A distribuição de Poisson é adequada porque estamos a lidar com umasituação de ocorrência de acontecimentos (nº de bombas recebidas) num certo intervalo (distrito). Slide 25 Ana M. Abreu - 2006/07 Exemplo Assim, a probabilidade de um qualquer distrito ser atingido por exactamente 2 bombas é P(X=2) = 0.170. O nº médio de bombas por distrito é µ = 535 = 0.929 576 Então, P(X=2) = 0.9292 e-0.929 = 0.170. 2! Slide 26 Ana M. Abreu - 2006/07 Cálculo da probabilidade na Distribuição de Poisson usando uma Tabela Reproduz-se em baixo parte da tabela da distribuição de Poisson que vamos usar. Com µ = 0.20, as probabilidades de ocorrerem 0, 1, 2, 3 e 4 acontecimentos são 0.8187, 0.1638 (=0.9825-0.8187), 0.0164 (=0.9989- 0.9825), 0.001, e 0.0001, respectivamente. µ x .05 .10 .15 .20 0 .8187 1 .9825 2 .9989 3 .9999 4 1.0000 Slide 27 Ana M. Abreu - 2006/07 Distribuição Normal Slide 28 Ana M. Abreu - 2006/07 � Variável aleatória contínua � Distribuição Normal Caracterização Figura 3-1 Fórmula 3-1 f(x) = σσσσ 2 pipipipi x-µµµµ σσσσ 2( ) e -1 2 Slide 29 Ana M. Abreu - 2006/07 � Curva da Densidade (ou da função densidade de probabilidade é o gráfico da distribuição de probabilidade de uma variável aleatória contínua). Definições 1. A área total sob a curva é igual a 1. 2. Todo o ponto sob a curva deve ter uma ordenada de valor igual ou superior a zero. Slide 30 Ana M. Abreu - 2006/07 Uso da Área para determinar a Probabilidade Figura 3-2 Como a área total sob a curva é igual a 1, existe uma correspondência entre a área e a probabilidade. Slide 31 Ana M. Abreu - 2006/07 Alturas de Homens e Mulheres Figura 3-3 Slide 32 Ana M. Abreu - 2006/07 Definição Distribuição Normal Standard : a distribuição Normal que tem média 0 e desvio padrão 1. Figura 3-4 Slide 33 Ana M. Abreu - 2006/07 P(a < z < b) denota a probabilidade de z tomar valores entre a e b P(z > a) denota a probabilidade de z tomar valores maiores do que a P(z < a) denota a probabilidade de z tomar valores menores do que a Notação Slide 34 Ana M. Abreu - 2006/07 Cálculo do valor de z correspondente a uma certa probabilidade Figura 3-5 Cálculo do Percentil 95 1.645 5% ou 0.05 (o valor de z será positivo) Slide 35 Ana M. Abreu - 2006/07 Figura 3-6 Cálculo dos Percentis 2.5% e 97.5% (Um dos valores de z será negativo e o outro positivo) Cálculo do valor de z correspondente a uma certa probabilidade Slide 36 Ana M. Abreu - 2006/07 Distribuições Normais não Standard Se µµµµ ≠≠≠≠ 0 ou σ σ σ σ ≠≠≠≠ 1 (ou ambos), teremos que converter os valores usando a Fórmula 3-2; então, os procedimentos passam a ser os mesmos do que os usados com a distribuição Normal Standard. Fórmula 3-2 x – µ σσσσz = Slide 37 Ana M. Abreu - 2006/07 Figura 3-7 Conversão para a Distribuição Normal Standard x – µµµµ σσσσ z = Slide 38 Ana M. Abreu - 2006/07 1. Não confunda valores de z com as correspondentes áreas. Os valores de z são distâncias ao longo do eixo horizontal enquanto que as áreas são regiões sob a curva da distribuição Normal. A tabela usada apresenta os valores de z na coluna à esquerda e na linha superior, enquanto que as áreas se encontram no “meio” da tabela. 2. Escolha o lado certo (direito/esquerdo) do gráfico. 3. Um valor de z deve ser negativo sempre que se encontre na metade esquerda da distribuição Normal. 4. As áreas (ou probabilidades) têm valores positivos ou nulos, mas nunca têm valores negativos. Precauções a ter em conta Slide 39 Ana M. Abreu - 2006/07 Cálculos usando a Tabela da distribuição Normal Standard Seja Z a variável aleatória com distribuição Normal standard, ou seja, com valor médio zero e desvio padrão 1. Para calcular P(Z<0.32), é necessário consultar a tabela, na página referente aos valores positivos de z, como a seguir se indica: z .00 .01 .02 0.0 .5080 0.1 .5478 0.2 .5871 0.3 .6255 Assim, P(Z<0.32)=0.6255. Slide 40 Ana M. Abreu - 2006/07 Cálculos usando a Tabela da distribuição Normal Standard De modo análogo, P(Z<-1.51)=0.0655, mas onde agora se consultou a mesma tabela, embora na parte referente aos valores negativos de z. Por outro lado, para encontrar o valor de z correspondente a uma certa probabilidade, por exemplo, 0.975, o valor da probabilidade tem que ser procurado no interior da tabela para, só depois, determinar o valor de z que lhe corresponde. z … .05 .06 … … 1.8 .9686 1.9 .9750 Assim, o valor de z correspondente à probabilidade 0.975 é 1.96, ou seja, se P(Z<t)=0.975, então t=1.96. Slide 41 Ana M. Abreu - 2006/07 Aproximação da Distribuição Binomial pela Distribuição Normal se: np ≥≥≥≥ 5 e nq ≥≥≥≥ 5 então µ = np e σσσσ = npq e a variável aleatória tem uma distribuição Normal Slide 42 Ana M. Abreu - 2006/07 Procedimento para usar a Distribuição Normal para Aproximar a Distribuição Binomial 1. Verifique que a distribuição Normal é uma aproximação adequada à distribuição Binomial confirmando que np ≥≥≥≥ 5 e nq ≥≥≥≥ 5. 2. Determine os valores dos parâmetros µ e σσσσ calculando µ = np e σσσσ = npq. 3. Identifique o valor discreto de x (o nº de sucessos). Altere o valor discreto x substituindo-o pelo intervalo x – 0.5 a x +0.5. Represente a curva da Normal e assinale os correspondentes valores de µ , σσσσ, e de x – 0.5 ou x + 0.5, conforme a situação. 4. Determine a área correspondente à probabilidade desejada. Slide 43 Ana M. Abreu - 2006/07 Definição Quando usamos a distribuição Normal (que é uma distribuição contínua) para aproximar a distribuição Binomial (que é uma distribuição discreta), fazemos uma correção de continuidade ao valor discreto x na distribuição binomial representando o valor x pelo intervalo de x – 0.5 a x + 0.5. Slide 44 Ana M. Abreu - 2006/07 Figura 3-8 x = pelo menos 120 = 120, 121, 122, . . . x = mais do que 120 = 121, 122, 123, . . . x = no máximo 120 = 0, 1, . . . 118, 119, 120 x = menos do que 120 = 0, 1, . . . 118, 119 Slide 45 Ana M. Abreu - 2006/07 x = exactamente 120 Intervalo que representa o valor discreto 120 Slide 46 Ana M. Abreu - 2006/07 Distribuição t de Student A distribuição t de Student é a designação de uma família de distribuições indexada pelo parâmetro νννν, que representa o número de graus de liberdade (g.l.). Reproduz-se em seguida parte da tabela desta distribuição. Slide 47 Ana M. Abreu - 2006/07 Distribuição t de Student αααα νννν … .025 .01 … … 9 2.8214 10 2.7638 Os valores indicados escrevem-se na forma t(0.01; 10) = 2.7638 e lê-se: o percentil 0.01 da distribuição t de Student com 10 graus de liberdade é 2.7638. Slide 48 Ana M. Abreu - 2006/07 Distribuições t de Student com n = 3 e n = 12 Slide 49 Ana M. Abreu - 2006/07 Características importantes da distribuição t de Student 1. A distribuição t de Student varia de acordo com a dimensão da amostra (de acordo com a figura anterior, para os casos n = 3 e n = 12). 2. A curva da distribuição t de Student tem a mesma forma em sino da distribuição Normal, mas reflecte a maior variabilidade (com curvas mais alargadas) que é de esperar em amostras pequenas. 3. A distribuição t de Student tem valor médio zero (tal como a distribuição Normal standard). 4. O desvio padrão da distribuição t de Student varia de acordo com o tamanho da amostra e é maior do que 1 (o que não acontece com a distribuição Normal standard, onde σ σ σ σ = 1). 5. Quanto maior a dimensão da amostra, mais a distribuição t de Student se aproxima da distribuição Normal.Slide 50 Ana M. Abreu - 2006/07 Distribuição Qui-quadrado A distribuição Qui-quadrado é a designação de uma família de distribuições indexada pelo parâmetro νννν, que representa o número de graus de liberdade (g.l.). Reproduz-se em seguida parte da tabela desta distribuição. Slide 51 Ana M. Abreu - 2006/07 Distribuição Qui-quadrado α (α (α (α (���������dade)))) gl (df) … .10 .05 … … 9 16.919 10 18.307 Os valores indicados escrevem-se na forma ℵℵℵℵ2(0.05; 10) = 18.307 e lê-se: o percentil 0.05 da distribuição Qui- quadrado com 10 graus de liberdade é 18.307. Slide 52 Ana M. Abreu - 2006/07 Características da distribuição Qui-Quadrado 1. A distribuição Qui-quadrado não é simétrica, ao contrário do que sucede com as distribuições Normal e t de Student. Distribuição Qui-quadrado Distribuição Qui-quadrado para g.l.= 10 e g.l.= 20 À medida que o nº de graus de liberdade aumenta,, a distribuição torna-se mais simétrica. Slide 53 Ana M. Abreu - 2006/07 Características da distribuição Qui-Quadrado 2. Os valores da distribuição Qui-quadrado podem ser positivos ou nulos, mas não podem ser negativos. 3. A distribuição Qui-quadrado é diferente consoante o nº de graus de liberdade, os quais se escrevem g.l.= n – 1. À medida que o nº de g.l. aumenta, a distribuição aproxima-se da distribuição Normal.