Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuições de Probabilidade Prof. Maria Lídia Coco Terra Departamento de Estatística Universidade Federal da Paraíba - UFPB João Pessoa, 23 de novembro de 2011 Distribuições de Probabilidade Definição: Definimos como uma variável aleatória X uma característica que pode assumir valores definidos em um conjunto de n valores: X = {x1, x2, . . . , xn} A relação xi −→ f (xi ) ou P(X = xi ) define uma correspondência entre todos os valores que a variável aleatória pode assumir, xi , e suas respectivas probabilidades de ocorrência, f (xi ) ou P(X = xi ). Esta relação é o que chamamos em estatística de função de probabilidade da variável aleatória X . Analogamente ao estudo da estatística descritiva, as variáveis aleatórias também podem ser divididas em dois tipos: discretas e contínuas. Distribuições de Probabilidade • Toda distribuição de probabilidade deve satisfazer os seguintes requisitos: 1 n∑ i=1 P(X = xi ) = 1; 2 0 ≤ P(X = xi ) ≤ 1, para todo valor individual de xi . • Uma distribuição de probabilidade pode ser um uma tabela ou uma fórmula que dá a probabilidade para cada valor da variável aleatória. Exemplo • A tabela abaixo descreve uma distribuição de probabilidade? xi P(X = xi ) 0 0, 2 1 0, 5 2 0, 4 3 0, 3 Todas as probabilidades estão entre 0 e 1, mas n∑ i=1 P(X = xi ) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 0, 2+ 0, 5+ 0, 4+ 0, 3 = 1, 4 6= 1 Logo, a tabela não descreve uma distribuição de probabilidade. Exemplo • A tabela abaixo descreve uma distribuição de probabilidade? xi P(X = xi ) 0 0 1 0, 34 2 0, 66 Todas as probabilidades estão entre 0 e 1, e n∑ i=1 P(X = xi ) = P(X = 0) + P(X = 1) + P(X = 2) = 0+ 0, 34+ 0, 66 = 1 Logo, a tabela descreve uma distribuição de probabilidade. Distribuições de Probabilidade • Tal como a distribuição de frequências, podemos descrever uma distribuição de probabilidade usando uma medida de tendência central e uma medida de dispersão. • O valor médio de uma variável aleatória é conhecido como média populacional, a dispersão dos valores relativos a esta média é a variância populacional, cuja raíz quadrada é o desvio padrão populacional. Calculados por: µ = n∑ i=1 xi · P(X = xi ) σ2 = n∑ i=1 (xi − µ)2 · P(X = xi ) σ = √ σ2 Exemplo • A tabela abaixo descreve uma distribuição de probabilidade. xi P(X = xi ) 0 0 1 0, 34 2 0, 66 A média populacional é: µ = n∑ i=1 xi · P(X = xi ) = 0 · P(X = 0) + 1 · P(X = 1) + 2 · P(X = 2) = 0 · 0+ 1 · 0, 34+ 2 · 0, 66 = 1, 67 Exemplo A variância populacional é: σ2 = n∑ i=1 (xi − µ)2 · P(X = xi ) = (0− 1, 67)2 · P(X = 0) + (1− 1, 67)2 · P(X = 1) + (2− 1, 67)2 · P(X = 2) = 1, 86+ 0, 14+ 0, 07 = 2, 07 O desvio padrão populacional é: σ = √ 2, 07 = 1, 43. Modelo Probabilístico Discreto Construção da distribuição de probabilidade • Suponha que o número máximo de leitos que uma unidade de terapia intensiva comporte seja 1. Definindo a variável aleatória X como “número de óbitos (na UTI)”, e que a probabilidade de óbito de um paciente, ao dar entrada na UTI, seja de 25% (risco de morte). Os valores que a variável aleatória pode assumir, num certo período de tempo, são: X = {0, 1} • E as probabilidades são: X P(X = x) 0 0, 75 1 0, 25 Soma 1 Construção da função de probabilidade • Se dois pacientes ingressarem na UTI (n = 2), • Sendo p(vi ) é a probabilidade do paciente i sobreviver e p(oi ) é a probabilidade do paciente i morrer, tem-se X = { 0 , 1 , 2 } P(X = 0) → p(v1)p(v2) = 0, 75 · 0, 75 = 0, 5625 P(X = 1) → { p(v1)p(o2) = 0, 75 · 0, 25 = 0, 1875 p(o1)p(v2) = 0, 25 · 0, 75 = 0, 1875 ⇒ 0, 3750 P(X = 2) → p(o1)p(o2) = 0, 25 · 0, 25 = 0, 0625 • O quadro com as funções de probabilidade é dado a seguir: X 0 1 2 Soma P(X = x) 0,5625 0,3750 0,0625 1 Observações Importantes: • A construção para um número maior de casos (n) pode ser realizado. • Porém, é uma tarefa repetitiva e bastante trabalhosa. • De modo a sistematizar o cálculo de probabilidades de um determinado número de ocorrências em n casos, considera-se a Distribuição Binomial. Distribuição Binomial • Considere uma variável aleatória definida em termos binários, ou seja, com dois valores possíveis de ocorrer em n experimentos, ou n ensaios, ou n tentativas, n casos, etc. • Denotando a probabilidade de ocorrência(ou sucesso) de X por p e a probabilidade de não-ocorrência de X por q, tem-se p + q = 1. Note que q = 1− p. • Com base nessa informação, a probabilidade de x ocorrências da variável aleatória X em n casos é dada por: P(X = x) = ( n x ) pxqn−x = n! x!(n − x)!p x(1− p)n−x Distribuição Binomial • Através de uma distribuição de probabilidade é possível calcular valores para o que chamamos em estatística de parâmetro, ou seja, um valor conceitualmente conhecido na população com base nos valores da amostra. Dessa forma, para o modelo binomial: B Média = Valor Esperado = E [X ] = µ = n · p B Variância = σ2 = n · p · q = n · p · (1− p) B Desvio Padrão = σ = √n · p · q • Note que o formato da distribuição binomial depende de p e de n exclusivamente. Exemplo Suponha que a probabilidade de um indivíduo do sexo masculino(M), com mais de 60 anos, sedentário(S) e fumante(F), desenvolver uma doença cardiovascular nos próximos 8 anos seja de 40%. A partir de um estudo controle com 10 indivíduos com essas características, qual a probabilidade de que nenhum desses indivíduos sofra doenças cardiovasculares no período determinado? Exemplo • Vamos definir a variável aleatória X como “número de indivíduos que desenvolveu uma doença cardiovascular”. Resposta: Note que n = 10. Além disso, a probabilidade de sucesso, ou seja de um indivíduo desenvolver uma doença cardiovascular é p = 0, 4 Logo, a probabilidade de nenhum caso de DCV resulta em P(X = 0) = ( 10 0 ) (0, 4)0(0, 6)10 = 10! 0!(10− 0)!0, 4 00, 610 = 0, 0060 = 0, 60% Exemplo Qual a probabilidade de menos de três indivíduos da amostra terem DCV? P(X < 3) = P(X = {0, 1, 2}) = P(X = 0) + P(X = 1) + P(X = 2) P(X = 0) = ( 10 0 ) (0, 4)0(0, 6)10 = 0, 006 = 0, 6% P(X = 1) = ( 10 1 ) (0, 4)1(0, 6)9 = 0, 040 = 4% P(X = 2) = ( 10 2 ) (0, 4)2(0, 6)8 = 0, 121 = 12, 1% P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2) = 0, 006+ 0, 04+ 0, 121 = 0, 167 = 16, 70% Exemplo Qual a probabilidade de pelo menos três indivíduos da amostra terem DCV? P(X ≥ 3) = P(X = {3, 4, 5, 6, 7, 8, 9, 10}) = P(X = 3) + P(X = 4) + · · ·+ P(X = 10) Contudo, como sabemos que n∑ i=1 P(X = xi ) = 1, podemos utilizar este resultado para simplificar os cálculos. Ou seja: P(X ≥ 3) = 1− P(X < 3) = 1− 0, 167 = 0, 833 Exemplo Qual é a média (ou valor esperado) de casos de DCV? µ = n · p = 10 · 0, 4 = 4 casos Qual é o desvio padrão do número de casos de DCV? σ = √ n · p · q = √ 10 · 0, 4 · 0, 6 = 1, 55 ≈ 2casos. Modelo Probabilístico Contínuo Modelos contínuos de probabilidade Variável Aleatória Contínua: • Assume valores num intervalo de números reais. • Não é possível listar, individualmente, todos os possíveis valores de uma variável aleatória contínua. • Dessa forma, associamos probabilidades a intervalos de valores da variável. • Ou seja, a probabilidade será calculada como uma área de interesse no gráfico da distribuição. Distribuição Normal • Observemos por exemplo, o peso em Kg, de 1500 pessoas adultas selecionadas ao acaso em uma população. • O histograma do conjunto de dados é dado a seguir: Distribuição Normal A análise do histograma mostra que: • a distribuição dos valores é aproximadamente simétrica em torno de 70 kg; • a maioria dos valores (88%) encontra-se no intervalo(55; 85); • existe uma pequena proporção de valores abaixo de 48 kg (1, 2%) e acima de 92 kg (1%). Distribuição Normal • Definindo a variável aleatória X : peso, em kg, de uma pessoa adulta escolhida ao acaso da população. • É natural então considerar a distribuição dos valores da variável aleatória X , isto é, qual a distribuição de probabilidades de X? • A curva contínua nesse gráfico se chama curva Normal. Distribuição Normal A distribuição normal é uma das mais importantes distribuições contínuas de probabilidade, pois: • Muitos fenômenos aleatórios comportam-se de forma próxima a essa distribuição. Exemplos: 1 Altura; 2 Pressão sanguínea; 3 Peso. • Pode ser utilizada para calcular, de forma aproximada, probabilidades para outras distribuições, como por exemplo, para a distribuição Binomial. Função Densidade da Normal • A área na figura é calculada a partir da chamada função densidade da distribuição normal. • A expressão da função densidade da distribuição normal é dada por f (x) = 1√ 2piσ exp { − (x − µ) 2 2σ2 } • µ é a média e pode assumir valores em um campo de variação amplo (−∞ < µ <∞) • σ2 é a variância, e só assume valores positivos (σ2 > 0) • Apesar da complexidade da expressão, a utilizaremos para cálculo de probabilidades de uma forma fácil, através do uso de uma tabela de cálculo de probabilidades, com base na chamada distribuição normal padrão. Gráfico da distribuição normal Características da Distribuição Normal • Assintótica em relação ao eixo das abscissas; • Simétrica em torno do seu valor central, ou seja: valores de média, mediana e moda são iguais. • Temos uma notação apropriada para representar uma variável aleatória com distribuição normal. Ou seja, quando X for uma variável aleatória que possuir distribuição normal, temos que X ∼ N (µ, σ2) • Valores concentrados em torno da tendência central. No gráfico, as áreas (probabilidades) para um, dois e três desvios padrões em torno da média são, respectivamente: Parâmetros da Distribuição Normal • A distribuição normal depende dos parâmetros µ e σ2 • Curvas normais com mesma variância, porém com médias diferentes (µ2 > µ1). Influência de σ2 na curva da Distribuição Normal • Curvas normais com mesma média, porém com variâncias diferentes (σ22 > σ 2 1). Cálculo de probabilidades P(a < X < b) Área sob a curva e acima do eixo horizontal(X ) entre a e b Distribuição Normal Padronizada • Para calcular probabilidades associadas à distribuição normal apresentadas anteriormente, costuma-se transformar a variável original do problema X , em unidades padronizadas. Ou seja, é definida uma variável Z , onde Z = X − µ σ • Com a transformação, temos um modelo bem simples: Z ∼ N (0, 1), chamada distribuição normal padrão. • Com isso, fica fácil determinar as probabilidades associadas à uma determinada variável aleatória, pois existe uma tabela específica de cálculo de probabilidades com base na distribuição normal padronizada. Uso da tabela da distribuição normal padrão • Denotamos: A(z) = P(Z ≤ z), para todo z ≥ 0. Exemplo Calcular P(Z ≤ 0, 32) Logo, P(Z ≤ 0, 32) = A(0, 32) = 0, 6255 Exemplo Exemplo Exemplo Calcular P(0 < Z ≤ 1, 71) Regra: P(x < Z < y) = A(y)− A(x) Logo, P(0 < Z ≤ 1, 71) = A(1, 71)− A(0) = 0, 9564− 0, 5 = 0, 4564 Exemplo Calcular P(1, 32 < Z ≤ 1, 79) Regra: P(x < Z < y) = A(y)− A(x) Logo, P(1, 32 < Z ≤ 1, 79) = A(1, 79)−A(1, 32) = 0, 9633− 0, 9066 = 0, 0567 Exemplo Calcular P(Z ≥ 1, 5) Logo, P(Z ≥ 1, 5) = 1− P(Z < 1, 5) = 1− A(1, 5) = 1− 0, 9332 = 0, 0668 Exemplo Calcular P(Z ≤ −1, 3) Logo, P(Z ≤ −1, 3) = A(−1, 3) = 0, 0968 Exemplo Calcular P(−1, 5 < Z ≤ 1, 5) Regra: P(x < Z < y) = A(y)− A(x) Logo, P(−1, 5 < Z ≤ 1, 5) = A(1, 5)− A(−1, 5) = 0, 9332− 0, 0668 = 0, 8664 Exemplo Calcular P(−1, 32 < Z ≤ 0) Regra: P(x < Z < y) = A(y)− A(x) Logo, P(−1, 32 < Z ≤ 0) = A(0)−A(−1, 32) = 0, 5− 0, 0934 = 0, 4066 Exemplo Calcular P(−2, 30 < Z ≤ −1, 49) Regra: P(x < Z < y) = A(y)− A(x) Logo, P(−2, 30 < Z ≤ −1, 49) = A(−1, 49)− A(−2, 30) = 0, 0681− 0, 0107 = 0, 0574 Exemplo Calcular P(−1, 0 < Z ≤ 2, 0) Regra: P(x < Z < y) = A(y)− A(x) Logo, P(−1, 0 < Z ≤ 2, 0) = A(2, 0)− A(−1, 0) = 0, 9772− 0, 1587 = 0, 8185 Exemplo Como encontrar o valor da distribuição N (0, 1) tal que P(Z ≤ z) = 0, 975? Note que z é tal que A(z) = 0, 975. Pela tabela, z = 1, 96. Exemplo Como encontrar o valor da distribuição N (0, 1) tal que P(0 < Z ≤ z) = 0, 4975? Note que P(0 < Z ≤ z) = 0, 4975 =⇒ A(z)− A(0) = 0, 4975 =⇒ A(z) = 0, 9975. Pela tabela, z = 2, 81. Exemplo Como encontrar o valor da distribuição N (0, 1) tal que P(Z ≥ z) = 0, 3? Note que P(Z ≥ z) = 0, 3 =⇒ 1− P(Z < z) = 0, 3 =⇒ P(Z < z) = A(z) = 0, 7. Pela tabela, z = 0, 53. Exemplo Como encontrar o valor da distribuição N (0, 1) tal que P(Z ≥ z) = 0, 975? Note que P(Z ≥ z) = 0, 975 =⇒ 1− P(Z < z) = 0, 975 =⇒ A(z) = 0, 025. Pela tabela, z = −1, 96. Exemplo Como encontrar o valor da distribuição N (0, 1) tal que P(Z ≤ z) = 0, 10? Note que pela tabela, z = −1, 28. Exemplo Seja X ∼ N (10; 64) (µ = 10, σ2 = 64 e σ = 8) Calcular P(6 ≤ X ≤ 12) • Note que P(6 ≤ X ≤ 12) = P ( 6−108 ≤ X−108 ≤ 12−108 ) = P (−0, 5 < Z < 0, 25) • Logo, P (−0, 5 < Z < 0, 25) = A(0, 25)− A(−0, 5) = 0, 5987− 0, 3085 = 0, 2902. Exemplo • Suponha que o comprimento médio de recém-nascidos do sexo feminino não-portadores de anomalias seja 48, 54 cm. Além disso, sabemos que o desvio padrão da variável é igual a 2, 5 cm. • Qual é a probabilidade de haver na população indivíduos com comprimento maior ou igual à 48, 54? Resposta: Queremos então obter P(X ≥ 48, 54). Logo: P(X ≥ 48, 54) = P ( X − µ σ ≥ 48, 54− 48, 54 2, 5 ) = P(Z ≥ 0). A tabela fornecida calcula probabilidades da forma P(X ≤ x) ou P(X < x). Por isso, P(Z ≥ 0) = 1− P(Z < 0) = 1− 1 2 = 1 2 Exemplo • Qual é a probabilidade do comprimento ser menor que 44, 79 cm? Resposta: P(X < 44, 79) = P ( X − µ σ < 44, 79− 48, 54 2, 5 ) = A(−1, 5) = 0, 0668 Exemplo • Qual é a probabilidade do comprimento ser superior à 47, 29 cm? Resposta: P(X > 47, 29) = P ( X − µ σ > 47, 29− 48, 54 2, 5 ) = P(Z > −0, 5) Novamente, é importante lembrar que a tabela fornecida calcula probabilidades da forma P(X ≤ x) ou P(X < x). Por isso, P(Z > −0, 5) = 1− P(Z < −0, 5) = 1− 0, 3085 = 0, 6915 Exemplo • Qual é a probabilidade de indivíduos terem comprimento entre 46, 04 cm e 51, 04 cm? Resposta: P(46, 04 ≤ X ≤ 51, 04) = P ( 46, 04− 48, 54 2, 5 ≤ X − µ σ ≤ 51, 04− 48, 54 2, 5 ) = P(−1 ≤ Z ≤ 1) • No caso da distribuição normal padrão, temos uma propriedade especial: P(a ≤ Z ≤ b) = P(Z ≤ b)− P(Z ≤ a) • Logo, P(−1 ≤ Z ≤ 1) = P(Z ≤ 1)− P(Z ≤ −1) = 0, 8643− 0, 1587 = 0, 7056 Exemplo • Qual é o limite inferior nas crianças com maior comprimento, cujo percentual é de 5% na população? Resposta: Neste tipo de situação, faremos o caminho inverso. Ao invés de encontrar a probabilidade, precisamos encontrar o menor valor dentre os maiores comprimentos. Sabemos que as maiores crianças correspondem à 5%. Ou seja, precisamos então encontrar o valor de x tal que P ( Z ≤ x − 48, 54 2, 5 ) = 0, 95 Logo, pesquisando na tabela, vemos então que x − 48, 54 2, 5 = 1, 65 ∴ x = 1, 65× 2, 5+ 48, 54 = 52, 67cm Ou seja, 5% das crianças nasce com comprimento superior à 52, 67. Neste exercício o valor de x é chamado de percentil 95.
Compartilhar