aula4

•

UFPB

Nelson Filho

13.02.2015

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística Vital

15 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Distribuições de Probabilidade
Prof. Maria Lídia Coco Terra
Departamento de Estatística
Universidade Federal da Paraíba - UFPB
João Pessoa, 23 de novembro de 2011
Distribuições de Probabilidade
Definição: Definimos como uma variável aleatória X uma característica
que pode assumir valores definidos em um conjunto de n valores:
X = {x1, x2, . . . , xn}
A relação
xi −→ f (xi ) ou P(X = xi )
define uma correspondência entre todos os valores que a variável
aleatória pode assumir, xi , e suas respectivas probabilidades de
ocorrência, f (xi ) ou P(X = xi ). Esta relação é o que chamamos em
estatística de função de probabilidade da variável aleatória X .
Analogamente ao estudo da estatística descritiva, as variáveis aleatórias
também podem ser divididas em dois tipos: discretas e contínuas.
Distribuições de Probabilidade
• Toda distribuição de probabilidade deve satisfazer os seguintes
requisitos:
1
n∑
i=1
P(X = xi ) = 1;
2 0 ≤ P(X = xi ) ≤ 1, para todo valor individual de xi .
• Uma distribuição de probabilidade pode ser um uma tabela ou
uma fórmula que dá a probabilidade para cada valor da
variável aleatória.
Exemplo
• A tabela abaixo descreve uma distribuição de probabilidade?
xi P(X = xi )
0 0, 2
1 0, 5
2 0, 4
3 0, 3
Todas as probabilidades estão entre 0 e 1, mas
n∑
i=1
P(X = xi ) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)
= 0, 2+ 0, 5+ 0, 4+ 0, 3
= 1, 4 6= 1
Logo, a tabela não descreve uma distribuição de probabilidade.
Exemplo
• A tabela abaixo descreve uma distribuição de probabilidade?
xi P(X = xi )
0 0
1 0, 34
2 0, 66
Todas as probabilidades estão entre 0 e 1, e
n∑
i=1
P(X = xi ) = P(X = 0) + P(X = 1) + P(X = 2)
= 0+ 0, 34+ 0, 66
= 1
Logo, a tabela descreve uma distribuição de probabilidade.
Distribuições de Probabilidade
• Tal como a distribuição de frequências, podemos descrever
uma distribuição de probabilidade usando uma medida de
tendência central e uma medida de dispersão.
• O valor médio de uma variável aleatória é conhecido como
média populacional, a dispersão dos valores relativos a esta
média é a variância populacional, cuja raíz quadrada é o
desvio padrão populacional. Calculados por:
µ =
n∑
i=1
xi · P(X = xi )
σ2 =
n∑
i=1
(xi − µ)2 · P(X = xi )
σ =
√
σ2
Exemplo
• A tabela abaixo descreve uma distribuição de probabilidade.
xi P(X = xi )
0 0
1 0, 34
2 0, 66
A média populacional é:
µ =
n∑
i=1
xi · P(X = xi )
= 0 · P(X = 0) + 1 · P(X = 1) + 2 · P(X = 2)
= 0 · 0+ 1 · 0, 34+ 2 · 0, 66
= 1, 67
Exemplo
A variância populacional é:
σ2 =
n∑
i=1
(xi − µ)2 · P(X = xi )
= (0− 1, 67)2 · P(X = 0) + (1− 1, 67)2 · P(X = 1)
+ (2− 1, 67)2 · P(X = 2)
= 1, 86+ 0, 14+ 0, 07
= 2, 07
O desvio padrão populacional é:
σ =
√
2, 07 = 1, 43.
Modelo Probabilístico Discreto
Construção da distribuição de probabilidade
• Suponha que o número máximo de leitos que uma unidade de
terapia intensiva comporte seja 1. Definindo a variável
aleatória X como “número de óbitos (na UTI)”, e que a
probabilidade de óbito de um paciente, ao dar entrada na UTI,
seja de 25% (risco de morte). Os valores que a variável
aleatória pode assumir, num certo período de tempo, são:
X = {0, 1}
• E as probabilidades são:
X P(X = x)
0 0, 75
1 0, 25
Soma 1
Construção da função de probabilidade
• Se dois pacientes ingressarem na UTI (n = 2),
• Sendo p(vi ) é a probabilidade do paciente i sobreviver e p(oi ) é a
probabilidade do paciente i morrer, tem-se
X = { 0 , 1 , 2 }

P(X = 0) → p(v1)p(v2) = 0, 75 · 0, 75 = 0, 5625
P(X = 1) →
{
p(v1)p(o2) = 0, 75 · 0, 25 = 0, 1875
p(o1)p(v2) = 0, 25 · 0, 75 = 0, 1875 ⇒ 0, 3750
P(X = 2) → p(o1)p(o2) = 0, 25 · 0, 25 = 0, 0625
• O quadro com as funções de probabilidade é dado a seguir:
X 0 1 2 Soma
P(X = x) 0,5625 0,3750 0,0625 1
Observações Importantes:
• A construção para um número maior de casos (n) pode ser
realizado.
• Porém, é uma tarefa repetitiva e bastante trabalhosa.
• De modo a sistematizar o cálculo de probabilidades de um
determinado número de ocorrências em n casos, considera-se a
Distribuição Binomial.
Distribuição Binomial
• Considere uma variável aleatória definida em termos binários, ou
seja, com dois valores possíveis de ocorrer em n experimentos, ou n
ensaios, ou n tentativas, n casos, etc.
• Denotando a probabilidade de ocorrência(ou sucesso) de X por p e
a probabilidade de não-ocorrência de X por q, tem-se p + q = 1.
Note que q = 1− p.
• Com base nessa informação, a probabilidade de x ocorrências da
variável aleatória X em n casos é dada por:
P(X = x) =
(
n
x
)
pxqn−x
=
n!
x!(n − x)!p
x(1− p)n−x
Distribuição Binomial
• Através de uma distribuição de probabilidade é possível calcular
valores para o que chamamos em estatística de parâmetro, ou seja,
um valor conceitualmente conhecido na população com base nos
valores da amostra. Dessa forma, para o modelo binomial:
B Média = Valor Esperado = E [X ] = µ = n · p
B Variância = σ2 = n · p · q = n · p · (1− p)
B Desvio Padrão = σ = √n · p · q
• Note que o formato da distribuição binomial depende de p e de n
exclusivamente.
Exemplo
Suponha que a probabilidade de um indivíduo do sexo masculino(M),
com mais de 60 anos, sedentário(S) e fumante(F), desenvolver uma
doença cardiovascular nos próximos 8 anos seja de 40%. A partir de um
estudo controle com 10 indivíduos com essas características, qual a
probabilidade de que nenhum desses indivíduos sofra doenças
cardiovasculares no período determinado?
Exemplo
• Vamos definir a variável aleatória X como “número de indivíduos
que desenvolveu uma doença cardiovascular”.
Resposta: Note que n = 10. Além disso, a probabilidade de sucesso, ou
seja de um indivíduo desenvolver uma doença cardiovascular é
p = 0, 4
Logo, a probabilidade de nenhum caso de DCV resulta em
P(X = 0) =
(
10
0
)
(0, 4)0(0, 6)10
=
10!
0!(10− 0)!0, 4
00, 610
= 0, 0060 = 0, 60%
Exemplo
Qual a probabilidade de menos de três indivíduos da amostra terem DCV?
P(X < 3) = P(X = {0, 1, 2}) = P(X = 0) + P(X = 1) + P(X = 2)
P(X = 0) =
(
10
0
)
(0, 4)0(0, 6)10 = 0, 006 = 0, 6%
P(X = 1) =
(
10
1
)
(0, 4)1(0, 6)9 = 0, 040 = 4%
P(X = 2) =
(
10
2
)
(0, 4)2(0, 6)8 = 0, 121 = 12, 1%
P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)
= 0, 006+ 0, 04+ 0, 121 = 0, 167 = 16, 70%
Exemplo
Qual a probabilidade de pelo menos três indivíduos da amostra terem
DCV?
P(X ≥ 3) = P(X = {3, 4, 5, 6, 7, 8, 9, 10})
= P(X = 3) + P(X = 4) + · · ·+ P(X = 10)
Contudo, como sabemos que
n∑
i=1
P(X = xi ) = 1, podemos utilizar este
resultado para simplificar os cálculos. Ou seja:
P(X ≥ 3) = 1− P(X < 3) = 1− 0, 167 = 0, 833
Exemplo
Qual é a média (ou valor esperado) de casos de DCV?
µ = n · p = 10 · 0, 4 = 4 casos
Qual é o desvio padrão do número de casos de DCV?
σ =
√
n · p · q =
√
10 · 0, 4 · 0, 6 = 1, 55 ≈ 2casos.
Modelo Probabilístico Contínuo
Modelos contínuos de probabilidade
Variável Aleatória Contínua:
• Assume valores num intervalo de números reais.
• Não é possível listar, individualmente, todos os possíveis valores de
uma variável aleatória contínua.
• Dessa forma, associamos probabilidades a intervalos de valores da
variável.
• Ou seja, a probabilidade será calculada como uma área de interesse
no gráfico da distribuição.
Distribuição Normal
• Observemos por exemplo, o peso em Kg, de 1500 pessoas adultas
selecionadas ao acaso em uma população.
• O histograma do conjunto de dados é dado a seguir:
Distribuição Normal
A análise do histograma mostra que:
• a distribuição dos valores é aproximadamente simétrica em torno de
70 kg;
• a maioria dos valores (88%) encontra-se no intervalo(55; 85);
• existe uma pequena proporção de valores abaixo de 48 kg (1, 2%) e
acima de 92 kg (1%).
Distribuição Normal
• Definindo a variável aleatória X : peso, em kg, de uma pessoa
adulta escolhida ao acaso da população.
• É natural então considerar a distribuição dos valores da variável
aleatória X , isto é, qual a distribuição de probabilidades de X?
• A curva contínua nesse gráfico se chama curva Normal.
Distribuição Normal
A distribuição normal é uma das mais importantes distribuições
contínuas de probabilidade, pois:
• Muitos fenômenos aleatórios comportam-se de forma próxima a essa
distribuição.
Exemplos:
1 Altura;
2 Pressão sanguínea;
3 Peso.
• Pode ser utilizada para calcular, de forma aproximada,
probabilidades para outras distribuições, como por exemplo, para a
distribuição Binomial.
Função Densidade da Normal
• A área na figura é calculada a partir da chamada função densidade
da distribuição normal.
• A expressão da função densidade da distribuição normal é dada por
f (x) =
1√
2piσ
exp
{
− (x − µ)
2
2σ2
}
• µ é a média e pode assumir valores em um campo de variação
amplo (−∞ < µ <∞)
• σ2 é a variância, e só assume valores positivos (σ2 > 0)
• Apesar da complexidade da expressão, a utilizaremos para cálculo de
probabilidades de uma forma fácil, através do uso de uma tabela de
cálculo de probabilidades, com base na chamada distribuição
normal padrão.
Gráfico da distribuição normal
Características da Distribuição Normal
• Assintótica em relação ao eixo das abscissas;
• Simétrica em torno do seu valor central, ou seja: valores de média,
mediana e moda são iguais.
• Temos uma notação apropriada para representar uma variável
aleatória com distribuição normal. Ou seja, quando X for uma
variável aleatória que possuir distribuição normal, temos que
X ∼ N (µ, σ2)
• Valores concentrados em torno da tendência central. No gráfico, as
áreas (probabilidades) para um, dois e três desvios padrões em torno
da média são, respectivamente:
Parâmetros da Distribuição Normal
• A distribuição normal depende dos parâmetros µ e σ2
• Curvas normais com mesma variância, porém com médias diferentes
(µ2 > µ1).
Influência de σ2 na curva da Distribuição Normal
• Curvas normais com mesma média, porém com variâncias diferentes
(σ22 > σ
2
1).
Cálculo de probabilidades
P(a < X < b)
Área sob a curva e acima do eixo horizontal(X ) entre a e b
Distribuição Normal Padronizada
• Para calcular probabilidades associadas à distribuição normal
apresentadas anteriormente, costuma-se transformar a variável
original do problema X , em unidades padronizadas. Ou seja, é
definida uma variável Z , onde
Z =
X − µ
σ
• Com a transformação, temos um modelo bem simples:
Z ∼ N (0, 1), chamada distribuição normal padrão.
• Com isso, fica fácil determinar as probabilidades associadas à uma
determinada variável aleatória, pois existe uma tabela específica de
cálculo de probabilidades com base na distribuição normal
padronizada.
Uso da tabela da distribuição normal padrão
• Denotamos: A(z) = P(Z ≤ z), para todo z ≥ 0.
Exemplo
Calcular P(Z ≤ 0, 32)
Logo, P(Z ≤ 0, 32) = A(0, 32) = 0, 6255
Exemplo
Exemplo
Exemplo
Calcular P(0 < Z ≤ 1, 71)
Regra: P(x < Z < y) = A(y)− A(x)
Logo, P(0 < Z ≤ 1, 71) = A(1, 71)− A(0) = 0, 9564− 0, 5 = 0, 4564
Exemplo
Calcular P(1, 32 < Z ≤ 1, 79)
Regra: P(x < Z < y) = A(y)− A(x)
Logo,
P(1, 32 < Z ≤ 1, 79) = A(1, 79)−A(1, 32) = 0, 9633− 0, 9066 = 0, 0567
Exemplo
Calcular P(Z ≥ 1, 5)
Logo,
P(Z ≥ 1, 5) = 1− P(Z < 1, 5) = 1− A(1, 5) = 1− 0, 9332 = 0, 0668
Exemplo
Calcular P(Z ≤ −1, 3)
Logo, P(Z ≤ −1, 3) = A(−1, 3) = 0, 0968
Exemplo
Calcular P(−1, 5 < Z ≤ 1, 5)
Regra: P(x < Z < y) = A(y)− A(x)
Logo,
P(−1, 5 < Z ≤ 1, 5) = A(1, 5)− A(−1, 5) = 0, 9332− 0, 0668 = 0, 8664
Exemplo
Calcular P(−1, 32 < Z ≤ 0)
Regra: P(x < Z < y) = A(y)− A(x)
Logo, P(−1, 32 < Z ≤ 0) = A(0)−A(−1, 32) = 0, 5− 0, 0934 = 0, 4066
Exemplo
Calcular P(−2, 30 < Z ≤ −1, 49)
Regra: P(x < Z < y) = A(y)− A(x)
Logo, P(−2, 30 < Z ≤ −1, 49) = A(−1, 49)− A(−2, 30) =
0, 0681− 0, 0107 = 0, 0574
Exemplo
Calcular P(−1, 0 < Z ≤ 2, 0)
Regra: P(x < Z < y) = A(y)− A(x)
Logo,
P(−1, 0 < Z ≤ 2, 0) = A(2, 0)− A(−1, 0) = 0, 9772− 0, 1587 = 0, 8185
Exemplo
Como encontrar o valor da distribuição N (0, 1) tal que
P(Z ≤ z) = 0, 975?
Note que z é tal que A(z) = 0, 975. Pela tabela, z = 1, 96.
Exemplo
Como encontrar o valor da distribuição N (0, 1) tal que
P(0 < Z ≤ z) = 0, 4975?
Note que
P(0 < Z ≤ z) = 0, 4975 =⇒ A(z)− A(0) = 0, 4975 =⇒ A(z) = 0, 9975.
Pela tabela, z = 2, 81.
Exemplo
Como encontrar o valor da distribuição N (0, 1) tal que P(Z ≥ z) = 0, 3?
Note que
P(Z ≥ z) = 0, 3 =⇒ 1− P(Z < z) = 0, 3 =⇒ P(Z < z) = A(z) = 0, 7.
Pela tabela, z = 0, 53.
Exemplo
Como encontrar o valor da distribuição N (0, 1) tal que
P(Z ≥ z) = 0, 975?
Note que
P(Z ≥ z) = 0, 975 =⇒ 1− P(Z < z) = 0, 975 =⇒ A(z) = 0, 025. Pela
tabela, z = −1, 96.
Exemplo
Como encontrar o valor da distribuição N (0, 1) tal que
P(Z ≤ z) = 0, 10?
Note que pela tabela, z = −1, 28.
Exemplo
Seja X ∼ N (10; 64) (µ = 10, σ2 = 64 e σ = 8)
Calcular P(6 ≤ X ≤ 12)
• Note que P(6 ≤ X ≤ 12) = P ( 6−108 ≤ X−108 ≤ 12−108 ) =
P (−0, 5 < Z < 0, 25)
• Logo, P (−0, 5 < Z < 0, 25) = A(0, 25)− A(−0, 5) =
0, 5987− 0, 3085 = 0, 2902.
Exemplo
• Suponha que o comprimento médio de recém-nascidos do sexo
feminino não-portadores de anomalias seja 48, 54 cm. Além disso,
sabemos que o desvio padrão da variável é igual a 2, 5 cm.
• Qual é a probabilidade de haver na população indivíduos com
comprimento maior ou igual à 48, 54?
Resposta: Queremos então obter P(X ≥ 48, 54). Logo:
P(X ≥ 48, 54) = P
(
X − µ
σ
≥ 48, 54− 48, 54
2, 5
)
= P(Z ≥ 0).
A tabela fornecida calcula probabilidades da forma P(X ≤ x) ou
P(X < x). Por isso,
P(Z ≥ 0) = 1− P(Z < 0) = 1− 1
2
=
1
2
Exemplo
• Qual é a probabilidade do comprimento ser menor que 44, 79 cm?
Resposta:
P(X < 44, 79) = P
(
X − µ
σ
<
44, 79− 48, 54
2, 5
)
= A(−1, 5) = 0, 0668
Exemplo
• Qual é a probabilidade do comprimento ser superior à 47, 29 cm?
Resposta:
P(X > 47, 29) = P
(
X − µ
σ
>
47, 29− 48, 54
2, 5
)
= P(Z > −0, 5)
Novamente, é importante lembrar que a tabela fornecida calcula
probabilidades da forma P(X ≤ x) ou P(X < x). Por isso,
P(Z > −0, 5) = 1− P(Z < −0, 5) = 1− 0, 3085 = 0, 6915
Exemplo
• Qual é a probabilidade de indivíduos terem comprimento entre
46, 04 cm e 51, 04 cm?
Resposta:
P(46, 04 ≤ X ≤ 51, 04) =
P
(
46, 04− 48, 54
2, 5
≤ X − µ
σ
≤ 51, 04− 48, 54
2, 5
)
=
P(−1 ≤ Z ≤ 1)
• No caso da distribuição normal padrão, temos uma propriedade
especial:
P(a ≤ Z ≤ b) = P(Z ≤ b)− P(Z ≤ a)
• Logo,
P(−1 ≤ Z ≤ 1) = P(Z ≤ 1)− P(Z ≤ −1)
= 0, 8643− 0, 1587 = 0, 7056
Exemplo
• Qual é o limite inferior nas crianças com maior comprimento, cujo
percentual é de 5% na população?
Resposta: Neste tipo de situação, faremos o caminho inverso. Ao
invés de encontrar a probabilidade, precisamos encontrar o menor
valor dentre os maiores comprimentos. Sabemos que as maiores
crianças correspondem à 5%. Ou seja, precisamos então encontrar o
valor de x tal que
P
(
Z ≤ x − 48, 54
2, 5
)
= 0, 95
Logo, pesquisando na tabela, vemos então que
x − 48, 54
2, 5
= 1, 65 ∴ x = 1, 65× 2, 5+ 48, 54 = 52, 67cm
Ou seja, 5% das crianças nasce com comprimento superior à 52, 67.
Neste exercício o valor de x é chamado de percentil 95.