Buscar

Distribuições Amostrais

Prévia do material em texto

MOQ-13 PROBABILIDADE 
E ESTATÍSTICA
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo
ProgramaPrograma do do cursocurso::
Regressão linear simples e correlação.
Aplicações de modelos de regressão linear.15 e 16
Prova14
Feriado (4/6)13
Testes não-paramétricos (associação, independência e de aderência).12
Testes de Hipóteses. Inferência baseada em 2 amostras (entre parâmetros de populações distintas).11
Propriedades dos estimadores. Intervalos de confiança (estimação por intervalo). Tamanho da amostra. Princípios de testes 
de hipóteses.10
Amostras aleatórias. Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student.9
Princípios de estatística. Estimadores e estimativas. Estimação pontual de parâmetros (Métodos dos momentos e da máxima
verossimilhança). Estatística Descritiva.8
Prova7
Variáveis aleatórias conjuntas, função distribuição conjunta e marginal. Independência estatística. Covariância e Coeficiente
de Correlação.6
Feriado (2/4)5
Principais distribuições de probabilidade contínuas (Exponencial negativa e Normal).4
Valor esperado e variância. Momentos de uma variável aleatória. Função geradora de momentos. Principais distribuições de 
probabilidade discretas (Bernoulli, Binomial e Poisson).3
Teorema da probabilidade total e teorema de Bayes. Variáveis aleatórias. Distribuições de probabilidade. Funções massa, 
densidade, e distribuição acumulada. Funções de variáveis aleatórias.2
Introdução à probabilidade (eventos, espaço amostral, axiomas, propriedades, probabilidade condicional e independência).1
ConteúdoSemanas
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo
DISTRIBUIÇÕES 
AMOSTRAIS
Estatísticas e suas distribuições:
�Quando estudamos estatística descritiva, observamos uma amostra única
(x1, x2, …,xn) de tamanho n da população para obter estimativas pontuais
dos momentos amostrais (x e s2).
�Se selecionarmos 2 amostras (cada uma de tamanho n) é de se esperar
que as observações da segunda amostra serão diferentes das observações
da primeira amostra. Por exemplo:
Amostra 1 (n=3 carros) →→→→ x1=30,7 x2=29,4 x3=31,1
Amostra 2 (n=3 carros) →→→→ x1=28,8 x2=30,0 x3=31,3
�Essas estimativas pontuais são utilizadas para fazer inferências em
relação ao valor esperado e ao desvio-padrão / variância da população, os
quais são desconhecidos.
Estatísticas e suas distribuições:
�Def: ESTATÍSTICA é qualquer quantidade cujo valor pode ser calculado a 
partir de uma amostra. Como há incerteza em relação a esses valores toda
estatística é uma variável aleatória (iid).
�Toda estatística, por ser uma variável aleatória, tem uma distribuição de 
probabilidade. A distribuição de probabilidade de uma estatística é 
chamada distribuição amostral.
�Def: Distribuição amostral é a distribuição de probabilidade de uma
estatística e descreve como o valor da estatística varia em função das 
amostras selecionadas.
�A distribuição amostral depende da distribuição de probabilidade da
população, do tamanho da amostra e do método de amostragem (neste
curso vamos estudar apenas a aleatória)
Distribuição da média amostral (x):
� Sejam x1, x2, …, xn n elementos de uma amostra aleatória de uma
população normal com parâmetros E[x] = µµµµ e Var[x] = σσσσ2. Então:
i. E[ x ] = µµµµ
ii. Var[ x ] = σσσσ2/n 
iii. To = x1 + … + xn , E[To] = nµµµµ, Var[To] = nσσσσ2
� De acordo com i a distribuição amostral de x é centrada no valor esperado
da população da qual a amostra foi selecionada, com ii que a distribuição
se torna mais concentrada em torno de µµµµ com o crescimento do tamanho
da amostra (n).
� Proposição: Seja x1, x2, …, xn uma amostra aleatória de uma população
normal com E[x] = µµµµ e Var[x] = σσσσ2, então, para qualquer n:








n
Nx
2
,~
σµ
( )2,~ σµ nnNTo
Distribuição da média amostral (x):
Z
n
x
~
σ
µ−
⇒
Z
n
nTo
~
σ
µ−
⇒
X
P(X)
A
B
Menor Menor 
tamanho tamanho 
de de 
amostraamostra
Maior Maior 
tamanho tamanho 
de de 
amostraamostra
µµµµµµµµ X
P(X)
A
B
Menor Menor 
tamanho tamanho 
de de 
amostraamostra
Maior Maior 
tamanho tamanho 
de de 
amostraamostra
µµµµµµµµ X
P(X)
A
B
Menor Menor 
tamanho tamanho 
de de 
amostraamostra
Maior Maior 
tamanho tamanho 
de de 
amostraamostra
µµµµµµµµ X
P(X)
A
B
Menor Menor 
tamanho tamanho 
de de 
amostraamostra
Maior Maior 
tamanho tamanho 
de de 
amostraamostra
µµµµµµµµ
� Sendo Y = a1X1 +…+ anXn
⇒⇒⇒⇒ E[Y] = a1E[X1] +…+ anE[Xn] = a1µµµµ1+ … + anµµµµn
Distribuição de uma combinação linear de v.as:
Se as variáveis aleatórias são independentes,
Var[a1X1 +…+ anXn] = a12Var[X1] + … + an2Var[Xn] 
�Distribuição da diferença entre médias de populações normais:
Sejam A e B duas populações normais com parâmetros µµµµA, σσσσA, µµµµB e σσσσB. 
Assim, ( )AAAA nNX 2,~ σµ ( )BBBB nNX 2,~ σµe








+−−
B
B
A
A
BABA
nn
NXX
22
,~
σσµµ ( ) ( ) Z
nn
XX
B
B
A
A
BABA
~
22 σσ
µµ
+
−−−
⇒
Distribuição amostral de estatísticas:
�Existem dois métodos para obter a distribuição amostral de uma estatística:
� Método 1: Utilizando regras da probabilidade
Ex:
� Método 2: Realização de um experimento de simulação
Usa-se um computador para obter k amostras aleatórias de tamanho n 
da distribuição designada. Para cada amostra calcula-se as estatísticas
de interesse e cria-se um histograma para avaliar a distribuição amostral
aproximada da estatística. 
Serviço A B C
Preço: x 40 45 50
p(x) 0,2 0,3 0,5
µµµµ = E[x] = 40 * 0,2 + 45 * 0,3 + 50 * 0,5 = 46,5
σσσσ2 = Var[x] = 0,2 * (40-46,5)2 +0,3 * (45-46,5)2 +0,5 * (50-46,5)2 =15,25
DISTRIBUIÇÃO DE PROBABILIDADE DA MÉDIA
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
40 42,5 45 47,5 50
VALORES
P
R
O
B
A
B
I
L
I
D
A
D
E
x1 x2 p(x1) p(x2) p(x1,x2) x s2
40 40 0,2 0,2 0,04 40 0
40 45 0,2 0,3 0,06 42,5 12,5
40 50 0,2 0,5 0,1 45 50
45 40 0,3 0,2 0,06 42,5 12,5
45 45 0,3 0,3 0,09 45 0
45 50 0,3 0,5 0,15 47,5 12,5
50 40 0,5 0,2 0,1 45 50
50 45 0,5 0,3 0,15 47,5 12,5
50 50 0,5 0,5 0,25 50 0
Distribuição amostral de estatísticas:
�Método 1: n=2
E[ x ] = 40 * 0,04 + 42,5 * 0,12 + ... + 50 * 0,25 = 46,5
Var[ x ] = 0,04 * (40-46,2)2 + ... + 0,25 * (50-46,5)2 = 7,625
E[ s2 ] = 0 * 0,38 + 12,5 * 0,42 + 50 * 0,20 = 15,25
Distribuição amostral de estatísticas:
�Método 1: n=4
E[ x ]=40*0,016+...+50*0,0625=46,5
Var[ x ] = 3,8125 (s2 / 4)
DISTRIBUIÇÃO DE PROBABILIDADE DA MÉDIA
0
0,05
0,1
0,15
0,2
0,25
40 41,25 42,5 43,75 45 46,25 47,5 48,75 50
VALORES
P
R
O
B
A
B
I
L
I
D
A
D
E
x1 x2 x3 x4 p(x1) p(x2) p(x3) p(x4) p(x1,x2,x3,x4) x s2
40 40 40 40 0,2 0,2 0,2 0,2 0,0016 40 0
40 40 40 45 0,2 0,2 0,2 0,3 0,0024 41,25 6,25
40 40 40 50 0,2 0,2 0,2 0,5 0,004 42,5 25
40 40 45 40 0,2 0,2 0,3 0,2 0,0024 41,25 6,25
40 40 45 45 0,2 0,2 0,3 0,3 0,0036 42,5 8,333
40 40 45 50 0,2 0,2 0,3 0,5 0,006 43,75 22,92
40 40 50 40 0,2 0,2 0,5 0,2 0,004 42,5 25
40 40 50 45 0,2 0,2 0,5 0,3 0,006 43,75 22,92
40 40 50 50 0,2 0,2 0,5 0,5 0,01 45 33,33
50 50 50 40 0,5 0,5 0,5 0,2 0,025 47,5 25
50 50 50 45 0,5 0,5 0,5 0,3 0,0375 48,75 6,25
50 50 50 50 0,5 0,5 0,5 0,5 0,0625 50 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
E[x] = 1 * 0,25 + 2 * 0,25 + 3 * 0,25 + 4 * 0,25 = 2,5
Var[x] = E[x-E(x)] = 0,25 * (1-2,5)2 +0,25 * (2-2,5)2
+ 0,25 * (3-2,5)2 + 0,25* (4-2,5)2 =1,12
0,25 0,25 0,25 0,25
,0
,1
,2
,3
1 2 3 4
Distribuição da média amostral (x):
� Distribuição de x para uma população não normal:
1a 2a Observação 
Obs 1 2 3 4 
1 1,1 1,2 1,3 1,4 
2 2,1 2,2 2,3 2,4 
3 3,1 3,2 3,3 3,4 
4 4,1 4,2 4,3 4,4 
 
 
1a 2a Observação 
Obs 1 2 3 4 
1 1,0 1,5 2,0 2,5 
2 1,5 2,0 2,5 3,0 
3 2,0 2,5 3,0 3,5 
4 2,5 3,0 3,5 4,0 
 
 
AMOSTRAS (1a,2a):
MÉDIAS DAS 
AMOSTRAS:
,0
,1
,2
,3
1,0 1,5 2,0 2,5 3,0 3,5 4,0

x
P(x)
5,2
16
0,45,10,11
=
+++
==
∑
=
L
N
x
N
i
i
xµ
( ) ( ) 79,0
16
5,20,1 21
2
=
+−
=
−
=
∑
=
L
N
x
N
i
xi
x
µ
σ
Distribuição da média amostral (x):
� Distribuição de x para uma população não normal:
Teorema do limite central:
�TLC: Seja x1, x2,…, xn uma amostra aleatória de uma distribuição
qualquer com parâmetros E[X] = µµµµ e Var[X] = σσσσ2. Se n é
suficientemente grande, a distribuição de x aproxima-se a uma
normal com E[x] = µµµµ e Var[x] = σσσσ2/n e a distribuição do Total 
(x1+…+xn) aproxima-se a uma distribuição normal com E[To] =nµµµµ
e Var[To] =nσσσσ2. Assim,








n
Nx
2
,~
σµ& Z
n
x
~&
σ
µ−
⇒
( )2,~ σµ nnNTo & Z
n
nTo
~&
σ
µ−
⇒
µµµµ
 
= 50
σσσσ = 10
Xµµµµ
 
= 50
σσσσ = 10
X
Distribuição PopulacionalDistribuição PopulacionalDistribuição Populacional
µµµµ
 
= 50
σσσσ = 10
Xµµµµ
 
= 50
σσσσ = 10
X
Distribuição PopulacionalDistribuição PopulacionalDistribuição Populacional
Distribuição amostralDistribuição Distribuição amostralamostral
µµµµX = 50- XµµµµX = 50- X
n =30n =30
σσσσσσσσ


XX = 1.8= 1.8
n = 4n = 4
σσσσσσσσ


XX = 5= 5
Distribuição amostralDistribuição Distribuição amostralamostral
µµµµX = 50- XµµµµX = 50- X
n =30n =30
σσσσσσσσ


XX = 1.8= 1.8
n = 4n = 4
σσσσσσσσ


XX = 5= 5
Distribuição amostral da proporção (e frequência):
�O TLC pode ser utilizado para justificar a aproximação da Binomial 
pela Normal pois se X é uma variável aleatória que “conta” o número
de sucessos em n tentativas independentes, como a probabilidade de 
sucesso é constante os Xs são iid.
� Portanto, se n é suficientemente grande
( )
( )npppNp
n
X
pnpnpNXsucessosno
)1(,~ˆ
)1(,~
−=
−=
&
& Z
ppn
pnX
~
)1.(.
.
&
−
−
⇒
Z
npp
pp
~
)1.(
ˆ
&
−
−
⇒
Distribuição amostral de s2:
�Quando há incerteza em relação ao valor de σσσσ estima-se o seu valor por:
�Teorema: Se s2 é a variância de uma amostra aleatória de tamanho n, 
retirada de uma população normal com parâmetros µµµµ e σσσσ2, então a 
estatística
tem distribuição χχχχ2 com n-1 graus de liberdade.
�Na utilização é necessário obter χχχχ2calc= (n-1)s2/σσσσ2
( )
1ˆ
1
2
22
−
−
==
∑
=
n
xx
s
n
i
i
σ
( )
2
2
2
1
2
)1(
σσ
sn
xx
n
i
i
−
=
−∑
=
Distribuição
amostral de s2:
Graus de liberdade:
�Os graus de liberdade podem ser vistos como uma medida da
informação amostral.
� Sabendo que
quando µµµµ não é conhecido há 1 grau de liberdade a menos ou
considera-se que um grau de liberdade é perdido na estimação de µµµµ.
�Generalização: Há n graus de liberdade, ou partes de informação
independentes, em uma amostra aleatória de uma população normal e 
cada vez que se utiliza uma estatística em substituição a um parâmetro
perde-se um grau de liberdade.
( ) ( )
444 3444 21444 3444 21
2
1
2
~
2
1
2
~
2
1
2
−
∑∑
==
−→−
nn
n
i
i
n
i
i xxx
χχ
σσµ
� A dificuldade prática em relação ao TLC é que ele demanda o 
conhecimento de σσσσ. 
� A ferramenta utilizada para lidar com essa dificuldade é a distribuição t 
(William Gosset, 1908) que é formada pela divisão
Assim, é possível fazer inferências em relação a µµµµ usando uma
estimativa de σσσσ fornecida pela mesma amostra que gerou x.
�Def: Seja x1, …, xn uma amostra aleatória de uma população normal 
com E[X] = µµµµ e Var[X] = σσσσ2, então tem distribuição
t com n-1 graus de liberdade.
x, s e a distribuição t-Student:
ns
x
sn
x
n
sn
nx
n
Z
n
/
.
/
1
/)1(
/
1
222
1
µσ
σ
µ
σ
σµ
χ
−
=
−
=
−
−
−
=
−
−
( ) ( )nsxT /µ−=
� Propriedades das distribuições t-student: Seja tνννν a curva da função
densidade dos gl de νννν.
1. Cada curva tνννν possui um formato de sino e está centrada em 0.
2. Toda curva tνννν é mais dispersa que a curva normal padronizada (Z).
3. À medida que νννν aumenta, a dispersão da curva tνννν correspondente diminui.
4. À medida que νννν →→→→ ∞∞∞∞ a seqüência das
curvas tνννν se aproxima da curva normal 
padronizada (de forma que a curva Z é
chamada geralmente de t com gl= ∞∞∞∞).
x, s e a distribuição t-Student:
x, s e a distribuição t-Student:
Para casa:
• Lista de Exercícios 7 (site: www.mec.ita.br/~rodrigo/)
• Leitura: Devore – cap. 5: Distribuições … e amostras aleatórias (5.3 a 5.5)
Walpole et al. – cap. 8: Distribuições amostrais … (8.1 a 8.7)

Continue navegando