Buscar

Estatística - Poli - Aulas 05 e 06 Distribuições Amostrais

Prévia do material em texto

Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Aulas 05 e 06
Distribuições Amostrais
Profs.
Fernando Tobal Berssaneti
André Leme Fleury
Renato de Oliveira Moraes
Leandro Alves Patah
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuições Amostrais
Estatística 
Descritiva
Estatística
Indutiva
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Estimativa de parâmetros populacionais
Construção de intervalos de confiança
Distribuições Amostrais
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição populacional
Distribuição amostral
Distribuições Amostrais
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Caracterizada por uma distribuição de 
probabilidades com parâmetros
A mesma distribuição pode ser usada para 
qualquer elemento da população
População
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Altura média dos alunos = 1,70m
Um aluno escolhido ao acaso terá altura 
em torno de 1,70m
Exemplo
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Amostra
Supõe-se que as amostras são 
representativas das populações, que 
foram obtidas por processos 
probabilísticos por amostragem casual 
simples
Se a amostra é aleatória, todos os seus 
elementos fornecerão valores aleatórios 
da variável de interesse
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Constituída por n = valores aleatoriamente 
obtidos de alguma variável
Qualquer parâmetro amostral será sempre 
uma variável aleatória
Amostra
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Estatísticas são os valores calculados em 
função dos elementos da amostra
Distribuição Amostral
Distribuição amostral = distribuição de 
probabilidade de uma estatística
As estatísticas, sendo variáveis aleatórias, 
terão alguma distribuição de probabilidade, 
com uma média, uma variância, etc.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição Amostral de X-barra 
Quando o tamanho da amostra aumenta, independendo da 
distribuição da população original, a distribuição amostral 
de 𝑋 aproxima-se cada vez mais de uma distribuição 
normal. Esse resultado, fundamental na teoria da 
Inferência Estatística, é conhecido como:
Teorema Central do Limite ou 
Teorema do Limite Central
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Teorema do Limite Central
Teorema que afirma, em essência, que, sob condições 
bastante gerais, uma variável aleatória, resultante de uma 
soma de n variáveis aleatórias independentes, no limite, 
quando n tende ao infinito, tem distribuição normal.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Teorema do Limite Central
 Se a população tem distribuição normal, a distribuição das 
suas médias amostrais será normal para qualquer tamanho 
da amostra, isto é, quando a população é normal N(µ, σ2), a 
média amostral X-barra de amostras de tamanho “n” tem 
distribuição também normal com média µ e variância σ2/n.
 Se a população tem distribuição não normal, a distribuição 
das suas médias amostrais será normal para amostras 
grandes, isto é, para uma população não normal com média 
µ e variância σ2, a distribuição da média amostral X-barra 
para amostras de tamanho n suficientemente grande é 
aproximadamente normal com média µ e variância σ2/n.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição Amostral de X-barra ( 𝑋)
Determinaremos as principais características da 
distribuição amostral da estatística 𝑋 , média de uma 
amostra de n elementos
Sendo a população infinita ou a amostragem feita com 
reposição, do teorema do limite central resulta que os 
diversos valores da amostra podem ser considerados 
valores de variáveis aleatórias independentes, com a 
mesma distribuição de probabilidade da população, 
portanto com a mesma média e a mesma variância 
da população

2
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Propriedades da média
)(.)( XkkX   )(...)()()...( 2121 nn xxxxxx  Distribuição Amostral de X-barra ( 𝑋)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 






n
n
n
xxx
n
x n
1
)...(
1
)](...)()([
1
)( 21
_
)...(
1
21
1
_
n
n
i
i
xxx
nn
x
x 


Média de X-barra - 𝑋
Portanto, a média em torno da qual devem 
variar os possíveis valores da estatística 
X-barra é a própria média µ da população.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
)(.)( 222 XkkX   )(...)()(
)...(
2
2
2
1
2
21
2
n
n
xxx
xxx




Propriedades da Variância
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
n
n
n
n
xxx
n
x n
2
2
2
222
2
2
2
2
1
22
_
2
1
)...(
1
)]()...()([)
1
()(






 







n
x
x 2
_
2 )( 
Variância de X-barra - 𝑋
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
n
xx
  )()(
_
2
_
Desvio padrão de X-barra - 𝑋
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
n
x
x
)(
)(

 
)()( xx  )(xx
 𝑋
Distribuição Amostral de X-barra - 𝑋 -
População Normal
Distribuição da 
população
Distribuição amostral de 
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exemplo
Digamos que X represente o peso real de pacotes de açúcar, enchidos
automaticamente. Sabe-se que X tem distribuição normal N(500,100).
Sorteamos 100 pacotes e medimos seus pesos. Se a máquina estiver
regulada, qual a probabilidade de encontrarmos a média de 100 pacotes
diferindo de 500g com menos de 2 gramas?
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Resposta
A variável de interesse é X, peso de cada pacote. A população será o conjunto
de todos os pacotes enchidos ou que virão a ser enchidos pela máquina, e que
obedece a um modelo normal.
A amostra será formada pelas 100 medidas obtidas dos pacotes selecionados.
Pelo Teorema Central do Limite, X terá distribuição normal, com média 500 e
variância 100/100 = 1g2.
P( | X- 500 | < 2) = P(498 < X < 502) = P(-2,00 < Z < 2,00) ≅ 95%
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição de frequência relativa ou 
proporção amostral
A frequência representa alguma característica na 
amostra, que pode ser uma classificação de uma variável 
qualitativa, valores de uma variável quantitativa discreta ou 
o fato de um valor de uma variável quantitativa contínua 
estar dentro de um dado intervalo.
Com isso, a frequência é uma estatística, pois é 
determinada em funçãodos elementos da amostra.
f
f
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição de frequência relativa ou 
proporção amostral
Pode-se considerar a ocorrência de um sucesso, caso a 
característica desejada se verifique, ou de um fracasso, 
caso contrário.
Seja (ou ) a probabilidade de ocorrência de sucesso 
para cada elemento da amostra. Se a população é infinita 
ou a amostragem é feita com reposição, é constante 
para todos os elementos da amostra.
Nesse caso, a distribuição amostral de frequência será 
uma distribuição binomial de parâmetros e
f
 
n
p
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
n
f
p '
p’ = frequência relativa ou proporção
f = frequência absoluta
n = tamanho da amostra
Distribuição de frequência relativa ou 
proporção amostral
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Probabilidade de ocorrer um sucesso é 
constante. Distribuição binomial.
Sucesso
Fracasso
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Sendo p’ a proporção procurada da população (f/n)
Frequência absoluta (f)
Média de p’
)1()(
)(
2 



nf
nf
𝜇 𝑝′ = 𝜇
𝑓
𝑛
=
1
𝑛
𝜇 𝑓 =
1
𝑛
𝑛𝜋 = 𝜋
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Variância de p’ n
n
n
f
nn
f
p
)1(
)1(
1
)(
1
)'(
2
2
2
22












Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 





5)1(
5


n
n
Amostra: Suficientemente Grande: 
Aproximação pela Normal
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
n
p
)1(
)'(




 )'(p
p
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
O volume de comercialização na Bolsa de Valores de Nova Iorque cresceu 
nos últimos anos. Contudo observamos que nos últimos seis meses o 
volume tem permanecido estável com um volume médio diário de 700 
milhões de ações. A distribuição de probabilidade do volume diário é 
aproximadamente normal, com desvio padrão de 100 milhões de ações. 
Nesta condição pede-se:
 A probabilidade de que o volume diário de comercialização será 
superior a 800 milhões de ações?
 Determine a probabilidade de que nos próximos quatro meses (90 dias 
uteis) ocorram mais de vinte dias com volume diário de 
comercialização excedendo os 800 milhões de ações.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Graus de liberdade de uma estatística
• A razão pela qual usa-se n-1 ao invés de n na equação 
abaixo é porque o calculo dessa estatística pressupõe 
que anteriormente já se tenha calculado 𝑋.
• Em outras palavras, GL significa contar quantos 
parâmetros já foram estimados, descontar isso do 
número total de observações, para depois calcular uma 
outra estimativa.
𝑆𝑥
2 =
 𝑖=1
𝑛 𝑋𝑖 − 𝑋
2
𝑛 − 1
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Variância
Distribuição da Variância Amostral
𝑆𝑥
2 =
 𝑖=1
𝑛 𝑋𝑖 − 𝑋
2
𝑛 − 1
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição da Variância Amostral
A distribuição amostral da estatística está 
relacionada com uma família de distribuições de 
probabilidade de grande importância em diversos 
problemas de estatística indutiva, que são as 
distribuições do tipo (qui quadrado)
𝑆𝑥
2
2
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuições
2
2
Distribuição da Variância Amostral
Podemos considerar a distribuição da variável 𝜒2com ν (𝑛 − 1) graus 
de liberdade como sendo a soma dos quadrados de ν valores 
independentes da variável normal reduzida, com média e desvio-
padrão .

Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 







 

v
i
i
v
i
i
v Z
x
1
2
2
1
2


1)(1)( 2  zz 
  vzvz i
v
i
iv 





 

2
1
22 )( 
vv 2)(
22 
Distribuição Qui-quadrado
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição Qui-quadrado
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição Qui-quadrado
A tabela A6.2 fornece valores das variáveis para v = 
1, 2, ..., 30, em função de valores de probabilidade 
correspondentes à cauda à direita na respectiva 
distribuição
2
v
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Tabela Qui-quadrado
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exemplo Distribuição Qui-quadrado
Assim, por exemplo, se entrarmos na tabela com P = 
10% e v = 3, encontramos = 6,251
Isso significa que a probabilidade de um valor aleatório 
da variável ser maior do que 6,251 é de 10%
2
32
3
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Média
Variância
𝜇 𝑆𝑥
2 =
𝜎2
𝑛 − 1
𝜇 𝜒𝑛−1
2 =
𝜎2
𝑛 − 1
𝑛 − 1 = 𝜎2
𝜎2 𝑆𝑥
2 =
𝜎4
(𝑛 − 1)2
𝜎2 𝜒𝑛−1
2 =
𝜎4
(𝑛 − 1)2
2 𝑛 − 1 =
2𝜎4
𝑛 − 1
Distribuição da Variância Amostral
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
)1(2)( 22  n
1)( 2  n
2
2
2
2
1
)1(

 xn
Sn 

Distribuição Amostral de 𝑆𝑥
2
𝑆𝑥
2
𝜇 𝑆𝑥
2 = 𝜎2
𝜎2 𝑆𝑥
2 =
2𝜎4
𝑛 − 1
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Foi proposto um estudo para se avaliar as notas obtidas nas 
2 provas da disciplina de Estatística dos alunos da Poli no 
ano de 2014. Os valores somados poderiam variar entre 0,00 
e 20,00
• Foi obtida uma população normal com média 10,00 e 
variância 4,00
• Foram retiradas 15 amostras de tamanho 20 dessa 
população, levando-se em conta todas as turmas conduzidas 
neste ano
• Seguem as amostras obtidas:
.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Também foram calculadas as médias e as variâncias 
das 15 amostras:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Com isso foi possível desenhar o histograma das 
médias amostrais:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• E o histograma das variâncias das 15 amostras:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Pede-se estimar os valores de:
• Média das médias ou de X-barra
• Desvio-padrão das médias ou de X-barra
• Média da variância amostral
• Variância da variânciaamostral
𝑆𝑥
2
𝑆𝑥
2
_
x
_
x
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Os valores calculados, com base nas 15 amostras, para 
a média das médias e para o desvio-padrão das médias 
foram:
• E os valores calculados para a média das variâncias e a 
variância das variâncias foram: 
03,10)(
_
x 44,0)(
_
x
𝜇 𝑆𝑥
2 = 3,864 𝜎2 𝑆𝑥
2 = 1,817
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Simulação com 200 amostras – Média:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Simulação com 200 amostras – Variância:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Simulação com 200 amostras: 02,10)(
_
x 48,0)(
_
x
𝜇 𝑆𝑥
2 = 4,006 𝜎2 𝑆𝑥
2 = 1,694
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Simulação com 10.000 amostras – Média:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Simulação com 10.000 amostras – Variância:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exercício
• Simulação com 10.000 amostras: 9993,9)(
_
x 4500,0)(
_
x
𝜇 𝑆𝑥
2 = 4,026 𝜎2 𝑆𝑥
2 = 1,673
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição t de Student
• A distribuição t de Student é uma distribuição de probabilidade estatística, 
desenvolvida por um autor que se auto-denominou Student, pseudônimo de 
William Sealy Gosset, que não podia usar seu nome verdadeiro para publicar 
trabalhos enquanto trabalhasse para a cervejaria Guinnes
• A distribuição t é uma distribuição de probabilidade teórica, simétrica e 
semelhante à curva normal padrão, porém com caudas mais longas, ou seja, 
uma simulação t de Student pode gerar valores mais extremos que uma 
normal
• O único parâmetro v que a define e caracteriza a sua forma é o número 
de graus de liberdade
• Quanto maior for esse parâmetro, mais próxima da normal ela será
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
t Z
t apresenta n-1 graus de liberdade e tem denotação tn-1
Distribuição t de Student
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
n
X
Z



n
S
X
t
x
n

1
Distribuição t de Student
• A partir de uma amostra de “n” valores retirados de uma população normal 
de média  e variância 2 temos:
• Entretanto, se usarmos na expressão acima o desvio padrão da amostra 
(raiz quadrada da variância da amostra calculada com n-1 no denominador), 
obteremos uma estatística cuja distribuição não mais é normal. Conforme 
demonstrou Student, a estatística distribui-se simetricamente, com média 0, 
porém não normalmente:
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição t de Student
A tabela A6.3 fornece valores de t em função do número 
de graus de liberdade e de probabilidades 
correspondentes à cauda à direita na respectiva 
distribuição
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Tabela t de Student
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exemplo Distribuição t de Student
Assim, por exemplo, se entrarmos na tabela com P = 
0,025 e v = 50, encontramos = 2,009
Isso significa que a P( > 2,009) = P( < -2,009) = 
0,025, ou 2,5%
Nota-se que esse valor de já é muito próximo do 
correspondente valor para = Z = 1,960
50t
50tt
50t 50t
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição F de Snedecor
• Suponhamos que duas amostras independentes retiradas de populações 
normais forneçam variâncias amostrais 𝑆1
2 𝑒 𝑆2
2, e que desejamos conhecer a 
distribuição amostral do quociente 
𝑆1
2
𝑆2
2 . Isso será possível através do 
conhecimento das distribuições F de Snedecor.
𝐹𝜈1𝜈2=
𝜒𝜈1
2
𝜈1
𝜒𝜈2
2
𝜈2
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição F de Snedecor
𝑆1
2
𝑆2
2 = 𝐹𝑛1−1, 𝑛2−1
De duas populações normais com mesma variância 𝜎2 (ou, o que seria 
equivalente, de uma mesma população normal), são extraídas duas amostras 
independentes com, respectivamente, n1 e n2 elementos e toma-se o quociente 
𝑆1
2
𝑆2
2 das variâncias dessas amostras
Utilizando a seguinte expressão pode-se concluir que a distribuição desse 
quociente será uma distribuição 𝐹𝑛1−1, 𝑛2−1
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuição F de Snedecor
A tabela A6.4 fornece valores da variável F que 
determinam caudas à direita com probabilidades 0,5; 1; 
2,5; 5 e 10%, fornecidos para diversos pares de valores 
de v1 e v2
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Tabela F (P=5%)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Exemplo Distribuição F de Snedecor
Assim, por exemplo, se entrarmos na tabela com P = 
5%, v1 = 5 e v2 = 20, encontramos F = 2,71
Isso significa que, na distribuição F com 5 graus de 
liberdade no numerador e 20 graus de liberdade no 
denominador, a probabilidade de se obter um valor 
aleatório superior a 2,71 é igual a 5%

Continue navegando