Buscar

Aula 10. ZAB0262

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 6 páginas

Prévia do material em texto

1 
Inferência Estatística 
Distribuição Amostral 
Situação 
 Uma semeadora deve ser regulada de tal modo que a distribuir 
10 sementes de milho a cada metro. Como verificar se a 
semeadora esta bem regulada? 
 Impossível analisar a população 
 Usaremos amostragem aleatória de tamanho n=36 m 
 estimamos a média amostral de 9,6 sementes/m 
 
 A partir do resultado amostral, que inferência podemos fazer 
sobre o valor do parâmetro (µ)? Será que µ=10 sementes/metro? 
Como responder? 
 A inferência estatística permite a obtenção de informações a 
respeito do parâmetro populacional (µ, σ2, ...) a partir de uma 
amostra. 
 A inferência pode ser dividida em: 
 Estimação de Parâmetros 
 Consiste em avaliar uma medida populacional, a partir da 
informação amostral 
 Por ponto (ex.: média, moda, mediana, ...) 
 Por intervalo (ex: intervalos de confiança) 
 Testes de Hipóteses 
 Consiste em julgar hipóteses sobre populações usando os 
conhecimentos amostrais 
Alguns Conceitos Importantes 
Parâmetros 
 As quantidades da população, em geral desconhecidas e sobre as 
quais temos interesse, são denominadas de parâmetros e usualmente 
representadas letras gregas tais como ,  e , entre outras. 
Estimadores 
 À combinação dos elementos da amostra, construída com a finalidade 
de representar, ou estimar, um parâmetro de interesse na população, 
são denominamos de estimador. Em geral denotamos os estimadores 
por símbolos com acento circunflexo: 
 ˆ,ˆ,ˆ
Alguns Conceitos Importantes 
Estimativas 
=> Valores numéricos assumidos pelos estimadores são denominados 
estimativas pontuais ou simplesmente estimativas. 
OBS: 
Note que um estimador é uma função das variáveis aleatórias da 
amostra, isto é: 
 
Portanto, um estimador também é uma variável aleatória e a 
correspondente distribuição de probabilidade formará a base das 
argumentações probabilísticas utilizadas na extrapolação da 
informação da amostra para os parâmetros da população. 
ˆ
)X,...,X,(Xˆ n21fθ 
Algumas Propriedades dos Estimadores 
(i) Vício 
=> Um estimador é não viciado ou não viesado para um 
parâmetro se . 
Em outras palavras um estimador é não viciado ou não viesado se 
seu valor esperado coincide com o parâmetro de interesse. 
(ii) Consistência 
Um estimador é consistente se, à medida que o tamanho da 
amostra aumenta, seu valor converge para o parâmetro de 
interesse e sua variância converge para zero. Ou seja, é 
consistente se duas propriedades são satisfeitas: 
ˆ
θθE
n


)ˆ(lim 0)ˆ(lim 

θVar
n
e 
ˆ
)ˆ(θE
ˆ
2 
Algumas Propriedades dos Estimadores 
(iii) Eficiência 
=> Dado dois estimadores e , não viciados para um parâmetro 
, dizemos que é mais eficiente que se : 
1ˆ

)ˆ()ˆ( 21 θVarθVar 
2ˆ
1ˆ 2ˆ
 Definição 1: Uma amostra aleatória simples com reposição (AAS) de 
tamanho n de uma variável aleatória X (população), com dada 
distribuição, é o conjunto de n variáveis aleatórias independentes 
X1, X2, ... , Xn, cada uma com a mesma distribuição de X. 
 
 Definição 2: Uma estatística é uma característica da amostra, ou 
seja, uma estatística T é uma função de X1, X2, ... , Xn 
 
Média amostral: 
 
 
Variância amostral: 
 
n
XXX
X n


...21
1
)(
1
2
2





n
XX
S
n
i
i
Distribuições Amostrais 
 Vamos usar uma amostra aleatória de n elementos sorteados da 
população. 
 Nossa afirmação será baseada numa estatística T, função da 
amostra (X1, X2, ... , Xn). 
 Na amostra observamos um particular valor de T e, com base 
nesse valor, fazemos afirmações sobre um parâmetro θ, por 
exemplo. 
 A validade de nossas afirmações é melhor compreendida quando 
sabemos o comportamento de T. 
 retiramos todas as possíveis amostras de tamanho n da 
população. 
 A distribuição de todos os valores de T é denominada 
distribuição amostral de T . 
Distribuição Amostral da Média 
 Objetivo 
 Estimar a média µ de uma variável aleatória X, que representa 
uma característica de interesse de uma população, a partir de 
uma amostra. 
 Propriedades 
 
 
 
 
 
 
 Obs: se n cresce, erro padrão decresce 
 
  









n
σ
μNXσμNXiii
n
σ
σ
n
σ
σii
μXEμi
XX
X
2
2
2
2
;;)
)
)
Teorema do Limite Central 
iv) Se a população tem uma distribuição qualquer com média µ e 
variância σ2, para n suficientemente grande (n>30), então a 
média amostral tem distribuição aproximadamente normal. 












n
σ
μNX
σXVar
μXE a 2
2
;
)(
)(
Exemplo 
 Considere a seguinte população: 
 {1, 3, 5, 7} 
 Seja X a v.a. o valor assumido por um elemento 
 sorteado ao acaso dessa população 
 Obter a função de distribuição 
 
 Considerar todas as possíveis amostras de tamanho n=2 com 
reposição dessa população. 
 Sejam X1 (primeiro número) e X2 (segundo número) as 
variáveis aleatórias. 
 Obter a distribuição Amostral da estatística média 
x P(X=x) 
1 ¼ 
3 ¼ 
5 ¼ 
7 ¼ 
3 
Distribuições amostrais 
 O problema básico da Inferência Estatística consiste em se fazer 
uma afirmação sobre parâmetros através de resultados obtidos na 
amostra. 
 Colhida uma amostra particular x1, x2, ..., xn calculamos o valor da 
estatística T (t1, por exemplo) e baseado neste valor faremos uma 
afirmação (ou inferência) sobre o parâmetro θ. 
 A afirmação sobre o parâmetro θ será melhor compreendida se 
soubermos o que acontece com a estatística T quando retiramos 
todas as possíveis amostras de tamanho n da população. 
 A distribuição dos possíveis valores da estatística T é chamada de 
distribuição amostral ou por amostragem da estatística T. 
Distribuições amostrais 
 O procedimento utilizado para a obtenção da distribuição amostral 
da estatística T pode ser resumido da seguinte maneira: 
 i) Da população X, estamos interessados no parâmetro θ. 
 ii) De acordo com um certo procedimento de amostragem, 
retiramos todas as amostras de tamanho n da população X. 
 iii) Para cada amostra (Xi1, Xi2, ...,Xin) calculamos o valor ti da 
estatística T, i = 1, 2, ...**** 
 iv) Os valores ti formam uma nova população cuja distribuição de 
probabilidades recebe o nome de distribuição amostral da 
estatística T. 
A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 
 Teorema 1. Seja X uma população com média µ e variância σ2 e 
seja (X1, ..., Xn) uma amostra casual simples de tamanho n 
retirada desta população. 
 
 Se X é uma v.a. com distribuição normal de média µ e variância 
σ2, pode-se demonstrar que a distribuição da média também 
será normal de mesma média, µ, mas com variância σ2/n, isto é: 
 
X ~ N(, 2)  ~ N(, 2/n) 
 
X
A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 
 Teorema 2. Para amostras casuais simples de tamanho n 
retiradas de qualquer população com média e variância 2, a 
distribuição amostral da média aproxima-se de uma 
distribuição normal com média  e variância 2/n, quando n 
tende para infinito (Teorema do Limite Central). 
 
 Se (X1, X2, ...,Xn) é uma a.c.s. de tamanho n da população X que 
tem média µ e variância σ2, então a variável ~ N(0, 1) 
quando n tende para infinito. 
 
 
n
X
Z
2


Exercício 
 Considere uma semeadora regulada de tal modo a distribuir em 
média µ=9,6 sementes/m. Sabe-se que X tem variância 0,81 
(sementes/m) 2. Calcular a probabilidade da média amostral de X 
de uma amostra aleatória de tamanho n=36: 
Ser menor do que 10 sem/m? P( <10)=? 
 Estar entre 9,4 e 10 sem/m? 
 Ser maior que 9,9 sem/m? 
 Obter tal que: 
 P( < )=0,985 
 P( < )=0,975 
 Dica: lembrar do teorema do limite central 
X
X
X
X x
x
Estimação de Parâmetros – 
Intervalos de Confiança 
 Quando estamos interessados em um determinado 
parâmetro de uma população 
 lançamos mão de uma amostra extraída dessa população 
 procuramos, através dessa amostra, estimar o parâmetro 
populacional. 
4 
Logo... 
 A partir da amostra de tamanho 
n estimamos os parâmetros 
populacionais  e 2 através dos 
estimadores (ao lado) 
 Que produzem, para a amostra 
selecionada, as estimativas 
pontuais 
 são chamadas pontuais, pois são 
únicas para cada amostra 
selecionada 



n
i
ix
n
X
1
1


























 
 n
x
x
n
S
n
i
in
i
i
2
1
1
22
1
1
Assim... 
 Vejamos agora como obter estimativas intervalares para o 
parâmetro de interesse 
 isto é, como determinar intervalos com limites que 
abranjam o valor do parâmetro populacional 
 com uma margem de segurança prefixada 
Intervalo de confiança Intervalo de confiança para a média populacional 
 
)1;0(~;~);(~
2
2
2 N
n
X
Z
n
NXNX

 







 População normal, variância populacional 2 conhecida 
 
α-1=)z<Z<P(-z=)x<μ<xP( tt21
Intervalo de confiança para a média populacional 
 




















n
zX
n
zXPz
n
X
zP cccc



2
 









n
zx
n
zx
n
zxCI ccc
222
1 ;..
 
Fixando uma probabilidade , iremos considerar um intervalo simétrico em 
relação à origem, tal que  = P(-zc < Z < zc), onde zc pode ser obtido em tabela 
e o seu valor depende exclusivamente da confiança () que desejamos na 
estimativa por intervalo. Então: 
 
 
 
 
 
e o I.C. para a média populacional, , com um coeficiente de confiança , é 
 
 
 
 Vimos que para uma amostra suficientemente grande, a 
distribuição das médias amostrais em torno da média 
populacional é Normal com desvio padrão  n . 
 Chamamos de  n de erro padrão (EP) da média, uma vez 
que quanto menor seu valor tanto mais próximas estarão as 
médias amostrais da média populacional  (i.e. tanto menor 
será o erro). 
Intervalo de Confiança para uma Média 
5 
 Isto significa que 68,3% de todas as médias amostrais cairão 
dentro de  1 EP da média populacional . 
 Considerando: média populacional =  
 desvio-padrão populacional =  
 E.P. da média = 
 Similarmente 95% de todas as médias amostrais cairão 
dentro  1,96 x EP de . 
 Então intervalos da forma: 
conterão a verdadeira média populacional  em 95% das vezes. 
Intervalo de Confiança para uma Média 
n








n
X
n
XCI
 .96,1,.96,1%)95,.(.
Intervalo de confiança para a média populacional 
 
Dizemos que o intervalo contem o verdadeiro valor da média 
populacional com uma confiança de 100%. Note que este I.C. é 
centrado na média e a sua amplitude é igual a . 
 
O coeficiente de confiança () deve ser entendido da seguinte 
maneira: “se a partir de K amostras independentes de tamanho n, 
calculamos K intervalos de confiança (diferentes) para a média µ, 
pelo menos K* desses intervalos deverão cobrir (incluir) o 
verdadeiro valor de ”. 
 
X
n
zc

2
Exemplo 
Para uma amostra de 36 observações de uma população normal 
com variância conhecida e média desconhecida, seja 
a média amostral. 
Construir os intervalos de 95 e 99% de confiança para μ. 
 
Interpretação: 
Temos 95% de confiança de que o intervalo ( ; ) contenha a 
média populacional . 
Temos 99% de confiança de que o intervalo ( ; ) contenha a 
média populacional . 
22 kg36,0
kgX 6,59
IC para população normal, variância populacional 
2 desconhecida 
 Neste caso, o intervalo de confiança é 
calculado utilizando-se uma nova 
estatística: 
 sendo S2 o estimador da variância 
populacional. 
 
 Esta estatística, tem distribuição t de 
Student com (n  1) graus de liberdade. 
n
S
X
T
2


 Note que quanto menor o v, maiores os valores de t; 
 Note ainda que à medida que o v cresce, o valor de t torna-se próximo a 
1,96, por exemplo. 
6 
Intervalo de confiança 
 Nesse caso, o intervalo de confiança para a média 
populacional , supondo que a população tem 
distribuição normal com variância desconhecida é dada 
por: 
 
 
 
 
 Sendo S2 é o estimador da variância populacional 
);().(.
222
1
n
S
tx
n
S
tx
n
S
txCI TTT 
Consulta a tabela t de Student 
Exemplo 
 Considere a seguinte amostra: 
 
 Brix (%) – cana-de-açucar 
 19,68 19,91 19,61 
 19,58 19,31 19,61 
 19,88 20,11 20,21 
 20,01 19,31 19,41 
 
 Encontre a média e variância amostral 
 Determine o intervalo de confiança para a média (95%) 
 Graus de liberdade=n-1 
População com distribuição não normal, 
grandes amostras (n>30) 
 Vimos como construir intervalos de confiança para a média 
populacional µ 
 Supondo a v.a. com distribuição normal na população 
 Variância desconhecida 
 E quando a distribuição da v.a. não é normal na população? 
 Saída: utilizar o Teorema do Limite Central 
Assim... 
 Pelo teorema do limite central, se a amostra for 
suficientemente grande (n>30), então a estatística (T) de 
interesse pode ser obtida por: 
 
);(N~
n
S
X
Z
a
10
2


O novo intervalo de confiança! 









n
S
zX
n
S
zX
n
S
zXCI ccc
222
1 ;).(. 
 Uso e aplicação como para o caso de amostra com variância 
conhecida, porém a estatística será obtida a partir da variância 
amostral.

Outros materiais

Outros materiais