Exercício de Inferência Estatística Paramétrica

•

UFJF

1

0

1

0

Isadora Lupchinski

13/07/2015

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Inferência Estatística I

36 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Exercício de Inferência Estatística Paramétrica 
Aluna: Isadora Cassador Cônsoli Silva 
Seja um estimador pontual do parâmetro θ ,^ θ é uma variável aleatória, que varia de amostra para amostra. Por isso, há 
uma certa dose de incerteza inerente a esse processo de estimação. Nosso objetivo agora é obter, com base nos dados 
amostrais (da única amostra observada), um intervalo ao qual o valor correto do parâmetro deve ter grande chance de 
pertencer. 
• Detalhando um pouco mais: No processo de estimação por intervalo de um parâmetro θ, devemos determinar um 
intervalo que contenha o verdadeiro valor do parâmetro com probabilidade 1-α, onde α é um pequeno valor pré-fixado. 
Este intervalo é construído em geral em torno do estimador pontual , considerando uma margem de erro d, de forma a 
que, uma vez fixada a probabilidade 1-α, calculemos d tal que P( - d ≤ θ ≤ + d ) = 1-α. 
• Ou seja, o estimador pontual é o centro do Intervalo de Confiança e o erro absoluto d associado a define a amplitude 
desse intervalo. O que é, de fato, variável aleatória são os extremos do intervalo. O parâmetro tem valor desconhecido, 
não aleatório (fixo, a ser estimado). 
Vimos em sala de aula 4 cenários para apresentar o intervalo de confiança quando retiramos uma a.a de uma população 
Normal, ou seja, X1,X2,...,Xn a.a X~N(µ, σ²), dos quais temos: 
C1:IC(µ,100ϒ%), σ² conhecido 
C2:IC(µ,100ϒ%), σ² desconhecido 
C3:IC(σ²,100ϒ%), µ conhecido 
C4:IC(σ²,100ϒ%), µ desconhecido 
Usaremos aqui, apenas dois dos cenários acima para programar,que são: C2 e C4, e escolhemos o software R.STUDIO. 
>data(Orange) 
>Orange 
>Orange$age 
>n<-length(Orange$age) 
>n 
[1] 35 
>media=mean(Orange$age) 
>media 
[1] 922.1429 
>variancia=var(Orange$age) 
>variancia 
[1] 241930.7 
 
#cenario 2: IC(MI,100GAMA%),SIGMA²DESCONHECIDA 
 
 
>ic.c2=media+qt(c(0.025,0.975),df=n-1)*sqrt(variancia/n) 
>ic.c2 
[1] 753.1815 1091.1042 
 
 
 
 
#Cenário 4: IC(SIGMA²,100GAMA%),MI DESCONHECIDA 
>alpha=0.95 
>qdatabela.c4=qchisq(c(alpha/2,1-alpha/2),df=n-1) 
>ic.c4=((n-1)*variancia)/qdatabela.c4 
ic.c4 num [1:2] 250574 243006 
>t.test(Orange$age) 
One Sample t-test 
data: Orange$age 
t=11.0914, df=34, p-value= 7.703e-13 
alternative hypothesis: true mean is not equal to 0 
95 percent confidence interval: 
753.1815 1091.1042 
Sample estimates: 
Mean of x 
922.1429 
Agora, consideraremos um exemplo para o cenário 1: 
C1:IC(µ,100ϒ%), σ² conhecido 
Variância conhecida 
Consideremos uma amostra aleatória simples obtida de uma população com distribuição normal, 
com média e variância conhecida. Desta forma, a distribuição amostral da média também é Normal com média 
 e variância , ou seja, 
 
 
Assim, temos que 
 
 
isto é, a variável tem distribuição normal padronizada. 
Consideremos que a probabilidade da variável tomar valores entre e é . Os valores 
 e são obtidos na tabela da distribuição normal. 
Então, temos que 
 
ou seja, 
 
 
o que implica que 
 
 
Com isso, o intervalo de confiança da média é dado por 
 
 
Caso os dados não tenham distribuição normal, podemos aplicar o teorema central do limite e construir um intervalo de 
confiança aproximado. 
Interpretação: Podemos afirmar que, se pudermos repetir muitas vezes o experimento e coletarmos os dados, 
aproximadamente em das vezes a média populacional estará no intervalo encontrado. 
Exemplo: O projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto para 
montar um determinado brinquedo. Lembrando que foi verificado que e , construir um intervalo de 
confiança de nível para . 
Na tabela da distribuição normal padronizada, obtemos que . 
Substituindo e na fórmula para o intervalo de confiança, temos 
 
 
e, portanto, 
 
Uma das principais interpretações do intervalo de confiança consiste em avaliar a incerteza que temos a respeito de 
estimarmos o parâmetro populacional a partir de uma amostra aleatória de tamanho . 
 Já para o cenário 2, falaremos um pouco da definição: C2:IC(µ,100ϒ%), σ² desconhecido 
Variânca desconhecida 
Tendo os conceitos básicos sobre intervalos de confiança, vamos agora tratar uma situação mais realista: quando 
avariância da população é desconhecida. 
Consideremos uma amostra aleatória simples , obtida de uma população com distribuição normal, 
commédia e variância deconhecidas. Como neste caso a variância é desconhecida, utilizaremos a variância 
amostral no lugar de . Assim, temos que 
 
 
ou seja, a variável tem distribuição t de Student com graus de liberdade. 
Então, ao fixarmos o nível de significância , obtemos da Tabela da distribuição t de Student com graus 
deliberdade, o valor , que satisfaz 
 
 
 Analogamente ao caso anterior, obtemos que 
 
 
ou seja, 
 
 
Logo, o intervalo com de confiança para , com variância desconhecida, será dado por 
 
 
 
Agora, mostraremos um pouco da definição do cenário 4: 
C4:IC(σ²,100ϒ%), µ desconhecido 
Ao contrário da média amostral, a variância amostral segue a distribuição Qui-quadrado 
(n − 1)S²∼ χ²(n − 1) 
 σ² 
O cálculo de probabilidade na distribuição Qui-quadrado depende apenas de uma quantidade chamada de graus de 
liberdade(g.l = n − 1).