Baixe o app para aproveitar ainda mais
Prévia do material em texto
Exercício de Inferência Estatística Paramétrica Aluna: Isadora Cassador Cônsoli Silva Seja um estimador pontual do parâmetro θ ,^ θ é uma variável aleatória, que varia de amostra para amostra. Por isso, há uma certa dose de incerteza inerente a esse processo de estimação. Nosso objetivo agora é obter, com base nos dados amostrais (da única amostra observada), um intervalo ao qual o valor correto do parâmetro deve ter grande chance de pertencer. • Detalhando um pouco mais: No processo de estimação por intervalo de um parâmetro θ, devemos determinar um intervalo que contenha o verdadeiro valor do parâmetro com probabilidade 1-α, onde α é um pequeno valor pré-fixado. Este intervalo é construído em geral em torno do estimador pontual , considerando uma margem de erro d, de forma a que, uma vez fixada a probabilidade 1-α, calculemos d tal que P( - d ≤ θ ≤ + d ) = 1-α. • Ou seja, o estimador pontual é o centro do Intervalo de Confiança e o erro absoluto d associado a define a amplitude desse intervalo. O que é, de fato, variável aleatória são os extremos do intervalo. O parâmetro tem valor desconhecido, não aleatório (fixo, a ser estimado). Vimos em sala de aula 4 cenários para apresentar o intervalo de confiança quando retiramos uma a.a de uma população Normal, ou seja, X1,X2,...,Xn a.a X~N(µ, σ²), dos quais temos: C1:IC(µ,100ϒ%), σ² conhecido C2:IC(µ,100ϒ%), σ² desconhecido C3:IC(σ²,100ϒ%), µ conhecido C4:IC(σ²,100ϒ%), µ desconhecido Usaremos aqui, apenas dois dos cenários acima para programar,que são: C2 e C4, e escolhemos o software R.STUDIO. >data(Orange) >Orange >Orange$age >n<-length(Orange$age) >n [1] 35 >media=mean(Orange$age) >media [1] 922.1429 >variancia=var(Orange$age) >variancia [1] 241930.7 #cenario 2: IC(MI,100GAMA%),SIGMA²DESCONHECIDA >ic.c2=media+qt(c(0.025,0.975),df=n-1)*sqrt(variancia/n) >ic.c2 [1] 753.1815 1091.1042 #Cenário 4: IC(SIGMA²,100GAMA%),MI DESCONHECIDA >alpha=0.95 >qdatabela.c4=qchisq(c(alpha/2,1-alpha/2),df=n-1) >ic.c4=((n-1)*variancia)/qdatabela.c4 ic.c4 num [1:2] 250574 243006 >t.test(Orange$age) One Sample t-test data: Orange$age t=11.0914, df=34, p-value= 7.703e-13 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 753.1815 1091.1042 Sample estimates: Mean of x 922.1429 Agora, consideraremos um exemplo para o cenário 1: C1:IC(µ,100ϒ%), σ² conhecido Variância conhecida Consideremos uma amostra aleatória simples obtida de uma população com distribuição normal, com média e variância conhecida. Desta forma, a distribuição amostral da média também é Normal com média e variância , ou seja, Assim, temos que isto é, a variável tem distribuição normal padronizada. Consideremos que a probabilidade da variável tomar valores entre e é . Os valores e são obtidos na tabela da distribuição normal. Então, temos que ou seja, o que implica que Com isso, o intervalo de confiança da média é dado por Caso os dados não tenham distribuição normal, podemos aplicar o teorema central do limite e construir um intervalo de confiança aproximado. Interpretação: Podemos afirmar que, se pudermos repetir muitas vezes o experimento e coletarmos os dados, aproximadamente em das vezes a média populacional estará no intervalo encontrado. Exemplo: O projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. Lembrando que foi verificado que e , construir um intervalo de confiança de nível para . Na tabela da distribuição normal padronizada, obtemos que . Substituindo e na fórmula para o intervalo de confiança, temos e, portanto, Uma das principais interpretações do intervalo de confiança consiste em avaliar a incerteza que temos a respeito de estimarmos o parâmetro populacional a partir de uma amostra aleatória de tamanho . Já para o cenário 2, falaremos um pouco da definição: C2:IC(µ,100ϒ%), σ² desconhecido Variânca desconhecida Tendo os conceitos básicos sobre intervalos de confiança, vamos agora tratar uma situação mais realista: quando avariância da população é desconhecida. Consideremos uma amostra aleatória simples , obtida de uma população com distribuição normal, commédia e variância deconhecidas. Como neste caso a variância é desconhecida, utilizaremos a variância amostral no lugar de . Assim, temos que ou seja, a variável tem distribuição t de Student com graus de liberdade. Então, ao fixarmos o nível de significância , obtemos da Tabela da distribuição t de Student com graus deliberdade, o valor , que satisfaz Analogamente ao caso anterior, obtemos que ou seja, Logo, o intervalo com de confiança para , com variância desconhecida, será dado por Agora, mostraremos um pouco da definição do cenário 4: C4:IC(σ²,100ϒ%), µ desconhecido Ao contrário da média amostral, a variância amostral segue a distribuição Qui-quadrado (n − 1)S²∼ χ²(n − 1) σ² O cálculo de probabilidade na distribuição Qui-quadrado depende apenas de uma quantidade chamada de graus de liberdade(g.l = n − 1).
Compartilhar