Buscar

Material de apoio - Unidade 6

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Bioestatística – Material de apoio – Unidade 6 
 
 
Distribuição amostral das médias 
 
Com a construção de intervalos de confiança, agregamos ao estimador pontual (neste caso, 
X
, ou a 
média amostral) informação sobre sua variabilidade. 
Vamos supor que temos uma variável aleatória qualquer X, com distribuição normal com média μ e 
desvio-padrão σ (X ~ N(μ , σ2)). Tirando sucessivas amostras da variável X, podemos calcular a média de cada uma 
delas. Teremos assim uma amostra de médias. 
A variável aleatória 
X
, cuja amostra obtivemos acima, tem também uma média e um desvio-padrão. O 
desvio padrão da média é dado pelo desvio padrão da população (o σ da distribuição de X, de que falamos no 
começo) dividido por 
n
. 
n
X
X

 
 
Este é o desvio-padrão da média, também conhecido como erro-padrão da média, e é sempre menor do 
que o desvio-padrão da população, o que é esperado, já que a média de um conjunto de valores deve variar 
menos do que os próprios valores. Além disso, você deve notar que o desvio-padrão da média diminui conforme 
aumenta o tamanho da amostra. 
O Teorema do Limite Central diz que a média amostral tem aproximadamente distribuição normal 
centrada na média populacional (μ) e desvio padrão 
X

, ou seja, 






n
,N~X X


 
No início do século, Gosset descobriu que a razão 
n
S
X
T


 
tem uma distribuição de probabilidade que não depende de μ nem de σ2, mas somente do tamanho da amostra. 
Esta distribuição de probabilidade chama-se t de Student, o pseudônimo de Gosset, que não podia publicar seus 
estudos em seu nome. Esta distribuição, assim como a normal padrão, também é tabelada. 
Assim, a razão T tem distribuição t-Student com n-1 “graus de liberdade”. Isso se expressa da seguinte 
forma: T ~ tn-1. 
 
Estimativas pontuais 
 
Estimação por ponto consiste em fornecer a melhor estimativa possível para o parâmetro, que será, por 
sua vez, estimado por um valor único. Para tanto, deve-se escolher o melhor estimador possível, colher a amostra 
e, em função dos seus elementos, calcular a estimativa. Um estimador deve apresentar uma série de boas 
propriedades, tais como justeza, consistência, eficiência e suficiência, que não serão desenvolvidas nesse 
material. 
O melhor estimador de que se dispõe para a média da população é a média amostral (
X
). O melhor 
estimador para a variância populacional é a variância amostral (S2). Diante de amostras grandes, um bom 
estimador para o desvio-padrão populacional é o desvio-padrão amostral. 
 
 
Intervalo de confiança para uma média populacional 
 
Conhecendo-se a distribuição da razão T, pode-se então construir o Intervalo de Confiança para a média 
populacional μ, que é obtido da seguinte forma: 
Procuramos um valor (que aqui chamaremos de t*) tal que P (-t* < T < t*) = 1- α, ou seja, 















 1*t
n
S
X
*tP
 
Como nos interessamos num intervalo de valores que, com probabilidade (1- α) contenha o verdadeiro 
valor de μ, então μ deve ser o valor a ser isolado na expressão acima. Da mesma forma que fizemos as 
manipulações matemáticas para obter o intervalo de confiança para p, procederemos aqui, seguindo os seguintes 
passos: 
 





 1
n
S
*tX
n
S
*tP
 
e em seguida 
 





 1
n
S
*tX
n
S
*tXP
 
e invertendo o sinal da desigualdade para se obter o intervalo para μ (e não – μ), obtemos finalmente 
 
 
 
ou seja, o intervalo que contém μ com (1- α)% de confiança é 
 







n
S
*tX;
n
S
*tX
 
 
O valor de t* é obtido na tabela da distribuição de t-Student, bastando observar o tamanho da amostra 
(n) e o nível de significância (α). Assim, se temos por exemplo uma amostra de tamanho 20 e queremos o 
intervalo de confiança de 95% para μ, então: 
(1- α) = 0,95 -> α = 0,05 ou 5% e (n-1) = 19, portanto procuramos o valor t* (ou t crítico) dado na tabela de t-
Student por t19 , 5% = 2,093. A partir daí basta calcular a média e o desvio-padrão amostral para construir o IC 
solicitado. 
 
Exemplo: Bau e colaboradores (2001) realizaram estudos de genética do comportamento em uma amostra de 
143 dependentes de álcool do sexo masculino, de Porto Alegre. Uma das variáveis estudadas foi “idade de início 
 





 1
n
S
*tX
n
S
*tXP
de problemas devido ao álcool (IIP)”. Esses problemas eram relativos à saúde e ao relacionamento com a família 
ou com o trabalho. Na amostra estudada, a média da variável IIP foi de 26,5 anos e o desvio-padrão foi de 8,3 
anos. 
 Usando a fórmula estudada, pode-se estimar a média da IIP na população-alvo com 95% de confiança, da 
seguinte forma: 
(1-α) = 95%, ou seja, 0,95. Logo, t0,05 ; 142 é aproximadamente igual a 1,98 (o valor mais próximo que temos na 
tabela t-student de 143 graus de liberdade é 100, e usaremos o valor crítico correspondente a ele). 
Assim, temos: 
   
 9,27;1,25
37,15,26;37,15,2669,0*98,15,26;69,0*98,15,26
143
3,8
*98,15,26;
143
3,8
*98,15,26 





 
 
Ou seja, tem-se 95% de confiança que o intervalo [25,1 anos ; 27,9 anos] contém a média verdadeira da idade de 
início de problemas devido ao álcool nessas pessoas.

Outros materiais