Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística – Material de apoio – Unidade 6 Distribuição amostral das médias Com a construção de intervalos de confiança, agregamos ao estimador pontual (neste caso, X , ou a média amostral) informação sobre sua variabilidade. Vamos supor que temos uma variável aleatória qualquer X, com distribuição normal com média μ e desvio-padrão σ (X ~ N(μ , σ2)). Tirando sucessivas amostras da variável X, podemos calcular a média de cada uma delas. Teremos assim uma amostra de médias. A variável aleatória X , cuja amostra obtivemos acima, tem também uma média e um desvio-padrão. O desvio padrão da média é dado pelo desvio padrão da população (o σ da distribuição de X, de que falamos no começo) dividido por n . n X X Este é o desvio-padrão da média, também conhecido como erro-padrão da média, e é sempre menor do que o desvio-padrão da população, o que é esperado, já que a média de um conjunto de valores deve variar menos do que os próprios valores. Além disso, você deve notar que o desvio-padrão da média diminui conforme aumenta o tamanho da amostra. O Teorema do Limite Central diz que a média amostral tem aproximadamente distribuição normal centrada na média populacional (μ) e desvio padrão X , ou seja, n ,N~X X No início do século, Gosset descobriu que a razão n S X T tem uma distribuição de probabilidade que não depende de μ nem de σ2, mas somente do tamanho da amostra. Esta distribuição de probabilidade chama-se t de Student, o pseudônimo de Gosset, que não podia publicar seus estudos em seu nome. Esta distribuição, assim como a normal padrão, também é tabelada. Assim, a razão T tem distribuição t-Student com n-1 “graus de liberdade”. Isso se expressa da seguinte forma: T ~ tn-1. Estimativas pontuais Estimação por ponto consiste em fornecer a melhor estimativa possível para o parâmetro, que será, por sua vez, estimado por um valor único. Para tanto, deve-se escolher o melhor estimador possível, colher a amostra e, em função dos seus elementos, calcular a estimativa. Um estimador deve apresentar uma série de boas propriedades, tais como justeza, consistência, eficiência e suficiência, que não serão desenvolvidas nesse material. O melhor estimador de que se dispõe para a média da população é a média amostral ( X ). O melhor estimador para a variância populacional é a variância amostral (S2). Diante de amostras grandes, um bom estimador para o desvio-padrão populacional é o desvio-padrão amostral. Intervalo de confiança para uma média populacional Conhecendo-se a distribuição da razão T, pode-se então construir o Intervalo de Confiança para a média populacional μ, que é obtido da seguinte forma: Procuramos um valor (que aqui chamaremos de t*) tal que P (-t* < T < t*) = 1- α, ou seja, 1*t n S X *tP Como nos interessamos num intervalo de valores que, com probabilidade (1- α) contenha o verdadeiro valor de μ, então μ deve ser o valor a ser isolado na expressão acima. Da mesma forma que fizemos as manipulações matemáticas para obter o intervalo de confiança para p, procederemos aqui, seguindo os seguintes passos: 1 n S *tX n S *tP e em seguida 1 n S *tX n S *tXP e invertendo o sinal da desigualdade para se obter o intervalo para μ (e não – μ), obtemos finalmente ou seja, o intervalo que contém μ com (1- α)% de confiança é n S *tX; n S *tX O valor de t* é obtido na tabela da distribuição de t-Student, bastando observar o tamanho da amostra (n) e o nível de significância (α). Assim, se temos por exemplo uma amostra de tamanho 20 e queremos o intervalo de confiança de 95% para μ, então: (1- α) = 0,95 -> α = 0,05 ou 5% e (n-1) = 19, portanto procuramos o valor t* (ou t crítico) dado na tabela de t- Student por t19 , 5% = 2,093. A partir daí basta calcular a média e o desvio-padrão amostral para construir o IC solicitado. Exemplo: Bau e colaboradores (2001) realizaram estudos de genética do comportamento em uma amostra de 143 dependentes de álcool do sexo masculino, de Porto Alegre. Uma das variáveis estudadas foi “idade de início 1 n S *tX n S *tXP de problemas devido ao álcool (IIP)”. Esses problemas eram relativos à saúde e ao relacionamento com a família ou com o trabalho. Na amostra estudada, a média da variável IIP foi de 26,5 anos e o desvio-padrão foi de 8,3 anos. Usando a fórmula estudada, pode-se estimar a média da IIP na população-alvo com 95% de confiança, da seguinte forma: (1-α) = 95%, ou seja, 0,95. Logo, t0,05 ; 142 é aproximadamente igual a 1,98 (o valor mais próximo que temos na tabela t-student de 143 graus de liberdade é 100, e usaremos o valor crítico correspondente a ele). Assim, temos: 9,27;1,25 37,15,26;37,15,2669,0*98,15,26;69,0*98,15,26 143 3,8 *98,15,26; 143 3,8 *98,15,26 Ou seja, tem-se 95% de confiança que o intervalo [25,1 anos ; 27,9 anos] contém a média verdadeira da idade de início de problemas devido ao álcool nessas pessoas.
Compartilhar