BIOESTATÍSTICA - APOSTILA
165 pág.

BIOESTATÍSTICA - APOSTILA


DisciplinaBioestatística I3.595 materiais30.221 seguidores
Pré-visualização23 páginas
de uma distribuição
Num problema de inferência estatística, qualquer característica da distribuição
dos dados, tais como a média µ ou variância \u3c32, é denominada parâmetro da
distribuição.
4.1.2 Estatística
Denomina-se estatística ao valor calculado inteiramente a partir da amostra.
Exemplos de estatísticas são X¯, \u3c32, mediana, moda, desvio médio, etc.
4.1.3 Estimação Pontual e por Intervalo
Suponha que alguma característica dos elementos de uma população seja
representada pela v.a. X, cuja f.d.p. é f(x; \u3b8), onde a forma dessa densidade seja
conhecida, exceto pelo parâmetro \u3b8 desconhecido, que se deseja estimar.
Suponha que os valores x1, x2, ..., xk de uma amostra aleatória X1, X2, ..., Xk possam
ser observados. Com base nesses valores observados deseja-se estimar o valor
desconhecido de \u3b8. A estimação pode ser obtida de duas maneiras: estimação
pontual eestimação por intervalo. Na estimação pontual determina-se uma
estatística cujo valor representa, ou estima o parâmetro \u3b8. Na estimação por
intervalo, determina-se um intervalo para o qual a probabilidade que ele contenha
o valor \u3b8 possa ser determinado.
4.2 Estimação Pontual
Apresentamos aqui dois métodos para se encontrar estimadores pontuais: métodos
dos momentos e método da máxima verossimilhança
97
4.2.1 Método dos Momentos
Seja µ\u2032r = E(X4) o r-ésimo momento de X. Em geral, µ
\u2032
r será uma função conhecida
dos parâmetros desconhecidos \u3b81, \u3b82, ..., \u3b8k.
Seja m\u2032r o r-ésimo momento amostral,i.e.,
m
\u2032
r =
1
n
k\u2211
i=1
xri (4.1)
O método dos momentos consiste em se resolver as k equações
m
\u2032
j = µ
\u2032
j j = 1, 2, ..., k.
Obs: O primeiro momento amostral m\u20321 é representado por x¯.
Exemplos:
a) Determinar o estimador pontual pelo método dos momentos do
parâmetro µ da distribuição Rayleigh.
Solução:
Sabemos, pelo capítulo 3, que se uma v.a. X possui distribuição Rayleigh
com parãmetro µ, sua f.d.p. é dada por:
f(x) =
2x
µ
e\u2212
x2
µ para x > 0
A média de X é dada por:
E(X) =
1
2
\u221a
µpi
Portanto, o estimador dos momentos de µ será obtido igualando-se o
primeiro momento populacional ao primeiro momento amostral:
1
2
\u221a
µ\u2c6pi = x¯
Logo,
µ\u2c6 =
4x¯
pi
98
b) Determinar os estimadores dos momentos para os parâmetros µ e \u3c32 da
distribuição Normal.
Solução
Sabemos que se uma v.a. X possui distriubição Normal com parâmetros
µ e \u3c32, então:
E(X) = µ
V ar(X) = \u3c32
Como V ar(X) = E(X2)\u2212 [E(X)]2, seu segundo momento será
E(X2) = \u3c32 + µ2
Igualando-se os dois primeiros momentos populacionais aos dois primeiros
momentos amostrais tem-se:
µ\u2c6 = x¯
\u3c3\u2c62 =
\u2211n
i=1 x
2
i
n
\u2212 x¯2 =
\u2211n
i=1(xi \u2212 x¯)2
n
c) Determinar os estimadores dos parâmetros \u3b1 e \u3b2 da distribuição Gama
pelo método dos momentos. (Fazer na série de exercícios)
4.2.2 Método da Máxima Verossimilhança
Definição 1: Função de Verossimilhança
A função de verossimilhança de n v.a. X1, X2, ..., Xn é definida como sendo a
densidade conjunta das n v.a., f(x1, x2, ..., xn; \u3b8), que é considerada como sendo
uma função de \u3b8. Em particular, se X1, X2, ..., Xn é uma amostra aleatória de uma
densidade f(x; \u3b8), então a função de verossimilhança é
L(\u3b8; x1, x2, ..., xn) = f(x1; \u3b8)f(x2; \u3b8)...f(xn; \u3b8).
Definição 2: Estimador de Máxima Verossimilhança
Seja L(\u3b8) = L(\u3b8; x1, x2, ..., xn) a função de verossimilhança das v.a. X1, X2, ..., Xn.
Se \u3b8\u2c6 é o valor de \u3b8 que maximiza L(\u3b8), então \u3b8\u2c6(X1, X2, ..., Xn) é o estimador
de máxima verossimilhança de \u3b8, e \u3b8\u2c6(x1, x2, ..., xn) é a estimativa de máxima
verossimilhança de \u3b8 para a amostra x1, x2, ..., xn.
99
Os casos mais importantes que consideraremos são aqueles que X1, X2, ..., Xn
formam uma amostra aleatória de uma densidade f(x; \u3b8), de tal modo que:
L(\u3b8) = f(x1; \u3b8)f(x2; \u3b8)...f(xn; \u3b8).
Então, o estimador de máxima verossimilhança é a solução da equação
dL(\u3b8)
d\u3b8
= 0 (4.2)
Além disso, L(\u3b8) e logL(\u3b8) possuem seus máximos para o mesmo valor de \u3b8, e muitas
vezes é mais fácil encontrar o máximo do logaritmo da função de verossimilhança.
Se a função de verossimilhança contém k parâmetros \u3b81, \u3b82, ..., \u3b8k, os estimadores de
máxima verossimilhança serão a solução das k-equações
\u2202L(\u3b81, \u3b82, ..., \u3b8k)
\u2202\u3b81
= 0
\u2202L(\u3b81, \u3b82, ..., \u3b8k)
\u2202\u3b82
= 0
...
...
...
\u2202L(\u3b81, \u3b82, ..., \u3b8k)
\u2202\u3b8k
= 0
Exemplo:
Determinar os estimadores dos parâmetros µ e \u3c32 da distribuição Normal pelo
método de Máxima Verossimilhança.
Solução:
L(µ, \u3c32) = f(x1; µ, \u3c3
2)f(x2; µ, \u3c3
2)...f(xn; µ, \u3c3
2).
=
1
\u3c3
\u221a
2pi
· e\u2212 12(x1\u2212µ\u3c3 )
2 1
\u3c3
\u221a
2pi
· e\u2212 12(x2\u2212µ\u3c3 )
2
. . .
1
\u3c3
\u221a
2pi
· e\u2212 12(xn\u2212µ\u3c3 )
2
=
1
(2pi\u3c32)n/2
· e
\u2211n
i=1
{
\u2212 1
2(
xi\u2212µ
\u3c3 )
2
}
lnL(µ, \u3c32) = \u2212n
2
ln \u3c32 \u2212 n
2
ln(2pi)\u2212
n\u2211
i=1
{
1
2
(
xi \u2212 µ
\u3c3
)2}
100
\u2202L(µ, \u3c32)
\u2202µ
=
1
\u3c32
n\u2211
i=1
(xi \u2212 µ) =
\u2211n
i=1 xi \u2212 nµ
\u3c32
Igualando-se a zero a derivada acima, tem-se que o estimador de máxima
verossimilhança de µ é,
µ\u2c6 =
\u2211n
i=1 xi
n
= x¯
Analogamente,
\u2202L(µ, \u3c32)
\u2202\u3c32
= \u2212 n
2\u3c32
+
\u2211n
i=1(xi \u2212 µ)2
2\u3c34
=
\u2212n\u3c32 +\u2211ni=1(xi \u2212 nµ)2
2\u3c34
= 0
Igualando-se a zero a derivada acima, e substituindo-se o estimador de µ encontrado
acima, tem-se que o estimador de máxima verossimilhança de \u3c32 é
\u3c3\u2c62 =
\u2211n
i=1(xi \u2212 x¯)2
n
4.3 Estimadores Não Tendenciosos
Um estimador \u3b8\u2c6 é um estimador não tendencioso de um parâmetro \u3b8, se E(\u3b8\u2c6) = \u3b8,
para todo possível valor de \u3b8. Em outras palavras, um estimador do parâmetro
\u3b8 é não tendencioso se sua esperança (ou média) é igual ao verdadeiro valor
(desconhecido) de \u3b8
Exemplo:
Vimos que os estimadores dos momentos e de máxima verossimilhança de µ e \u3c32 da
distribuição normal são dados por:
µ\u2c6 = x¯
\u3c3\u2c62 =
\u2211n
i=1(xi \u2212 x¯)2
n
Provar que x¯ é um estimador não tendencioso de µ, mas \u3c3\u2c62 é um estimador
tendencioso de \u3c32. Encontrar um estimador não tendencioso de \u3c32. (Fazer como
série de exercícios).
101
4.4 A Distribuição \u3c72
Uma distribuição Gama com \u3b1 = n
2
e \u3b2 = 1
2
é denominada distribuição \u3c72 com n
graus de liberdade, e sua f.d.p. é dada por
f(x) =
{
1
2n/2\u393(n
2
)
x
n
2
\u22121e\u2212
x
2 para x > 0
0 para x \u2264 0
A média e variância de uma v.a. X que possui uma distribuição \u3c72 são dadas por:
E(X) = n (4.3)
V ar(X) = 2n (4.4)
Teorema 1:
Se as variáveis X1, X2, ..., Xk são independentes e se Xi possui uma distribuição \u3c72
com ni graus de liberdade (i = 1, 2, ..., k), então a soma X1 +X2 + ... +Xk possui
uma distribuição \u3c72 com n1, n2, ..., nk graus de liberdade.
Teorema 2:
Se as v.a. X1, X2, ..., Xk são independentes e identicamente distribuidas, cada uma
delas com distribuição normal padrão então a soma X21 + X22+, ..., X2k possui uma
distribuição \u3c72 com k graus de liberdade.
Exemplo:
Suponha que X1, X2, ..., Xn formem uma amostra aleatória de uma distribuição
normal com média µ e variância \u3c32. Encontre a distribuição de
a)
n(X¯ \u2212 µ)2
\u3c32
b)
\u2211n
i=1(Xi \u2212 µ)2
\u3c32
.
Solução
102
a) Sabemos que
X¯ \u2212 µ
\u3c3/
\u221a
n
~ N(0, 1)
Portanto,
(X¯ \u2212 µ)2
\u3c32/n
~ \u3c721
b) Temos que
Xi \u2212 µ
\u3c3
~ N(0, 1)
Portanto,
(Xi \u2212 µ)2
\u3c32
~ \u3c721
Somando estas n v.a., tem-se que\u2211n
i=1(Xi \u2212 µ)2
\u3c32
~ \u3c72n.
Observação:
1. Se µ for substituido por X¯, então temos que\u2211n
i=1(Xi \u2212 X¯)2
\u3c32
~ \u3c72n\u22121.
Ou seja,
(n\u2212 1)s2
\u3c32
~ \u3c72n\u22121, onde s
2 =
\u2211n
i=1(Xi \u2212 X¯)2
n\u2212 1
2. Pela esperança e variância de uma v.a. com distribuição \u3c72, temos que:
E
(
(n\u2212 1)s2
\u3c32
)
= n\u2212 1 \u21d2 E(s2) = \u3c32
Ou seja, a variância amostral, com divisor (n-1), é um estimador não tendencioso
103
da variãncia populacional. Além disto,
V ar
(
(n\u2212 1)s2
\u3c32
)
= 2(n\u2212 1) \u21d2 (n\u2212 1)
2
\u3c34
V ar(s2) = 2(n\u2212 1) \u21d2 V ar(s2) = 2\u3c3
4
n\u2212 1
Exemplo:
Suponha que X1, X2, ..., Xn formem uma amostra aleatória de uma