Estatistica aplicada
313 pág.

Estatistica aplicada


DisciplinaBioestatística I3.604 materiais30.270 seguidores
Pré-visualização50 páginas
682 882 999
Usando \u3b1 = 0.01, decida se estas observações podem ser consideradas como proveni-
entes da população definida pelo número de plaquetas no sangue de pessoas saudáveis
do sexo masculino.
10. Os resultados de um investimento feito em 20 tipos distintos de \u2019stocks\u2019, seleccionados
aleatoriamente de um armazém, passados 12 meses, foram os seguintes:
9.1 5.0 7.3 7.4 5.5 8.6 7.0 4.3 4.7 8.0
4.0 8.5 6.4 6.1 5.8 9.5 5.2 6.7 8.3 9.2
Teste a hipótese nula de que o resultado do investimento segue uma distribuição
normal.
11. As chamadas de longa distância, que passam por uma central telefónica, formam um
processo aleatório, em que o intervalo de tempo entre as chamadas parece seguir uma
distribuição exponencial.
As primeiras dez chamadas de uma 2afeira, depois das 13H00, ocorreram às 13H06,
13H08, 13H16, 13H22, 13H23, 13H34, 13H44, 13H47, 13H51 e 13H57.
Face a estes valores, teste a hipótese nula formulada em termos da distribuição ex-
ponencial.
12. Um gerente de armazém quer testar a hipótese de que os seus clientes chegam ale-
atoriamente ao armazém. Para isso, registou os tempos entre sucessivas chegadas,
durante uma manhã.
190 CAPÍTULO 9. TESTES DE AJUSTE DE DISTRIBUIÇÕES
Estes tempos, em minutos, foram os seguintes:
3.6 22.1 38.0 3.3 10.1
14.2 1.4 6.1 12.7 4.6
10.8 6.2 4.2 3.8 8.2
Teste a hipótese de que os tempos entre chegadas seguem uma distribuição exponen-
cial.
13. Fez-se uma experiência num laboratório, para o controlo da temperatura em salas,
que envolveu 6 homens e 6 senhoras. Pediu-se-lhes que indicassem a temperatura
(oF ), na sala, que os fizesse sentir mais confortáveis. Os resultados obtidos foram os
seguintes:
Homens Senhoras
74 75
74 77
75 78
80 79
81 77
78 75
X1 = 77 X2 = 76.8
s1 = 3.1 s2 = 1.6
Acha que as temperaturas consideradas mais confortáveis pelos homens são as mes-
mas do que as das senhoras? Justifique.
Use \u3b1 = 0.05.
14. Foram feitas medições da viscosidade de uma certa substância, em dois dias diferen-
tes. Os resultados obtidos foram:
1odia 37.0 31.4 34.4 33.4 34.9 36.2 31.0
33.5 33.7 33.4 34.8 30.8
2odia 28.4 31.3 28.7 32.1 31.9 32.8 30.2
30.2 32.4 30.7
Poder-se-á dizer que a população (descrita pela variável X \u2261 viscosidade da subs-
tância) mudou de um dia para o outro? Justifique a utilização do teste estatístico.
15. Verifique se os dados apresentados dão indicação da existência de diferenças nos
comprimentos das palavras em latim. As observações representam o número de letras
das palavras em latim, seleccionadas aleatoriamente dos três géneros: masculino,
feminino e neutro:
masculino feminino neutro
5 7 4 6 7 8
7 5 8 3 10 7
6 9 5 6 7 12
9.5. EXERCÍCIOS 191
16. Para verificar se um período maior, entre o último dia de aulas e o dia do exame final,
afecta significativamente o desempenho dos alunos no exame, fez-se uma experiência
com os 48 alunos de uma turma. Estes, foram divididos, aleatoriamente, em quatro
grupos de 12 estudantes cada. Para o 1ogrupo, deixou-se passar dois dias de intervalo.
O 2ogrupo fez exame 4 dias após o fim das aulas. Ao 3ogrupo foi dado um intervalo
de 6 dias e ao grupo 4, 8 dias. As classificações obtidas no exame foram as seguintes
(de 0 a 100):
1ogrupo 2ogrupo 3ogrupo 4ogrupo
48 71 80 48 71 81 38 73 83 58 79 93
61 74 82 42 70 77 58 74 87 49 77 84
67 75 87 67 75 92 71 79 94 73 80 94
68 79 89 62 73 89 70 75 90 74 84 97
Que conclusões pode retirar desta experiência?
17. Suponha que a espessura de uma componente usada num semicondutor é a sua di-
mensão crítica e que as medidas da espessura, de uma amostra aleatória de 18 destas
componentes, têm variância s2 = 0.68 cm. Considera-se que o processo está con-
trolado se a variância da espessura não é superior a 0.36. Assumindo que as me-
dições constituem uma amostra aleatória duma população normal, teste a hipótese
nula \u3c32 = 0.36 contra a hipótese alternativa \u3c32 > 0.36 a um nível de significância
\u3b1 = 0.05.
18. Ao comparar a variabilidade da tensão em dois tipos de aço, uma experiência conduziu
aos seguintes resultados: n1 = 13, s21 = 19.2, n2 = 16 e s22 = 3.5 numa determinada
unidade. Assumindo que as medidas constituem amostras aleatórias independentes
provenientes de duas populações normais, teste a hipótese nula \u3c321 = \u3c322 contra a
hipótese alternativa \u3c321 \ufffd= \u3c322 a um nível de significância \u3b1 = 0.05.
192 CAPÍTULO 9. TESTES DE AJUSTE DE DISTRIBUIÇÕES
Capítulo 10
Testes de regressão
Seja Y uma variável aleatória, resultado de uma experiência, cuja distribuição depende
não só de certos parâmetros desconhecidos, como também de uma variável não aleatória
X.
Sejam X1, X2, ..., Xn os valores escolhidos arbitrariamente para X e Yi (i = 1, ..., n) os
correspondentes valores observados da experiência.
Uma vez conhecidos os pares (Xi, Yi), estes podem ser usados para obter informações
acerca dos parâmetros da distribuição da v.a. Y que são desconhecidos.
10.1 Regressão linear e simples
Suponha que as v.a. Yi são normalmente distribuídas, com médias respectivamente iguais
a \u3b1 + \u3b2(Xi \u2212X) = \u3b1 + \u3b2xi e variância comum \u3c32 (i = 1, ..., n).
Os parâmetros \u3b1 e \u3b2 da média e \u3c32 de variância são desconhecidos.
A f.d.p. conjunta das variáveis Y1, ..., Yn é
L(\u3b1, \u3b2, \u3c32;Y1, ..., Yn) = (
1
2\u3c0\u3c32
)
n
2 exp[\u2212 1
2\u3c32
n\u2211
i=1
(Yi \u2212 \u3b1\u2212 \u3b2xi)2] .
Os estimadores de máxima verosimilhança, para os parâmetros \u3b1, \u3b2 e \u3c32 são
\u3b1\u2dc =
\u2211n
i=1 Yi
n
= Y (10.1)
\u3b2\u2dc =
\u2211n
i=1(Xi \u2212X)(Yi \u2212 Y )\u2211n
i=1(Xi \u2212X)2
=
\u2211n
i=1(Xi \u2212X)Yi\u2211n
i=1(Xi \u2212X)2
(10.2)
\u3c3\u2dc2 =
1
(n\u2212 2)
n\u2211
i=1
[Yi \u2212 \u3b1\u2dc\u2212 \u3b2\u2dc(Xi \u2212X)]2 (10.3)
Veremos, já a seguir, quaís as distribuições estatísticas destes estimadores.
193
194 CAPÍTULO 10. TESTES DE REGRESSÃO
Tanto \u3b1\u2dc como \u3b2\u2dc são funções lineares nas v.a. Y1, Y2, ... e Yn, e por isso seguem também
distribuições normais.
A média da distribuição de \u3b1\u2dc é \u3b1, sendo portanto um estimador não tendencioso. A
sua variância é igual a \u3c32
n
.
A média de \u3b2\u2dc é o próprio \u3b2 e a variância é igual a
\u3c32\u2211n
i=1(Xi \u2212X)2
.
Como
Yi \u2212 \u3b1\u2212 \u3b2(Xi \u2212X) = (\u3b1\u2dc\u2212 \u3b1) + (\u3b2\u2dc \u2212 \u3b2)(Xi \u2212X) + Yi \u2212 \u3b1\u2dc\u2212 \u3b2\u2dc(Xi \u2212X) ,
também
n\u2211
i=1
[Yi \u2212 \u3b1\u2212 \u3b2(Xi \u2212X)]2
=
n\u2211
i=1
(\u3b1\u2dc\u2212 \u3b1)2 +
n\u2211
i=1
(\u3b2\u2dc \u2212 \u3b2)2(Xi \u2212X)2 +
n\u2211
i=1
[Yi \u2212 \u3b1\u2dc\u2212 \u3b2\u2dc(Xi \u2212X)]2
ou seja
n\u2211
i=1
[Yi \u2212 \u3b1\u2212 \u3b2(Xi \u2212X)]2 = n(\u3b1\u2dc\u2212 \u3b1)2 + (\u3b2\u2dc \u2212 \u3b2)2
n\u2211
i=1
(Xi \u2212X)2 + (n\u2212 2)\u3c3\u2dc2
e
Q = Q1 + Q2 + Q3,
com Q,Q1, Q2 e Q3 formas quadráticas nas variáveis Yi.
Sabe-se que Q
\u3c32
é \u3c72(n),
Q1
\u3c32
e Q2
\u3c32
são \u3c72(1) e como Q3 \u2265 0, pela aplicação do teorema das
formas quadráticas, temos
Q3
\u3c32
=
(n\u2212 2)\u3c3\u2dc2
\u3c32
\u223c \u3c72(n\u2212 2).
Definindo as seguintes v.a., \u2019estatísticas\u2019,
T1 =
\u3b1\u2dc\u2212\u3b1
\u3c3\u221a
n\u221a
(n\u22122)\u3c3\u2dc2
\u3c32(n\u22122)
=
\u3b1\u2dc\u2212 \u3b1\u221a
\u3c3\u2dc2
n
(10.4)
cuja distribuição é t-Student com n\u2212 2 graus de liberdade e
T2 =
\u3b2\u2dc\u2212\u3b2
\u3c3\u221a\u2211n
1
(Xi\u2212X)2\u221a
(n\u22122)\u3c3\u2dc2
\u3c32(n\u22122)
=
\u3b2\u2dc \u2212 \u3b2\u221a
\u3c3\u2dc2\u2211n
1 (Xi\u2212X)2
(10.5)
10.1. REGRESSÃO LINEAR E SIMPLES 195
cuja distribuição é também t-Student com n \u2212 2 graus de liberdade, é possível basear os
testes nestas \u2019estatísticas\u2019.
Testes de hipóteses:
Para se verificar se o valor esperado da variável resposta, Y , varia linearmente com a
variável controlável X, a hipótese nula é
H0 : \u3b2 = 0 (Y não varia linearmente com X)
contra a hipótese alternativa unilateral
H1 : \u3b2 > 0
ou contra a hipótese alternativa bilateral
H1 : \u3b2 \ufffd= 0.
A \u2019estatística\u2019 para este teste é T2 = \u3b2\u2dc\u221a
\u3c3\u2dc2\u2211n
1
(Xi\u2212X)2
de acordo com a hipótese nula.
Se a alternativa H1 : \u3b2 > 0 (unilateral) for escolhida, o teste consiste em:
rejeitar H0 se T2 \u2265 c
com c determinado de,
\u3b1 = Pr[T2 \u2265 c;H0].
A \u2019estatística\u2019 T2 pode também ser usada para determinar intervalos de confiança para
o parâmetro \u3b2.
Do mesmo modo, a \u2019estatística\u2019 T1 pode ser usada para calcular intervalos de confiança
e testes de hipóteses relacionados com o parâmetro \u3b1 e a \u2019estatística\u2019 (n\u22122)\u3c3\u2dc
2