Estatistica aplicada
313 pág.

Estatistica aplicada


DisciplinaBioestatística I3.603 materiais30.258 seguidores
Pré-visualização50 páginas
e Yi a média da
pontuação da sua namorada.
As variáveis X e Y podem ser independentes, como no exemplo 3.
Algumas medidas de correlação têm funções de distribuição que não dependem da de
(X, Y ) se X e Y forem independentes, sendo por isso usadas como \u2019estatísticas\u2019 em testes
não - paramétricos de independência.
A medida de correlação, agora seleccionada, é função das graduações atribuídas às
observações. Possui função distribuição que não depende da de (X, Y ), quando X e Y são
variáveis aleatórias independentes e contínuas.
Considere uma amostra aleatória bivariada, de tamanho n, (X1, Y1), ..., (Xn, Yn). Seja
R(Xi) a graduação do valor Xi, quando comparado com os outros X \u2032s (i = 1, 2, ..., n). Do
mesmo modo, R(Yi) é a graduação de Yi, considerando o conjunto dos Y \u2032s.
Os dados também podem ser observações de natureza não-numérica e que ocorrem
aos (n) pares. A graduação pode estar baseada na qualidade das observações (da pior
observação para a melhor) ou na ordem de preferência.
A medida de correlação de Spearman, RS, é definida por
RS =
\u2211n
i=1[R(Xi)\u2212 n+12 ][R(Yi)\u2212 n+12 ]
n(n2\u22121)
12
(11.3)
ou
RS = 1\u2212 6T
n(n2 \u2212 1) com T =
n\u2211
i=1
[R(Xi)\u2212 R(Yi)]2
caso não existam observações repetidas.
Existindo repetições deve usar-se a expressão
RS =
\u2211n
i=1 R(Xi)R(Yi)\u2212 n(n+12 )2\u221a\u2211n
i=1 R(Xi)
2 \u2212 n(n+1
2
)2.
\u221a\u2211n
i=1 R(Yi)
2 \u2212 n(n+1
2
)2
(11.4)
que não é mais do que o coeficiente de Pearson, R, calculado com as graduações.
214 CAPÍTULO 11. TESTES DE INDEPENDÊNCIA ESTOCÁSTICA
De notar, que a média das graduações dos X \u2032s (e a dos Y \u2032s) é n+1
2
, uma vez que
R(X) =
1
n
n\u2211
i=1
R(Xi) =
1
n
n\u2211
i=1
i =
1
n
n(n + 1)
2
=
n + 1
2
.
Também
n\u2211
i=1
[R(Xi)\u2212R(X)]2 =
n\u2211
i=1
(i\u2212 n + 1
2
)2
=
n\u2211
i=1
[i2 \u2212 i(n + 1) + (n + 1
2
)2] =
n(n2 \u2212 1)
12
.
Assim, a expressão do coeficiente de correlação de Pearson, R, em 11.1,. reduz-se à
expressão definida para o coeficiente de Spearman, RS (equação (11.3)), quando os dados,
Xi e Yi, são substituídos pelas suas graduações, R(Xi) e R(Yi).
O coeficiente de correlação de Spearman usa-se como \u2019estatística\u2019 para o teste de inde-
pendência entre duas variáveis aleatórias. RS não é sensível a alguns tipos de dependência.
As dependências que podem ser detectadas vêm expressas nas hipóteses,
A. Teste bilateral
H0 : As variáveis X e Y são independentes.
H1 : (a) Existe uma tendência para os maiores valores de X formarem pares com os
maiores valores de Y , ou
(b) Existe uma tendência para os menores valores de X formarem pares com os
maiores valores de Y .
B. Teste unilateral para correlação positiva
H0 : As variáveis X e Y são independentes.
H1 : Existe uma tendência para os maiores valores de X e de Y formarem pares.
C. Teste unilateral para correlação negativa
H0 : As variáveis X e Y são independentes.
H1 : Existe uma tendência para os menores valores de X formarem pares com os maiores
valores de Y e vice-versa.
As hipóteses alternativas referem a existência de uma correlação entre X e Y , de tal
modo que a hipótese nula de "X e Y não estão correlacionadas"é mais correcta do que a
afirmação de independência entre X e Y .
Assim, em B.,
11.2. TESTE DE SPEARMAN BASEADO EM GRADUAÇÕES 215
rejeita-se H0 se RS > c,
em que c é o ponto crítico da Tabela A.17 que corresponde a 1\u2212 \u3b1, sendo \u3b1 o nível de
significância;
Em C.,
rejeita-se H0 se RS < c
sendo c o ponto que corresponde a \u3b1;
Em A.,
rejeita-se H0 se RS > c1 ou RS < c2,
sendo c1 o ponto crítico da Tabela A.17 que corresponde a 1 \u2212 \u3b12 e c2 o ponto crítico
que corresponde a \u3b1
2
, sendo \u3b1 o nível de significância.
Por vezes, é possível usar a \u2019estatística\u2019 T definida por
T =
n\u2211
i=1
[R(Xi)\u2212 R(Yi)]2 . (11.5)
O teste baseado nesta \u2019estatística\u2019 é conhecido por Hotelling-Pabst. A distribuição de
T é diferente da de RS. Os pontos críticos da distribuição de T estão representados noutra
tabela diferente da Tabela A.17. Contudo, note-se que T é grande quando RS for pequeno
e vice-versa. Por isso, a H0 em B. é rejeitada, ao nível de significância \u3b1, se T é menor do
que o ponto crítico que corresponde a \u3b1. Também a H0 em C. é rejeitada se T > c, sendo
c o ponto que corresponde a 1\u2212 \u3b1.
216 CAPÍTULO 11. TESTES DE INDEPENDÊNCIA ESTOCÁSTICA
11.3 Exercícios
1. Considere a seguinte tabela de valores,
X 68 66 72 73 66
Y 64 66 71 70 69
(a) Calcule o coeficiente de correlação da amostra, supondo que as variáveis X e Y
seguem distribuições Normais.
(b) Ao nível de significância 0.05, acha que pode rejeitar a hipótese nula de que não
existe correlação entre as duas variáveis.
2. Um casal que costuma jogar \u2019bowling\u2019, registou os pontos ganhos por cada um, em
10 tentativas, para saber se haveria alguma correlação entre os pontos. Os valores
obtidos na experiência foram
tentativa 1 2 3 4 5 6 7 8 9 10
pontos: dele 147 158 131 142 183 151 196 129 155 158
dela 122 128 125 123 115 120 108 143 124 123
(a) Calcule o coeficiente de correlação desta amostra.
(b) Teste a hipótese de independência, usando um teste bilateral, baseado na esta-
tística calculada em a).
3. Os estudantes de um curso de Física tiveram de realizar uma experiência que consistia
em atirar uma bola de uma certa altura e medir a velocidade, em metros por segundo,
em vários pontos do trajecto. A velocidade, teoricamente, deve aumentar linearmente
com o tempo, pois a bola está sujeita à gravidade. Não sendo fácil medir a velocidade
da bola, depois de um período de tempo fixo, as observações dos estudantes não caem
necessariamente sobre a recta. Teste a relação sugerida teoricamente, a um nível de
significância 0.05. Os resultados foram os seguintes:
tempo (segundos) 0 0.2 0.4 0.6 0.8
velocidade (m/seg) 0 1.82 3.58 6.01 7.88
Apêndice A
Tabelas Estatísticas
Tabela A.1: Números aleatórios
Linha Números aleatórios
101 19223 95034 05756 28713 96409 12531 42544 82853
102 73676 47150 99400 01927 27754 42648 82425 36290
103 45467 71709 77558 00095 32863 29485 82226 90056
104 52711 38889 93074 60227 40011 85848 48767 52573
105 95592 94007 69971 91481 60779 53791 17297 59335
106 68417 35013 15529 72765 85089 57067 50211 47487
107 82739 57890 20807 47511 81676 55300 94383 14893
108 60940 72024 17868 24943 61790 90656 87964 18883
109 36009 19365 15412 39638 85453 46816 83485 41979
110 38448 48789 18338 24697 39364 42006 76688 08708
111 81486 69487 60513 09297 00412 71238 27649 39950
112 59636 88804 04634 71197 19352 73089 84898 45785
113 62568 70206 40325 03699 71080 22553 11486 11776
114 45149 32992 75730 66280 03819 56202 02938 70915
115 61041 77684 94322 24709 73698 14526 31893 32592
116 14459 26056 31424 80371 65103 62253 50490 61181
117 38167 98532 62183 70632 23417 26185 41448 75532
118 73190 32533 04470 29669 84407 90785 65956 86382
119 95857 07118 87664 92099 58806 66979 98624 84826
120 35476 55972 39421 65850 04266 35435 43742 11937
121 71487 09984 29077 14863 61683 47052 62224 51025
122 13873 81598 95052 90908 73592 75186 87136 95761
123 54580 81507 27102 56027 55892 33063 41842 81868
124 71035 09001 43367 49497 72719 96758 27611 91596
125 96746 12149 37823 71868 18442 35119 62103 39244
126 96927 19931 36089 74192 77567 88741 48409 41903
127 43909 99477 25330 64359 40085 16925 85117 36071
217
218 APÊNDICE A. TABELAS ESTATÍSTICAS
A.1 Continuação
Linha Números aleatórios
128 15689 14227 06565 14374 13352 49367 81982 87209
129 36759 58984 68288 22913 18638 54303 00795 08727
130 69051 64817 87174 09517 84534 06489 87201 97245
131 05007 16632 81194 14873 04197 85576 45195 96565
132 68732 55259 84292 08796 43165 93739 31685 97150
133 45740 41807 65561 33302 07051 93623 18132 09547
134 27816 78416 18329 21337 35213 37741 04312 68508
135 66925 55658 39100 78458 11206 19876 87151 31260
136 08421 44753 77377 28744 75592