Buscar

Normalidade dos Dados e dos Resíduos

Prévia do material em texto

Normalidade dos dados e dos resíduos 
 
1. Teste de aderência (qui-quadrado) 
 
ƒ útil para verificar se a distribuição das freqüências observadas dos dados se ajusta a um 
modelo teórico pré-determinado 
ƒ recomendado para amostras grandes ( 50>n ) e tem por finalidade comparar se as 
freqüências observadas na amostra estão próximas das freqüências esperadas para a 
distribuição normal. 
ƒ Se as freqüências esperadas não diferirem estatisticamente das freqüências observadas, 
pode-se inferir que a característica em estudo da população tem distribuição normal; de 
outra maneira, possui distribuição diversa. 
ƒ O teste que mede a eficiência do ajuste da distribuição, ou seja, o quanto a freqüência 
observada está próxima da freqüência esperada, daí o nome de aderência, é o teste de qui-
quadrado (χ 2 ). Como todo teste estatístico, alguns passos devem ser seguidos até à 
conclusão. 
1o Passo: Formulação das hipóteses 
Ho : As freqüências observadas não diferem das freqüências esperadas em relação à distribuição 
normal, ou seja, a característica em estudo da população tem distribuição normal. 
H1 : As freqüências observadas diferem das freqüências esperadas em relação à distribuição normal, 
ou seja, a característica em estudo da população não tem distribuição normal. 
 
2o Passo: Escolha da significância α 
 
3o Passo: Estatística apropriada 
 
 ∑ −=χ
=
k
i i
ii
c
f
ff
1
2
2
ˆ
)ˆ(
; para v = k – p – 1, onde: :if freqüência observada na i-ésima classe; ifˆ : 
freqüência esperada na i-ésima classe; v : graus de liberdade; k : número de classes da distribuição 
de freqüência; p : número de parâmetros estimados. 
 
4o Passo: Região crítica 
 
 
 
Figura 2.1. Distribuição qui-quadrado (χ 2 ) mostrando as regiões de aceitação (RAH0) e rejeição 
(RRH0) de Ho de um teste unilateral à direita, à significância α e v graus de liberdade. 
 
5o Passo: Conclusão 
 Quando o valor da estatística apropriada 2cχ estiver dentro da região de aceitação de Ho 
(Figura 2.1), a característica em estudo da população seguirá a distribuição normal. Isto ocorrerá 
quando 22 tc χ<χ , onde 2tχ é o valor crítico obtido na tabela em função da significância α e v graus 
de liberdade; caso contrário, rejeita-se Ho. 
 
1o Exemplo: Para a realização do teste, a etapa inicial é encontrar os valores da média e do desvio 
padrão da amostra para os dados agrupados na distribuição de freqüência. Para ilustrar o cálculo, 
serão utilizados os dados da tabela 2.1, que se referem à distribuição de freqüência da massa da 
matéria fresca de sementes de Vicia graminea Sm. 
 
 17
Tabela 2.1. Distribuição de freqüência da massa da matéria fresca (mg) de uma amostra de 500 
sementes de Vicia graminea Sm. 
 
Massa (mg) ix
(a) if
(b) 2ix ii xf 
2
ii xf 
1,25 ├ 1,75 1,5 1 2,25 1,5 2,25 
1,75 ├ 2,25 2,0 3 4,00 6,0 12,00 
2,25 ├ 2,75 2,5 14 6,25 35,0 87,50 
2,75 ├ 3,25 3,0 74 9,00 222,0 666,00 
3,25 ├ 3,75 3,5 119 12,25 416,5 1.457,75 
3,75 ├ 4,25 4,0 155 16,00 620,0 2.480,00 
4,25 ├ 4,75 4,5 91 20,25 409,5 1.842,75 
4,75 ├ 5,25 5,0 26 25,00 130,0 650,00 
5,25 ├ 5,75 5,5 12 30,25 66,0 363,00 
5,75 ├ 6,25 6,0 4 36,00 24,0 144,00 
6,25 ├ 6,75 6,5 1 42,25 6,5 42,25 
Total 500 1.937,0 7.747,50 
(a) Ponto médio da classe; (b) Freqüência observada, sendo: nf
k
i
i =∑=1 . 
mg9,3874,3
500
0,937.1
1
1 ≅==
∑
∑
=
=
=
k
i
i
i
k
i
i
f
xf
x , onde: :ix ponto médio da i-ésima classe; :if freqüência 
observada da i-ésima classe; k : número de classes da distribuição de freqüência. 
 mg7,0699,0
499
562,243
1
)(
1
2
1
2
≅==−
∑
−∑
=
=
=
n
n
xf
xf
s
k
i
iik
i
ii
, onde: :ix ponto médio da i-ésima classe; 
:if freqüência observada da i-ésima classe; x : média da amostra; k : número de classes da 
distribuição de freqüência; n : tamanho da amostra. 
 
Tabela 2.2. Distribuição das freqüências observadas e esperadas da massa da matéria fresca (mg) de 
uma amostra de 500 sementes de Vicia graminea Sm. 
 
Massa (mg) 
(1) 
Li 
(2) 
zi 
(3) 
Probabilidade
(4) 
rfˆ 
(5) 
ifˆ 
(6) 
f i 
1,25 ├ 1,75 1,25 -3,78 0,4999 0,0010 0,50 1 
1,75 ├ 2,25 1,75 -3,07 0,4989 0,0080 4,00 3 
2,25 ├ 2,75 2,25 -2,36 0,4909 0,0414 20,70 14 
2,75 ├ 3,25 2,75 -1,64 0,4495 0,1257 62,85 74 
3,25 ├ 3,75 3,25 -0,93 0,3238 0,2406 120,30 119 
3,75 ├ 4,25 3,75 -0,21 0,0832 0,2748 137,40 155 
4,25 ├ 4,75 4,25 0,50 0,1915 0,1954 97,70 91 
4,75 ├ 5,25 4,75 1,21 0,3869 0,0863 43,15 26 
5,25 ├ 5,75 5,25 1,93 0,4732 0,0227 11,35 12 
5,75 ├ 6,25 5,75 2,64 0,4959 0,0037 1,85 4 
6,25 ├ 6,75 6,25 3,36 0,4996 0,0004 0,20 1 
Total 1,0000 500 500 
x = 3,9 mg; s = 0,7 mg 
 18
(1) Valor do limite inferior ( )Li da classe de massa da matéria fresca. 
(2) Valores de zi calculados segundo a expressão s
xL
z ii
−= . 
(3) Valores de probabilidades (áreas) obtidas na tabela A1 a partir dos valores de zi (coluna 2), 
considerando-se zi como valor absoluto na entrada da tabela. 
(4) Valores das freqüências relativas esperadas ( rfˆ ). Para todos os intervalos de classe, com 
exceção da classe que contém a média, as freqüências relativas esperadas da classe são 
calculadas pela diferença absoluta entre a probabilidade da classe e a imediatamente posterior. 
Então, para se obter a freqüência relativa esperada da classe 2,25├ 2,75, calcula-se 0,4909-
0,4495 = 0,0414. Para obter a freqüência relativa esperada da classe que contém a média (3,75├ 
4,25), somam-se os valores de probabilidade da classe e a imediatamente posterior (0,0832 + 
0,1915 = 0,2748). O valor da probabilidade da última classe é obtido pela diferença entre 0,5 e 
a probabilidade da classe (0,5000 - 0,4996 = 0,0004). 
(5) Valores das freqüências esperadas ( ifˆ )para a distribuição normal, obtidos pela multiplicação da 
freqüência relativa esperada ( rfˆ ) e nf
k
i
i =∑=1 . Por exemplo, para se obter a freqüência da classe 
4,75├ 5,25, multiplica-se o valor 0,0863 por 500, obtendo-se 43,15. 
(6) Valores das freqüências observadas ( f i ). 
 
 Após a obtenção das freqüências observadas na amostra e esperadas da distribuição normal, 
o teste pode ser aplicado. Os passos para a execução do teste estão apresentados a seguir. 
 
1o Passo: Formulação das hipóteses 
Ho : As freqüências observadas não diferem das freqüências esperadas para distribuição normal, ou 
seja, a massa da matéria fresca das sementes na população segue distribuição normal. 
H1 : As freqüências observadas diferem das freqüências esperadas da distribuição normal, ou seja, a 
massa da matéria fresca das sementes na população não segue distribuição normal. 
 
2o Passo: Significância estabelecida α=0,05 
 
3o Passo: Estatística apropriada 
 Para calcular o valor de qui-quadrado, Cochran (1954) recomenda que as classes sejam 
agrupadas quando a freqüência esperada for menor que 1. Desta forma, um ajuste na distribuição 
das freqüências esperadas da tabela 2.5 deve ser realizado. Para o exemplo, a freqüência esperada 
da classe 1,25├1,75 que tem o valor 0,5; deve ser agrupada com a freqüência da classe 1,75├ 2,25 
que é 4 (Tabela 2.1). Assim, aparecerá uma outra classe com intervalo entre 1,25├ 2,25, cuja 
freqüência agrupada é 4,5 (Tabela 2.3). Este mesmo procedimento deve ser adotado para a classe 
6,25├ 6,75. 
 
 
 
 
 
 
 
 
 
 
 
 
 19
Tabela 2.3. Tabela auxiliar para o cálculo do valor do qui-quadrado da massa da matéria fresca (mg) 
de uma amostra de 500 sementes de Vicia graminea Sm. 
 
Massa (mg) if
(a) ifˆ
(b) iii fff ˆ/)ˆ(
2− 
1,25 ├ 2,25 4 4,50 0,056 
2,25 ├ 2,75 14 20,70 2,169 
2,75 ├ 3,25 74 62,85 1,978 
3,25 ├ 3,75 119 120,30 0,014 
3,75 ├ 4,25 155 137,40 2,254 
4,25 ├ 4,75 91 97,70 0,459 
4,75 ├ 5,25 26 43,15 6,816 
5,25 ├ 5,75 12 11,35 0,037 
5,75 ├ 6,755 2,05 4,245 
Total 500 500 
(a) Valores de freqüência observada; (b) Valores de freqüência esperada. 
 
 
2
cχ = 028,18245,4...169,2056,0 =+++ 
 
4o Passo: Região crítica 
 
 
 
 
 
Figura 2.2. Distribuição qui-quadrado ( 2χ ) mostrando as regiões de aceitação (RAHo) e de rejeição 
(RRHo) de Ho e os valores calculado e tabelado do teste unilateral à direita para 
05,0=α e v = 6. 
 
5o Passo: Conclusão 
 Como o valor calculado 028,182 =χc é maior que o valor tabelado 592,122 =χt , para a 
significância 0,05 e v=6 graus de liberdade, a hipótese Ho é rejeitada e conclui-se que as freqüências 
observadas diferem das freqüências esperadas para a distribuição normal; conseqüentemente, a 
massa de matéria fresca na população não segue a distribuição normal. 
 
2.2.3. Teste de Shapiro-Wilk 
 
ƒ também pode ser aplicado para verificar a normalidade da característica em estudo em uma 
população 
ƒ mais indicado quando o tamanho da amostra ou o número de parcelas é menor que 50 ou 
quando não há empates. 
 
1o Passo: Formulação das hipóteses 
Ho: Os erros (desvios) da característica em estudo seguem a distribuição normal. 
H1: Os erros não seguem a distribuição normal. 
 
2o Passo: Escolha da significância α 
 
3o Passo: Estatística apropriada 
 
 20
 
SQE
gWc
2
= ; sendo: ∑ −=
= +−
m
i
iinni eeag
1
1, )( ; ∑= =
n
i
ieSQE
1
2 e xxe ii −= , 
2
nm = se n é par e 2)1( −= nm se n é ímpar , 
 
onde: nia , : coeficientes obtidos na tabela; n : tamanho da amostra ou número de parcelas; SQE : 
soma de quadrados do erro ou do resíduo. 
 
4o Passo: Conclusão 
 Se o valor Wc for menor que o valor crítico Wt obtido na tabela em função do tamanho da 
amostra (n) e significância α, rejeita-se a hipótese Ho e conclui-se que a característica em estudo da 
população ou os erros não seguem a distribuição normal; caso contrário, aceita-se Ho. 
 
Tabela 2.4. Porcentagem de sementes de Dolichos biflorus L. germinadas em diferentes 
temperaturas (Labouriau & Pacheco, 1979). 
 
Temperatura (oC) ).( )95,0( TstT ± (a) n=r(c) 
Tratamento(b) j=1 j=2 j=3 j=4 j=5 
35,0 ± 0,04 (i=1) 96,0 100,0 98,0 100,0 96,0 
37,8 ± 0,04 (i=2) 76,0 92,0 88,0 84,0 94,0 
38,5 ± 0,03 (i=3) 72,0 94,0 64,0 82,0 32,0 
39,2 ± 0,06 (i=4) 38,0 30,0 54,0 40,0 42,0 
 
Tabela 2.5. Valores calculados dos erros (ei ) para as porcentagens de sementes de Dolichos biflorus 
L. germinadas em diferentes temperaturas. 
 
i ie 
1 -36,8 
2 -10,8 
3 -10,8 
4 -4,8 
5 -2,8 
6 -2,8 
7 -2,0 
8 -2,0 
9 -0,8 
10 0,0 
11 1,2 
12 1,2 
13 2,0 
14 2,0 
15 3,2 
16 5,2 
17 7,2 
18 13,2 
19 13,2 
20 25,2 
 
Seguindo os passos para a execução do teste, tem-se: 
 
 
 21
1o Passo: Formulação das hipóteses 
Ho: Os erros das porcentagens de sementes germinadas de Dolichos biflorus L. se ajustam à 
distribuição normal. 
H1: Os erros das porcentagens de sementes germinadas de Dolichos biflorus L. não se ajustam à 
distribuição normal. 
 
2o Passo: Significância estabelecida α=0,05 
 
3o Passo: Estatística apropriada 
 Como para o exemplo n é par, então m=10 e o valor de g será dado por: 
 
6552,48)0,02,1(0140,0...)8,102,13(3211,0)8,362,25(4734,0 =−+++++=g ; 
 
onde os valores dos coeficientes nia , são obtidos na tabela, em função do tamanho da amostra ou 
do número de parcelas. 
 Para o cálculo da estatística apropriada Wc é necessário obter também a soma dos erros ao 
quadrado, ou seja, 4,718.2=SQE ; 
 
e a estatística apropriada do teste é: 8708,0=cW . 
 
4o Passo: Conclusão 
 Como o valor calculado 8708,0=cW é menor que o valor crítico tabelado 905,0=tW 
obtido na tabela para 20=n e significância =α 0,05; rejeita-se Ho e conclui-se que os erros das 
porcentagens de germinação de sementes de Dolichos biflorus L. não seguem a distribuição normal.

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes