A maior rede de estudos do Brasil

Grátis
6 pág.
Normalidade dos Dados e dos Resíduos

Pré-visualização | Página 1 de 2

Normalidade dos dados e dos resíduos 
 
1. Teste de aderência (qui-quadrado) 
 
ƒ útil para verificar se a distribuição das freqüências observadas dos dados se ajusta a um 
modelo teórico pré-determinado 
ƒ recomendado para amostras grandes ( 50>n ) e tem por finalidade comparar se as 
freqüências observadas na amostra estão próximas das freqüências esperadas para a 
distribuição normal. 
ƒ Se as freqüências esperadas não diferirem estatisticamente das freqüências observadas, 
pode-se inferir que a característica em estudo da população tem distribuição normal; de 
outra maneira, possui distribuição diversa. 
ƒ O teste que mede a eficiência do ajuste da distribuição, ou seja, o quanto a freqüência 
observada está próxima da freqüência esperada, daí o nome de aderência, é o teste de qui-
quadrado (χ 2 ). Como todo teste estatístico, alguns passos devem ser seguidos até à 
conclusão. 
1o Passo: Formulação das hipóteses 
Ho : As freqüências observadas não diferem das freqüências esperadas em relação à distribuição 
normal, ou seja, a característica em estudo da população tem distribuição normal. 
H1 : As freqüências observadas diferem das freqüências esperadas em relação à distribuição normal, 
ou seja, a característica em estudo da população não tem distribuição normal. 
 
2o Passo: Escolha da significância α 
 
3o Passo: Estatística apropriada 
 
 ∑ −=χ
=
k
i i
ii
c
f
ff
1
2
2
ˆ
)ˆ(
; para v = k – p – 1, onde: :if freqüência observada na i-ésima classe; ifˆ : 
freqüência esperada na i-ésima classe; v : graus de liberdade; k : número de classes da distribuição 
de freqüência; p : número de parâmetros estimados. 
 
4o Passo: Região crítica 
 
 
 
Figura 2.1. Distribuição qui-quadrado (χ 2 ) mostrando as regiões de aceitação (RAH0) e rejeição 
(RRH0) de Ho de um teste unilateral à direita, à significância α e v graus de liberdade. 
 
5o Passo: Conclusão 
 Quando o valor da estatística apropriada 2cχ estiver dentro da região de aceitação de Ho 
(Figura 2.1), a característica em estudo da população seguirá a distribuição normal. Isto ocorrerá 
quando 22 tc χ<χ , onde 2tχ é o valor crítico obtido na tabela em função da significância α e v graus 
de liberdade; caso contrário, rejeita-se Ho. 
 
1o Exemplo: Para a realização do teste, a etapa inicial é encontrar os valores da média e do desvio 
padrão da amostra para os dados agrupados na distribuição de freqüência. Para ilustrar o cálculo, 
serão utilizados os dados da tabela 2.1, que se referem à distribuição de freqüência da massa da 
matéria fresca de sementes de Vicia graminea Sm. 
 
 17
Tabela 2.1. Distribuição de freqüência da massa da matéria fresca (mg) de uma amostra de 500 
sementes de Vicia graminea Sm. 
 
Massa (mg) ix
(a) if
(b) 2ix ii xf 
2
ii xf 
1,25 ├ 1,75 1,5 1 2,25 1,5 2,25 
1,75 ├ 2,25 2,0 3 4,00 6,0 12,00 
2,25 ├ 2,75 2,5 14 6,25 35,0 87,50 
2,75 ├ 3,25 3,0 74 9,00 222,0 666,00 
3,25 ├ 3,75 3,5 119 12,25 416,5 1.457,75 
3,75 ├ 4,25 4,0 155 16,00 620,0 2.480,00 
4,25 ├ 4,75 4,5 91 20,25 409,5 1.842,75 
4,75 ├ 5,25 5,0 26 25,00 130,0 650,00 
5,25 ├ 5,75 5,5 12 30,25 66,0 363,00 
5,75 ├ 6,25 6,0 4 36,00 24,0 144,00 
6,25 ├ 6,75 6,5 1 42,25 6,5 42,25 
Total 500 1.937,0 7.747,50 
(a) Ponto médio da classe; (b) Freqüência observada, sendo: nf
k
i
i =∑=1 . 
mg9,3874,3
500
0,937.1
1
1 ≅==
∑
∑
=
=
=
k
i
i
i
k
i
i
f
xf
x , onde: :ix ponto médio da i-ésima classe; :if freqüência 
observada da i-ésima classe; k : número de classes da distribuição de freqüência. 
 mg7,0699,0
499
562,243
1
)(
1
2
1
2
≅==−
∑
−∑
=
=
=
n
n
xf
xf
s
k
i
iik
i
ii
, onde: :ix ponto médio da i-ésima classe; 
:if freqüência observada da i-ésima classe; x : média da amostra; k : número de classes da 
distribuição de freqüência; n : tamanho da amostra. 
 
Tabela 2.2. Distribuição das freqüências observadas e esperadas da massa da matéria fresca (mg) de 
uma amostra de 500 sementes de Vicia graminea Sm. 
 
Massa (mg) 
(1) 
Li 
(2) 
zi 
(3) 
Probabilidade
(4) 
rfˆ 
(5) 
ifˆ 
(6) 
f i 
1,25 ├ 1,75 1,25 -3,78 0,4999 0,0010 0,50 1 
1,75 ├ 2,25 1,75 -3,07 0,4989 0,0080 4,00 3 
2,25 ├ 2,75 2,25 -2,36 0,4909 0,0414 20,70 14 
2,75 ├ 3,25 2,75 -1,64 0,4495 0,1257 62,85 74 
3,25 ├ 3,75 3,25 -0,93 0,3238 0,2406 120,30 119 
3,75 ├ 4,25 3,75 -0,21 0,0832 0,2748 137,40 155 
4,25 ├ 4,75 4,25 0,50 0,1915 0,1954 97,70 91 
4,75 ├ 5,25 4,75 1,21 0,3869 0,0863 43,15 26 
5,25 ├ 5,75 5,25 1,93 0,4732 0,0227 11,35 12 
5,75 ├ 6,25 5,75 2,64 0,4959 0,0037 1,85 4 
6,25 ├ 6,75 6,25 3,36 0,4996 0,0004 0,20 1 
Total 1,0000 500 500 
x = 3,9 mg; s = 0,7 mg 
 18
(1) Valor do limite inferior ( )Li da classe de massa da matéria fresca. 
(2) Valores de zi calculados segundo a expressão s
xL
z ii
−= . 
(3) Valores de probabilidades (áreas) obtidas na tabela A1 a partir dos valores de zi (coluna 2), 
considerando-se zi como valor absoluto na entrada da tabela. 
(4) Valores das freqüências relativas esperadas ( rfˆ ). Para todos os intervalos de classe, com 
exceção da classe que contém a média, as freqüências relativas esperadas da classe são 
calculadas pela diferença absoluta entre a probabilidade da classe e a imediatamente posterior. 
Então, para se obter a freqüência relativa esperada da classe 2,25├ 2,75, calcula-se 0,4909-
0,4495 = 0,0414. Para obter a freqüência relativa esperada da classe que contém a média (3,75├ 
4,25), somam-se os valores de probabilidade da classe e a imediatamente posterior (0,0832 + 
0,1915 = 0,2748). O valor da probabilidade da última classe é obtido pela diferença entre 0,5 e 
a probabilidade da classe (0,5000 - 0,4996 = 0,0004). 
(5) Valores das freqüências esperadas ( ifˆ )para a distribuição normal, obtidos pela multiplicação da 
freqüência relativa esperada ( rfˆ ) e nf
k
i
i =∑=1 . Por exemplo, para se obter a freqüência da classe 
4,75├ 5,25, multiplica-se o valor 0,0863 por 500, obtendo-se 43,15. 
(6) Valores das freqüências observadas ( f i ). 
 
 Após a obtenção das freqüências observadas na amostra e esperadas da distribuição normal, 
o teste pode ser aplicado. Os passos para a execução do teste estão apresentados a seguir. 
 
1o Passo: Formulação das hipóteses 
Ho : As freqüências observadas não diferem das freqüências esperadas para distribuição normal, ou 
seja, a massa da matéria fresca das sementes na população segue distribuição normal. 
H1 : As freqüências observadas diferem das freqüências esperadas da distribuição normal, ou seja, a 
massa da matéria fresca das sementes na população não segue distribuição normal. 
 
2o Passo: Significância estabelecida α=0,05 
 
3o Passo: Estatística apropriada 
 Para calcular o valor de qui-quadrado, Cochran (1954) recomenda que as classes sejam 
agrupadas quando a freqüência esperada for menor que 1. Desta forma, um ajuste na distribuição 
das freqüências esperadas da tabela 2.5 deve ser realizado. Para o exemplo, a freqüência esperada 
da classe 1,25├1,75 que tem o valor 0,5; deve ser agrupada com a freqüência da classe 1,75├ 2,25 
que é 4 (Tabela 2.1). Assim, aparecerá uma outra classe com intervalo entre 1,25├ 2,25, cuja 
freqüência agrupada é 4,5 (Tabela 2.3). Este mesmo procedimento deve ser adotado para a classe 
6,25├ 6,75. 
 
 
 
 
 
 
 
 
 
 
 
 
 19
Tabela 2.3. Tabela auxiliar para o cálculo do valor do qui-quadrado da massa da matéria fresca (mg) 
de uma amostra de 500 sementes de Vicia graminea Sm. 
 
Massa (mg) if
(a) ifˆ
(b) iii fff ˆ/)ˆ(
2− 
1,25 ├ 2,25 4 4,50 0,056 
2,25 ├ 2,75 14 20,70 2,169 
2,75 ├ 3,25 74 62,85 1,978 
3,25 ├ 3,75 119 120,30 0,014 
3,75 ├ 4,25 155 137,40 2,254 
4,25 ├ 4,75 91 97,70 0,459 
4,75 ├ 5,25 26 43,15 6,816 
5,25 ├ 5,75 12 11,35 0,037 
5,75 ├ 6,75