Buscar

Guia pratico para utilização do SAEG

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Guia pratico para utilizacao 
do 
 
saEG 
 
SAEG 
INTRODUCAO 	 11 
CAPITULO 1 
Estatistica Descritiva 	 13 
1. Medidas de Posicao 	 	 13 
1.1. Media 	 13 
1.1.1. Media Aritmetica 	 13 
1.1.2. Media Geometrica 	 14 
1.1.3. Media Harmonica 	 14 
1.2. Mediana 	 15 
1.3. Moda 	 15 
2. Medidas de Dispersdo 	 16 
2.1. Amplitude Total 	 16 
2.2. Variancia 	 16 
2.3. Desvio Padrao 	 17 
2.4. Coeficiente de Variacao 	 	 17 
2.5. Erro Padrao da Media 	 17 
3. Medida de Assimetria 	 	 18 
4. Medida de Curtose 	 18 
5. DistribuicOes de Frequencias 	 19 
6. Graficos 	 20 
6.1. Histograma 	 20 
6.2. Grafico Ramo e Foihas 	 20 
6.3. Grefico em Setores 	 21 
6.4. Grano() Polar 	 21 
6.5. Diagrama de Dispersao 	 21 
Exercicio de Aplicacao 1.1 	 21 
ANALISES ESTATESI !CAS NO SAEG 
 
 
SAEG 	 
CAPITULO 2 
Relack) entre Variaveis 	 
1. Correlack Simples 	 
33 
33 
SAEG 	 
4.1. Teste de Cochran 	 
4.2. Teste de Bartlett 	 
Exercicio de Aplicagao 5.1 	 
5. Transformacoes de Dados 	 
61 
62 
63 
68 
1.1. Correlagao de Pearson 	 34 5.1. Transformacao Raiz Ouadrada 	 68 
1.2. Correlacao de Spearman 	 35 5.2. Transformacao Logaritmica 	 68 
2. Correlacao Partial 	 36 5.3. Transformacao Angular 	 69 
Exercicio de Aplicacao 2.1 	 37 Exercicio de Aplicacao 5.2 	 69 
Exercicio de Aplicagao 2.2 	 38 
3. Analise de Trilha 	 42 CAPitULO 6 
4. Correlagao Caniinica 	 43 Estatistica Nal Parametrica 	 71 
Exercicio de Aplicacao 2.3 	 44 1. Teste de Wilcoxon 	 71 
CAPITULO 3 
Exercicio de Aplicacao 6.1 	 	72 
Teste t de Student 	 49 
2. Teste de Kruskal-Wallis 	 72 
1. Caso de Duas Amostras Independentes 	 49 Exercicio de Aplicacao 6.2 	 73 
Exercicio de Aplicacao 3.1 	 51 
2. Caso de Duas Amostras Relacionadas 	 53 CAPITULO 7 
Exercicio de Aplicacao 3.2 	 53 Experimentos corn Urn Fator 	 77 
1. Delineamento Inteiramente Casualizado 	 77 
CAPITULO 4 2. Delineamento em Blocos Casualizados 	 78 
Intervalo de Contianca 	 55 3. Delineamento em Quadrado Latino 	 80 
1. Para a Media Populacional quando a Variancia é Desconhecida 55 4. Testes de Comparacties Multiples 	 81 
1.1. Dados Onundos de uma Amostra 	 55 4.1. Teste de Tukey 	 82 
Exercicio de Aplicacao 4.1 	 55 4.2. Teste de Duncan 	 82 
1.2. Dados Oriundos de urn Delineamento Experimental 	 56 4.3. Teste de Student Newman Keuls 	 83 
4.4. Criteria de Scott-Knott 	 83 
CAPiTU LO 5 Exercicio de Aplicacao 7.1 	 83 
Validade de Analise de Variancia 	 59 Exercicio de Aplicagao 7.2 	 88 
1. Aditividade 	 59 Exercicio de Aplicagao 7.3 	 90 
2. Independencia dos Erros 	 59 5. ❑esdobrarnento dos Graus de Liberdade de 
3. Normalidade dos Erros 	 59 Tratamentos em Contrastes Ortogonais 	 92 
3.1. Teste de Assimetria 	 60 Exercicio de Aplicacao 7.4 	 93 
3.2. Teste de Curtose 	 60 6. Experimentos ern Blocos incompletos Balanceados 	 97 
3.3. Teste de Lilliefors 	 61 Exercicio de Aplicagao 7.5 	 101 
4. Homogeneidade de Variancias dos Erros .. 	 61 Exercicio de Aplicagao 7.6 	 102 
Exercicio de Aplicacao 7.7 	 104 
6 	 ANALISES ESTATIST1CAS NO SAEG ANAUSES Eb IATiSTICAS NO SAEG 7 
 
 
SAEG 	 
CAPiTULO 8 
SAEG 	 
CAPiTULO 9 
Experimentos com mais de Urn Fator 	 107 Analise Conjunta de Experimentos 	 	157 
1. Experimentos corn Dais Fatores 	 107 Exercicio de Apficacao 9.1 	 158 
1.1. Experimentos Fatoriais 	 107 
1.1.1. Comparacties de Medias 	 110 CAPITULO 10 
1.1.1.1. Interacao Nao Significativa 	 110 Analise de Covariancia 	 165 
1.1.1.2. Interacao Significativa 	 111 Exercicio de Aplicacao 10.1 	 166 
1.2. Experimentos em Parcelas Subdivididas 	 112 
1.2.1. Comparacties de Medias 	 113 CAPITULO -11 
1.2.1.1. Interacao Nao Significativa 	 113 Analise de Regressao 	 169 
1.2.1.2. Internal Significative 	 114 1. Regressao Linear corn Uma Variavel lnidependente 	 169 
Exercicio de Aplicagao 8.1 	 114 1.1. Dados sem Repeticao 	 171 
Exercicio de Ap1icacao 8.2 	 129 1.1.1. Analise de Regressao 	 171 
1.3. Experimentos corn Classificacao Hierarquica 	 133 Exercicio de Aplicacao 11.1 	 173 
Exercicio de Aplicacao 8.3 	 134 1.2. Dados corn Repeticao 	 180 
2. Experimentos corn Tres Fatores 	 135 1.2.1. Experimentos corn Urn Fator Quantitativo 	 180 
2.1. Experimentos Fatoriais 	 137 1.2.1.1. Analise de Variancia 	 180 
2.1.1. ComparacOes de Medias 	 138 1.2.1.2. Analise de Regressao 	 180 
2.1.1.1. Interacao Ndo Significativa 	 138 1.2.1.2.1. ObservacOes Individuals 	 181 
2.1.1.2. Interacao Significativa 	 140 1.2.1.2.2. Totais de Tratamentos 	 182 
2.1.1.2.1. Interacao AxB 	 140 1.2.1.2.3. Medias de Tratamentos 	 183 
2.1.1.2.2. Interacao AxC 	 141 1.2.1.3. Teste t Para os Parametros 	 184 
2.1.1.2.3. Interacao BxC 	 142 Exercicio de Aplicacao 11.2 	 186 
2.1.1.2.4. Interacao AxBxC 	 143 1.2.2. Experimentos corn Um Fator Qualitativo e 
2.2. Experimentos em Parcelas Sub-subdivididas 	 145 Urn Fator Quantitativo 	 207 
2.2.1. Comparacaes de Medias 	 147 Exercicio de Aplicacao 11.3 	 207 
2.2.1.1. Interacao Nao Significativa 	 147 2. Regressao Linear Multipla 	 217 
2.2.1.2. Interacao Significative 	 ....147 Exercicio de Aplicacao 11.4 	 218 
2.2.1.2.1. Interacao AxB 	 147 3. Regressao {Tao Linear 	 221 
2.2.1.2.2. Interagao AxC 	 	148 Exercicio de Aplicacao 11.5 	 222 
2.2.1.2.3. Interacao BxC 	 149 4. Regressao Linear Response Plateau (LAP) 	 224 
2.2.1.2.4. Interacao AxBxC 	 149 Exercicio de Aplicacao 11.6 	 225 
Exercicio de Aplicacao 8.4 	 150 
ANALISES ESTATiSTICAS NO SAEG ANALISES ESTAT(STICAS NO SAEG 9 
 
 
SAM 
CAPITULO 12 
Superficie de Resposta 	 227 
Exercicio de Aplicac5o 12.1 	 227 
Exercicio de Aplicacao 12.2 	 231 
CAI:4111LO 13 
AnaIlse Muitivariada 	 237 
Exercicio de Aplicacao 13.1 	 238 
CAPITULO 14 
AnaIlse de Agrupamento 
	
241 
1. Medidas de ❑ issinnitaridade 	 242 
1.1. Distancia Euclidiana 	 242 
1.2. Distal-Iola de Mahalanobis 
	
243 
1.3. Ouiras Medidas 	 244 
Exercicio de Aplicacao 14.1 	 244 
CAPITULO 15 
Componentes Principais 	 257 
Exercicio de Apficacao 15.1 	 260 
CAPITULO 16 
Variavels Caneinicas 	 269 
Exercicio de Aplicacao 16.1 	 271 
Exercicio de Aplicacao 16.2 	 277 
CAPITULO 17 
Analise Discriminante 	 283 
Exercicio de Aplicacao 17.1 	 284 
CAPITULO 18 
Analise de Fatores 	 288 
Exercicio de Aplicagao 18.1 	 292 
131BLIOGRAFIA 	301 
SAEG 
INTROD 1 
Os arquivos de dados devem conter na primeirafinha o nome das variavers 
formadas par uma se palavra em letras maiusculas, e devem ser criados numa 
pasta que nao contenha os arquivos executaveis do programa SAEG, coma 
per exempla, na pasta de trabalho CASaeg \Dados. Este recomendacao torna o 
trabalho mais organizado, alem de que quaisquer manipulacaes feitas nos 
arquivos, nao irao comprometer o programa, ja que o mesmo cria na pasta de 
trabalho, outros arquivos corn extensdes diferentes e corn a mesmo name 
fornecido pelo usuario. Os resultados das analises geradas pelos procedimentos 
estatfsticos, podem ser editados, impresses ou salvos corn extensao "doc", 
pare posterior acesso por editores de textos, sendo todos os resultados salvos 
incluidos no mesmo arquivo. 
Nos arquivos criados no padrao texto, as cases decimals dos valores 
numericos devem ser separadas par ponto. Quando ocorrerern valores perdidos 
para uma ou mais unidades experimentais, baste digital- urn ponto decimal no 
local do valor perdido. 
Nos arquivos do tipo Excel, Lotus e SmartSuite-Lotus, os dados nurnericos 
sao sempre alinhados a direita na celula, sendo qualquer outra formatacao 
sem significado para fins de calculo. Portant°, dependendo da configuracao, 
as casas decimals dos valores numericos podem ser separadas por ponto ou 
par virgule. Quando ocorrerem valores perdidos para uma ou mais unidades 
experimentais, as celulas dos arquivos de dados correspondentes a esses 
valores, devem ser deixadas em Branco. Casa ocorram variavels que sao 
combinacifes de Quiresavaliadas no experimento, cujos resultados foram obtidos 
atraves de formulas, devem-se substituf-las por valores numericas. Nestes tipos 
de arquivos, deve-se evifar quaisquer tipos de formataci5es, preocupando-se 
somenie corn a correta digilacao dos dados. 
Os passos pare acessar o arquivo de dados sac) os seguintes: 
- Arquivos / Myer Arquivo de dados Existente; 
- Informer a nome, o tipo do arquivo e o diretOrio onde se enconire; 
- Informer corretamente a padrao de armazenamento dos dados; 
ANALISES ESTA7fSTICAS NO SAEG 	 1 1 10 
	
ANALISES FRTATIST1CAS NO SAEG 
 
 
SAEG 
- A descrieao do titulo é necessaria, caso seja importante sua impressao 
junto aos resultados das analises; 
- Observar corn atencao o resultado da descried° do arquivo; 
- Observar se a conversao foi executada. 
Antes de executar qualquer analise estalfstica, é importante utilizar o 
procedimento Utilitarios / Listar Dados, para verificar a autenticidade dos dados 
digitados e, conseqUentemente, ter total seguranca sobre os resultados obtidos. 
Para sair do SAEG sem eliminar os arquivos gerados para processamento 
posterior, clica-se em Arquivos / Sair do SAEG. Para eliminar os arquivos para 
processamento posterior, é necessario antes de sair, clicar em Utilitarios / 
Eliminar Arquivo Ativo. 
Todos os arquivos de dados desenvolvidos coma exercfcios de aplicagoes 
para os procedimentos estatisticos abordados, estao inclufdos no disquete de 
3,5" HD quo acompanha o livro, como arquivos do tipo texto (*.txt), arquivos do 
tipo Microsoft Excel (*.xls) e arquivos do tipo Lotus 1-2-3 (*.wk1). 
SAEG 
CA iTULOI 
ESTAT1STICA DESCRITIVA 
E a parte da estatfstica que tern a finalidade de descrever os dados 
amostrais por meio de medidas de posicao, de dispersao, de assimetria, de 
curtose e da apresentacao em tabelas ou graficos, sem fazer nenhuma inferencia 
sabre a populagao dos dados. 
1. Medidas de Posicao 
Sao chamadas medidas de tendencia central,. pois representam as 
caracterfsticas avaliadas pelos seus valores medics, em torno dos quais tandem 
a concentrar-se os dados. Tais medidas possibilitam comparagoes de series 
de dados pelo confronto de seus valores. 
1.1. Media 
E a medida mais comumente usada para descrever resumidamente uma 
serie de dados. Ha varios tipos de medias, sendo quo as mesmas podem ser 
influenciadas pelos valores extremos da serie. 
1.1.1. Media Aritmetica 
A media aritmetica é obtida pela soma de todos os valores de uma variavel 
X dividida pelo numero total de observaeOes (n): 
1_ X +X2+—+X, 
X— 	 — 
n 
Entretanto, se na serie existirem dados repetidos, os k diferentes valores 
da variavel X podem ser agrupados, ou seja, a cada valor Xi estara associada 
uma respective freqUencia f,, obtendo-se entao, a media aritmetica ponderada: 
1=1 
ANALISES ESTATISTICAS NO SAEG ANALISES ESTATIST1CAS NO SAEG 13 12 
 
 
SAEG 
SAEG 	 
k 
X — 
f1X1 f2X2 	-FikXk 	 
1-1 -1- f2 	' +fit 
	
EfiXi 
f 
, ern que: 
1.1.2. Media Geornetrica 
A media geannetrica a definida coma a raiz de ordem n do produto de 
todos os valores que uma variavel X assume, sendo dada por: 
= -ijX] •X2--Xn 	r Xi 1=1 
Se a cada X estiver associada uma respectiva treq0encia f, entao: 
Xc = "11)(11 •)q...Xk = 	Ir 
Lima propriedade importante desta medida, a que o produto das razOes 
de cada observacao pela media geometrica a igual a urn. Como desvantagem, 
se a serie de dados tiver valores menores ou iguais a zero, a media geometrica 
nao podera ser calculada. 
1.1.3. Media Harmonica 
A media harmOnica a definida como o inverso da media aritmetica dos 
:inversos dos valores da serie de dados: 
n 	 n 
XH 	1 	1 	1` n 1 
Xi + X2 	Xn 	X 1=1 	I 
Se os cliterentes valores X1, X2, 	Xk de uma variavel X, estiverem 
associados as fregClencias f„ f2, 	respectivarnente, entao: 
14 
	
ANALISES ESTAT[S11CAS NO SAEG 
fl + f2 +...+ f k 	1=1 
fl 	 f f2 	k 
X] X2 	Xk 	Xi 
Se a serie tiver pelo menos urn elemento nulo, a media harm:Mica nao 
podera ser calculada. Em termos de valores, a media harmOnica a menor que 
a media geometrica, que é manor que a media aritmetica, para urn mesmo 
conjunlo de dados. Nos casos em que nao se comentar o tipo de media, estara 
se tratando da media aritmetica. 
1.2. Mediana 
Colocados os valores em ordem crescente de grandeza (rol), a mediana 
(Md) sera o valor que ocupa a posicao central da serie de dados, ou seja, é o 
valor que divide a serie em dues panes corn niimeros iguais de elementos. A 
mediana a preferivel a media quando se este interesssado em conhecer 
exatamente o centro da distribuicao dos dados, ou ainda, quando as valores 
extrernos podem afetar sensivelmente a media. 0 calculo da mediana é feito 
sob duas condicoes: 
X r,_,1 
a) n impar: Md sera o valor do rol que ocupa a posicao 
Xn +X n+2 
2 	2 
b) n par: Md sera o valor do rol que ocupa a posicao 
Essa ideia de dividir o conjunto ordenado de dados em pales iguais 
pole ser estendida em: quartil, decil e percentil. Os quartis Qv 02 e 02 dividem 
a serie de dados em quatro pales iguais, cada parte corn 25% dos dados. Os 
decis D1, E:15, ..., D9 dividem a serie em dez partes iguais, cada parte corn 
10% dos dados. Os percentis P i , Pp, ..., P50, ..., P99 dividem a serie em cem 
partes iguais, cada parte corn 1% dos dados. Em termos de comparacoes entre 
estas medidas, tem-se: 
02 = D5 = Pso = Md. 
1.3. Moda 
A moda (Mo) e o valor que ocorre corn major fregOencia ou o valor que 
mais se repete. Quando a serie de dados 6 sal que as freqUencias sao maiores 
ANALISES ESTATiSTICAS NO SAES 
	
15 
2 
 
 
SAM 
X1 , X2, ..., Xh de uma variavel X, associados as freqUencias fl, fv 	fk , 
respectivamente, sere dada por: 
 
k 
k 
XI 
 
1'1 	 
 
k 
 
2.3. desvio Padrao 
Para se retornar a unidade original de avaliaga❑ de uma variavel X e obter 
uma medida de melhor interpretagao, define-se o desvio padrao coma sendo a 
raiz quadrada positiva da variancia: 
s(X)= is2 (X) 
Intuitivamente, a desvio representa a media do's desvios absolutos que 
todos os valores amostrais possuem ao redor da media. Valores da serie prOximos 
uns dos outros originam urn desvio padrao manor, enquanto valores muito 
afastados uns dos outros dao urn desvio padrao maior. A serie de dados que 
apresentar desvio padrao maior, bra uma distribuigao de frequencias mais aberta 
qua a serie corn desvio padrao manor. 
2.4. Coeficiente de Variacao 
E uma medida admensional, util para compararvariabilidades de diferentes 
amostras, onde as medias saa muito desiguais ou as unidades de medidas sao 
diferentes. 0 coeficiente de variagao (CV) 6 a desvio padre() expresso em 
porcentagem da media, sendo dada por: 
s(x) 
CV(%)= 100 
2.5. Erro Padre° da Media 
O erro padrao da media representa a variabilidade media entre as medias 
amostrais possiveis de saran coletadas e da ideia da precisao da estimativa 
ANALISF:q ESTATiSTICAS NO SAEG 
	
17 
1,1 
Efi Efi(x, 
s2(X)= 1=1 
If, —1 
1,1 
SAEG 
nos extremos, ou quando se quer destacar um valor de alta frequencia ou quando 
se pretende obter uma medida rapida a aproximada da tendencia central, a 
moda pode entao, ser considerada para a interpretagao dos dados. Corn relacao 
a moda, uma serie de dados pixie ser classificada em amodal (nao possui 
moda), unimodal (possui apenas uma moda), bimodal (possui dues modas) ou 
multinnodal (possui mais de duas modas). 
2_ Medidas de ❑ispersao 
Sao utilizadas para avaliar ❑ grau de variabilidade dos dados. Nao se 
justifica ca;cular uma media de urn conjunto de dados onde nao haja variagao, 
todavia se a variabilidade desses for muito grande, a representatividade da 
media sera muito pequena. Assim, 6 importante caracterizar a dispersao dos 
dados, uma vez que diferentes amostras corn medias semelhantes, p❑dem 
apresentar diferentes variabilidades. 
2.1. Amplitude Total 
E a diferenga entre o maior e a manor dos valores da serie de dados, ou 
seja, e ❑ maior desvio da amostra. A sua ulilizagao, Wen] de mostraro maxima 
desvio, serve para uma avaliacao preliminar dos dados, verificando-se a 
possibilidade de passiveis erros nas coletas dos dados ou nas digitacOes, ja 
que as variaveis podem apresentar extremos con hecidos. 
AT =X — maior 	menor' 
2.2. Vanancia 
A variancia mode a dispersao dos valores em torno da media. A variancia 
dada pela soma de quadrados dos desvios de dada observagaa em relagao 
media, dividida polo nOrnero de graus de liberdade da amostra, ou seja, ela 6 a 
media dos n-1 desvios quadraticos a independentes. Assim, se a unidade de 
uma variavel for por exempla m, a variancia tare coma resultado m2. 
Para uma amostra de n valores X1, X2, ..., X, de uma variavel X, a variancia 
dada par: 
IX! 
E _yo2 2 	, 
s 2 (X)= 1'1 	 1.1 
n-1 
Se na serie existirem dados repetidos, a variancia dos k diferentes valores 
16 
	
ANALJSES ESTATISTICAS NO SAEG 
 
 
SAEG 	 
obtida para a media, sendo que aquela que apresentar major erro padrao lard 
manor precisao. Ele a inversamente proporcional ao tamanho da amostra e 
diretamente proporcional ao desvio padrao da amostra, sendo definido coma: 
s(5-‹)__ 	 
E usual apresentar a media e o erro padrao da media corn a seguinte 
indicacao: R±s(R). 
3. Medida de Assimetria 
Denornina-se assimetria o grau de afastamento da simetria de uma 
dislribuicao de dados. Em uma distribuicao sinnetrica, tern-se igualdade dos 
valores da media, mediana e moda. Entretanto, se numa distribuicao ocorrer: 
- X < Md < Mo: existirao mais dados da serie maiores do que a media, 
porem a curva da distribuicao tera uma cauda mais longa para os dados menores 
do que a media, isto 6, diz-se que a distribuicao tern assimetria negativa. 
- X Md > Mo: existirao mais dados da serie menores do que a media, 
porem a curva da distribuicao tera uma cauda mais longa para os dados maiores 
do que a media, isto 6, diz-se que a distribuicao tern assimetria positiva. 
A estimativa do coeficiente de assimetria (s) de uma varievel X é dada 
por: 	 3 
v Xi X 
SOO 
Se ❑ resultado for zero, a distribuicao a simetrica, se ❑ resultado for 
--negativo, a distribuicao a assimetrica negativa (inclinada para a esquerda) e se 
o resultado for positivo, a distribuicao é assimetrica positiva (inclinada para a 
-direita). 
4. 1\iledida de Curtose 
Denomina-se curtose o grau de achatamento da distribuicao. Para se 
estimar o grau de curtose (k), utiliza-se a seguinte fOrmula: 
4 
in 
(Xi — X 
= 	s(X) 
SAEG 
Se o resultado for igual a tits, entao a distribuicao de frequencias 6 a 
propria distribuicao normal, sendo chamada de mesocOrtica, se o resultado for 
manor do qua tres, entao a clistribuicao e achatada (alta variabilidade) e chamada 
de planictIrtica e se o resultado for maiar do que ties, a distribuicao 6 concentrada 
em torn° da media, distruibuicao corn pica (alta homogeneidade) a chamada de 
leptacUrlica. 
5. Distribuicoes de FreqUencias 
Ao estudar grandes conjuntos de dados, a conveniente resumi-las numa 
tabela, atraves do agrupamento dos dados em classes, com suas respectivas 
frequencias. Quando os dados sao discretos corn valores repetidos, a simples 
identificacao dos mesmos corn as respectivas freqUencias, pode ser urn 
procedinnento adequado. Quando os dados sao continuos, pode acontecer que 
poucos, ou ate nenhum dales, apresente freqUencia. Nestes casos, o 
procedimento comeca pela definicao de classes. Cada classe e determinada 
por urn interval° (diferenca entre Os limites superior a inferior). Na estalfstica 
descritiva, o interval° aberto a direita, onde a variavel assume o valor do extremo 
inferior (LI; x < LS), 6 o mais usado. 
HO diversos metodos para determinar o nOnnero de classes (k), sendo 
apresentado os seguintes: 
a) k = 	, se n > 25, caso contraria, k = 5; 
b) k = 1 + 3,22 log n (regra de Sturges); 
c) born senso a experiencia. 
0 segundo passo na construcao da tabela de freqiiencias a determinar 
aproximadamente o interval° de classe (h): 
11- 
AT 
k 
1 B 	 ANALISES ESTATiSTICAS NO SAEG 	 ANALISES ESTATiSTICAS NO SAEG 
	
19 
 
 
SAEG 
 
SAEG 
 
 
Tabela 1.1. FreqUencias de determinadas classes obtidas de observagOes 	urn nUmero em duas parles. 0 ramo consiste nos algarismos rnais a esquerda, 
originals 
Classes fa fr. far. PM. 
1 LI, I— LS1 ft ft ft /Ft f t /Ft (Llt+LS1)/2 
2 LI, 	LS2 f2 1(42 f21Ft (f t4f2)1F, (L12-EL52)/2 
3 LI3 1— LS3 t3 f3/F. (t,+f2+f3)/F, (L13+1_53)/2 
k Llk 	LSk fk F, fk/F, 1 (L1k+LSk)/2 
(treqUencia simples) = numero de elementos contidos na classe i; 
(frequencia acumulada) = f, da classe I somada as f das classes anteriores; 
(frequbncia total) = nOmero total de dados (f1+12+...+10; 
f (f requencia relativa) = f da classe i dividida pela F,; 
(frequencia acumulada relativa) = fa, da classe i dividida pela 
pont° medio da classe i. 
A partir dos dados originals ou dos dados distribuidos em classes, podem-
!-43 represents-los graficamente. 
6_ Graficos 
6.1. Histograma 
E uma representagao grafica dos resultados das distribuigOes de 
frequencias construida de retangulos justapostos, cujas alturas sao os 
segmentos de retas dados pelas frequencias de cada classe e cujas larguras 
sao proporcionadas pelo h. 
Quando for desejado, pode-se apresentar o polfgono de freqUencia por 
• ..uma linha, que une os pontos medios das bases superiores dos retangulos quo 
o compEiem. Para finalizar, pi5e-se uma classe antes da primeira e uma depois 
da Ultima, marcando-se os dois pontos medics corn freqUencias nulas. Uma 
outra maneira de representar graficamente, é atraves do polfgano de freqUencia 
acumulada (ogiva), quo a tracado utilizando-se as frequencias acumuladas a 
partir dos limites superiores de cada classe. 
6.2. Grafico Ramo e Folhas 
Permite classificar os dados originals, sem perda de informagao, segundo 
urn padrao que revels a distribuigao dos mesmos. 0 padrao consiste em separar 
e as folhas consistem nos algarismos mail a direita. 
6.3. Grafico em Setores 
Ilustra graficamente uma distribuigao de fregOencias como fatias de uma 
pizza. Para construf-lo, parte-se do principio de que o nrimero total de 
observaceies corresponde a 360°. 
6.4. Grafico Polar 
Para construf-lo, divide-se uma circunferencia em tantos arcos iguais 
quantas forem as classes a serem representadas. Palos pontos de divisas 
tragam-se os raios. Em cada raio a representado urn valor, marcando-se urn 
panto cuja distancia ao centro é diretamente proportional ao valor da frequencia 
da classe. E tambem chamado de "radar'. 
6.5. Diagrama de Dispersao 
E urn grafico que envolve os dados originais de duas variavels X e Y. 
Para a sua construgao, traga-se urn eixo horizontal para os valores da primeira 
variavel e urn eixo vertical para as valores da segunda, marcando-se os pontos 
correspondentes. 0 padrao dos pontos costuma ajudar a determinar se existe 
algum relacionamento entre as duas variaveis. 
Exercicio de Aplicacao 1.1 (descrit.xls) 
Considere os dados obtidos pelas medidas das alturas (ALT) e pesos 
(PESO) de 100 indivicluos, ern cm e kg, respectivamente. Estudar, de forma 
descritiva, a variavel ALT. 
Arquivos / Ativar Arquivo de Dados Existente 
CASaeglDados\Descrit.xls 
Procedimento = Univariadas I Estatisticas Simples (1) 
Variaveis 	= ALT 
Warner() de ObservagOes 	 100 
Media Geral 	 171.450000 
Desvio Padrao 	 8.123261 
Erro Padrao 	 0.812326 
Coeficiente de Variagao 	4.737977 
20 
	
ANALISES ESTATiSTICAS NO SAEG ANALISES ESTATiSTICAS ND SAEG 	 21 
 
 
SAEG 
Maximo 	 190.000000 
Minim° 	 151.000000 
Amplitude 	 39.000000 
Assimetria 	 —0.013643 
Probab. da Assimetria=0 	 0.500000 
C u nose 	 2.890362 
Probab. da Curtose=0 	 0.479098 
Observacao: Para a interpretacao dos valores de assimetria e de curtose, 
deve-se analisar os valores das probabilidades associadas. Se estes valores 
forem maiores do que 0.05 0110.01, a medida de assimetria e significativamente 
igual a zero e a medida de curtose 6 significativamente igual a tres, considerando-se os niveis de significancia de 5% ou de 1%, respectivamente. 
Procedimento = Univariadas / Estatisticas Simples (2) 
Variaveis 	= ALT 
Box-Piot 	= Sim 
interval° 	= FOrmula 
Media Aritrnetica (100) 	 171.4500 
Media Geometrica (100) 	 171.2589 
Media Harmonica (100) 	 171.0670 
Percentil 1 	 151.0200 
Percentil 5 	 156.1000 
Percentil 10 	 161.1000 
Percentil 25 .. Quartil 1 167.0000 
Percentil 50 .. Quartil 2 Mediana 	 170.5000 
Percentil 75 .. Quartil 3 	 177.0000 
Percentil 90 	 182.0000 
Percentil 95 	 185.9500 
Percentil 99 	 190.0000 
Moda 	 168.0000 
SAEG 
Grafica de Gaihos e Folhas 
NOrnero Galho 	Folhas 
(1) 	151 	0 
(1) 	153 	0 
(1) 	154 	0 
(1) 	155 	0 
(1) 	156 	0 
(1) 	158 	0 
(1) 	159 	0 
(1) 160 	0 
(2) 161 	00 
(3) 162 	000 
(2) 	163 	00 
(1) 	164 	0 
(2) 	165 	00 
(4) 	166 	0000 
(6) 	167 	000000 
(9) 	168 	000000000 
(8) 	169 	00000000 
(5) 	170 	00000 
(4) 	171 	0000 
(4) 	172 	0000 
(3) 	173 	000 
(4) 	174 	0000 
(5) 	175 	00000 
(3) 	176 	000 
(7) 	177 	0000000 
(1) 	178 	0 
(1) 179 	0 
(2) 180 	00 
(4) 	181 	0000 
4) 	182 	0000 
(1) 	183 	0 
(1) 	184 	0 
(1) 	185 	0 
(1) 	186 	0 
(1) 	187 	0 
(1) 188 	0 
(2) 190 	0 
22 
	
ANALISES ESTATIST1CAS NO SAEG 23 ANALISES ESTATiST1CAS NO SAEG 
 
 
SAEG 
GRAFICO ESQUEMATICO (B❑XPL❑T) 	 Fregilencias da Variavel **ALT** Apas Recodificacao em **8** Classes 
SAEG 
Nunnera Galho I 	B❑XPL❑T 
(1) 151 ❑ 
(1) 153 ❑ 
(1) 154 ❑ 
( 1) 155 ❑ 
( 1) 156 
(1) 158 
(1) 159 
(1) 160 
(2) 161 
(3) 162 
(2) 163 
(1) 164 
(2) 165 
(4) 166 
(6) 167 + 
(9) 168 1 
(8) 169 l 
(5) 170 
(4) 171 I X 1 
(4) 172 I I 
(3) 173 I I 
(4) 174 I I 
(5) 175 I I 
(3) 176 1 I 
(7) 177 + -1- 
(1) 178 I 
(t) 179 I 
(2) 180 I 
(4) 181 I 
(4) 182 I 
(1) 183 l 
(1) 184 1 
(1) 185 I 
(1) 186 0 
(1) 187 0 
(1) 188 0 
(2) 190 0 
Valor Minima 	Valor Maximo 	❑ados 	Freq.Simples 	Freq.Acum. Classes 
151.0000 	155.8750 	4 	4.000 	4.000 	1 
155.8750 	160.7500 	4 	4.000 	8.000 	2 
160.7500 	165.6250 	10 	10.000 	18.000 	3 
165.6250 	170.5000 	32 	32.000 	50.000 	4 
170.5000 	175.3750 	20 	20.000 	70.000 	5 
175.3750 	180.2500 	14 	14.000 	84.000 	6 
180.2500 	185.1250 	11 	11.000 	95.000 	7 
185.1250 	190.0000 	5 	5.000 	100.000 	8 
❑bservacbes: 
Quando a sada de dados tern mais de uma moda, o programa 
reconhece apenas uma, que é a de manor valor. Caso haja interesse 
nesta medida, seria irnportante usar a procedimento Univariadas / 
Frequencias Simples, que gem a freq0encia de urn valor observado 
canto sendo a nOmera de repOigOes (Jesse valor. Portanta, na existencia 
de mais de uma moda, alas serao os valores que possuem a mesma 
frquencia simples maxima. 
No grafica de galhos e folhas, Os valores colocados a esquerda sao Os 
valores situados a esquerda da casa decimal, e as valores colocados 
a direita Sao as valores situados a direita da casa decimal. Caso ocorram 
valores muito grandes ou corn mais de uma casa decimal, os valores a 
esquerda sao multiplicados par uma constante, e Os da direita, 
representados por urn Unica valor aproximado. 
Na caixa central do "box-plot" estao agrupados 50% dos valores 
amastrais, sendo 25% na parte abaixo da mediana (X = 170,5) a 25% 
na parte acima. No inicia da caixa, tern-se o 12 quartil igual a 167 e, no 
final da caixa, tem-se o 3Q quarlil igual a 177. Na parte inferior a caixa, 
encontram-se 25% dos valores a mostrais e, na parte superior, 
encontram-se os restantes 25% dos dados. 
Para determinar o ralmero de classes (k), pode-se informal- na opcao 
"intervalo", valores de 2 a 13, ou escolher a item formula. Nesta Ultima 
escolha, a regra de Sturges sera utilizada no SAEG, para a 
determinacao do k. 
24 
	
ANJALISES ESTATiSTICAS NO SAEG ANALISES ESTATfSTICAS NO SAEG 
	
25 
 
 
Procedirnento = Univariadas / FreqUencias Simples 
Variaveis 	= ALT 
Histograma = Sim 
Observacao: Apes manipular o grafico, clicar em Arquivo / Abandonar. 
Tabela de Freqfiencias 
Descricao Valor Casos Simples Acurns.ilada Seq. 
ALT 151.00 1 1.000 1.000 1 
ALT 153.00 1 1.000 2.000 2 
ALT 154.00 1 1.000 3.000 3 
ALT 155.00 1 1.000 4.000 4 
ALT 156.00 1 1.000 5.000 5 
ALT 158.00 1 1.000 6.000 6 
ALT 159.00 1 1.000 7.000 7 
ALT 160.00 1 1.000 8.000 8 
ALT 161.00 2 2.000 10.000 9 
ALT 162.00 3 3.000 13.000 10 
ALT 163.00 2 2.000 15.000 11 
ALT 164.00 1 1.000 16.000 12 
ALT 165.00 2 2.000 18.000 13 
ALT 166.00 4 4.000 22.000 14 
SAEG 
 
SAEG 
 
 
 
ALT 167.00 6 6.000 28.000 15 
ALT 168.00 9 9.000 37.000 16 
ALT 169.00 8 8.000 45.000 17 
ALT 170.00 5 5.000 50.000 18 
ALT 171.00 4 4.000 54.000 19 
ALT 172.00 4 4.000 58.000 20 
ALT 173.00 3 3.000 61.000 21 
ALT 174.00 4 4.000 65.000 22 
ALT 175.00 5 5.000 70.000 23 
ALT 176.00 3 3.000 73.000 24 
ALT 177.00 7 7.000 80.000 25 
ALT 178.00 1 1.000 81.000 26 
ALT 179.00 1 1.000 82.000 27 
ALT 180.00 2 2.000 84.000 28 
ALT 181.00 4 4.000 88.000 29 
ALT 182.00 4 4.000 92.000 30 
ALT 183.00 1 1.000 93.000 31 
ALT 184.00 1 1.000 94.000 32 
ALT 185.00 1 1.000 95.000 33 
ALT 186.00 1 1.000 96.000 34 
ALT 187.00 1 1.000 97.000 35 
ALT 188.00 1 1.000 98.000 36 
ALT 90.00 2 2.000 100.000 37 
Total Geral 100 100.000 100.000 37 
Observacao: Como o rainier° de valores diferentes para a variavel ALT é 
muito grande (37) e corn freq0encias pequenas, torna-se necessario criar 
classes de intervalos continuos, para melhor visualizacao do grAfico. Para o 
exempla, sera° utilizadas as alto classes fornecidas anteriarmente, pelo 
procedimento Univariadas / Estatisticas Simples (2). 
Proceclimento ,-. Utilitarios / Comandos 
Arquivo a ser criado: CASaeglDados\Descrit.cmd 
Calcular 	DFALT = ALT*1 
Recodificar DFALT (151 ate 155.875 = 1)(155.875 ate 160.75 = 2) (160.75 ate 
165.625 = 3)(165.625 ate 170.5 .-- 4)(170.5 ate 175.375= 5)(175.375 
ate 180.25 = 6)(180.25 ate 185.125 = 7)(185.125 ate 190.1 = 8) 
Executar 
26 	 ANALISES ESTATiST1CAS NO SAEG 	 ANALISES ESTATiST1CAS NO SAEG 	 27 
 
 
SAEG 	 SAEG 
Arquivo / Sair 
Deseja salver as alteracijes? Sim 
ObservacOes Lidas 	 100 
ObservacOes Gravadas 	100 
Variaveis Lidas 	 3 
Variaveis Totals 	 4 
Valores Perdidos 	 0 
Erros Encontrados 	 0 
ObservacOes: 
O comando calcular gera novas variaveis par meio de expressOes 
aritmeticas envolvendo variaveis je existentes no arquivo de dados. A 
variavel DFALT foi criada corn a finalidade de que os valores originais 
da variavel ALT, nao sejam alterados. 
O comando recodificar altera todos os valores contidos nos intervalos 
continuos pare a valor especificado, criando-se neste caso, uma nova 
variavel corn apenas 8 valores diferentes e repetitivos. 0 comando 
recodificar reconhece intervalos fechados a esquerda e abertos a direita. 
Par isso, pode-se repetir os limites superiores das classes anteriores 
como limites inferiores das subsequentes, e no final, deve-se fornecer 
urn valor maior que o valor maxima da sone de dados. 
Procedimento = Univariadas / Frequencies Simples 
Variaveis 	= DFALT 
Histograma = Sim 
Observacoes: 
- Para a construca'o do grafico, o procedimento Univariadas / Histogramas 
poderia, tambern, ser utilizado. 
- Os seguintes tipos de graficos podem ser construidos: histograma 
vertical, histograma horizontal, grafico de setores, grafico polar e 
disperser) simples. Abaixo, sea mostrados mais dais tipos de graficos. 
- Ap6s manipular o grafico, clicar em Arquivo / Abandonar. 
Grefico em Setores 
Grafico Polar 
ANALJSES ESTATiSTICAS NO SAEG 
	
29 28 
	
ANALISES ESTATISTICAS NO SAEG 
 
 
170 180 190 
ALT 
150 160 
0,06 
0,05 
0,04 
	
00:0023 	1 "- 	 ..► 
	
0,01 	..... 40 
	
0 	 
150 	160 	170 	180 	190 
ALT 
SAEG 
Tabela de Frequencies 
Descricao Valor Casos Simples Acumulada Seq. 
DFALT 1.00 4 4.000 4.000 1 
DFALT 2.00 4 4.000 8.000 2 
DFALT 3.00 10 10.000 18.000 3 
DFALT 4.00 32 32.000 50.00❑ 4 
DEALT 5.00 20 20.000 70.000 5 
DFALT 6.00 14 14.000 84.000 6 
DFALT 7.00 11 11.000 95.000 7 
DEALT 8.00 5 5.000 100.000 8 
Total Gera! 100 100.000 100.000 8 
Procedimento = Univariadas/ Dispersao 
Variaveis 	= ALT por PESO 
Padrao 	= Simples 
SAEG 
Procedimento = Univariadas / Graficos 
Equagao 	= Y=(1/20.3620yexp(-1/2*(ALT-171.45).(ALT-171.45)165.9874) 
Intervalo 	= ALT = 150,191 
Observecoes: 
- Este procedimento gera um grafico de dispersao simples, de acoido 
corn uma fOrmula fornecida, por exemplo, a funcao densidade 
de probabilidade da distribuicao normal, representada por Y, 
igual a: 
2 
x-
a )
2 
, em ue: 
ti 
f(x) = 	 
- x representa os valores da variavet ALT; 
- os valores assumidos pelos parametros is a cr, foram respectivamente, 
de 171.45 e de 8.123261. 
- No grafico existem 37 pontos, representando Os 37 valores diferentes 
da variavel ALT, corn as sues respectivas freqUencias esperadas. 
3 0 
ANALISES ESTATISTICAS NO SAEG 
ANIAL1SES ESTATISTICAS NO SAEG 
31 
 
 
SAEG 
AMMO 7 
RELAcA0 ENTRE VARIAVEIS 
1. Correlagao Simples 
Made corn qua intensidade se manifesta uma asseciacao entre duas 
variaveis. 0 coeficiente de cerrelacao é urn numero puro, sem unidade ou 
dimensae, que varia entre —1 e 1. 0 coeficiente de correlacao linear é usado 
para expressar o quanto os pontos se aproximam de uma reta imaginaria. Urn 
coeficiente prOximo da unidade positiva ou negativa, significa uma grande 
concentracao dos pontos em tomb da reta, enquanto que urn coeficiente menor, 
significa major dispersao dos pontos em relacao a esta rata. Valores positives 
indicam a tendencia de uma variavel aumentar quando a outra aumenta. Quando 
o coeficiente 6 negativo, valores altos de uma variavei estao associados a valores 
baixos da outra. 
0 coeficiente de correlacao entre duas variaveis X e Y, e urn Unico valor 
definido pela expressao: 
SPDxy 
que: r 	
Cov(X, Y) 	n-1 	SPDxy xy 	 ern 
VIT(X).v(y) ilSODx SQDy IISQDx • SQDy 
n-1 n-1 
Cov (X, Y) = covariancia amostral entre as variaveis X a Y; 
V (X) = variancia amostral da variavel X; 
(V) = variancia amostral da vanavel Y; 
SPDxy = some dos produtos dos desvios em relacao as medias de X e Y; 
SOD, = soma dos quadrados dos desvios em relacao a media de X; 
SOD, = soma dos quadrados dos desvios em relacao a media de Y; 
ANIALISES ESTATISTICAS NO SAEG 
	
33 
 
 
r= 
111 n 
1Ni — 	(yi - 7 2 
i=1 
34 ANAL1SES ESTATiSTICAS NO SAEG 
n(n 2 -1) 
6/c1 
i=1 	 emque: -1- 
SAEG 
n = numero de pares de observagOes das variaveis X e Y. 
Quando as dados sac' oriundos de delineamentos, as variancias podem 
ser obtidas a partir dos quadrados medios das analises de variancias individuals, 
e a covariancia a partir do produto media. E muito importante lembrar que, ao 
estimar as coeficientes de correlagoes de dados experimentais, deve-se respeitar 
o model❑ ennpregacia, a fim de abler estimativas corretas dos componentes de 
variancia e de covariancia. Porem, para a simplificagaa do calculo, o coeficiente 
de correlagao entre as variaveis X e Y pode ser obtido corn base nos t pares de 
medias dos tratamentos ou corn base nos r pares de observagOes dentro de 
cada tratannento. 
1.1. Correlacao de Pearson 
0 caeficiente de correlacao de Pearson (r) 6 mats apropriadamente 
utilizado para as variaveis continuas e pode ser obtido pela seguinte fOrmula: 
0 valor de r calculado atraves dos n pares de valores das variaveis X e Y, 
representa apenas uma estimative do verdadeiro coeficiente de correlagao 
populacional p. Para testar a hipatese de que o coeficiente de correlagao é igual 
a zero (Ho: p = 0), e necessario aplicar o teste t: 
In-2 tcal r 
1-r2 
SAEG 
0 t calculado sera comparado ao t ha belado, a urn nivel a de significancia, 
corn n-2 grans de liberdade. Se cab, rejeita-se Ho, ou seja, existe uma 
correlacao entre as variaveis avaliadas, dada pe[o valor de r. 
1.2. Correlagao de Spearman 
uma medida de associagao que exige que ambas as variaveis sejam 
discretas, de modo que as escalas de mensuracoes das observagoes em estudo, 
possam dispor-se par pastas (ordem crescente das observagOes) em duas 
series ordenadas. A correlagao de Spearman (c) é obtida por mei° da seguinte 
expressao: 
d = P, - Pyr = diferenga entre o posto do individuo i em relacao a variavel X e 
seu posto em relagao a variavel Y para cada par de observagbes. 
Ocastionalmente, dais ou mais individuos podem receber o mesmo pasta 
para a mesnna variavel. Quando isso ocorre, a cada urn doles atribui-se a media 
dos pastas que Ihes caberiam se nao tivesse havido empate. Se a propargaa de 
empates nao for grande, seu efeito sabre r, sera desprezivel, a a fOrmula anterior 
podera ainda ser utilizada para a calculo. Mas se a proporgaa de empates for 
grande, deve-se utilizar da seguinte formula para o calculo de c: 
n 
Ex2+I y2 -1,d2 
rs 	
1=1 
- 
2-j/ X2 Y2 
n3 - n 
12 	
Tx 
n3 
-n 	
T 
12 	
y 
 
0 fator de carrec5o Tx é dada par: 
Tx 
t -tx 
12 
	 , em que: 
ANALISES ESTATiSTICAS 	SAEG 
n 
xi 
I x? 1,1 
n 	- 
E 
Ys 
y12 	1=1 	) 
1-1 
x2 = 
1172 
em que: 
35 
 
 
SAEG 	 
tx = nOmero de observacOes empatadas em determined° posto para a variavel X; 
ETx = somatorio dos valores de Tx para todos os grupos de observacOes 
empatadas. 
0 fator de correcao Ty é dada poi': 
3 
Ty = 
ty -ty 
12 
	 em que: 
tY = nOmero de ❑bservacifies empatadas em determined° posto para a variavel Y; 
ETy = somatario dos valores de T para todos os grupos de observacries 
empatadas. 
A prove de significancia para tester a hipatese Ho: p, = 0, pode ser feita 
pelo taste t: 
rs 	 
11— r 
01 calculado sera coMparado act tabelado a urn nivel o: de significancia 
corn n-2 graus de liberdade. Se It.,1 t tab, rejeita-se Ho. 
2. Correlagab Parcial 
Muitas vexes, urn alto e significativo valor do coeficiente de correlacao, 
pode nao implicar relacao, mas simplesnnente parque ambas as variaveis estao 
relacionadas corn uma terceira. Desta forma, mudancas em uma delas afetaria 
a outra, somente quando as condigOes de associacties corn a terceira 
permanecessem constantes. 
For exemplo, em urn grupo de alunos de diversas idades, pode-se 
constatar uma alta correlacao entre a amplitude do vocabulario e a altura. Tal 
correlacao, entretanto, pode nao refletir nenhurn relacionamento direto entre 
essas dues variaveis, sendo resultante do fato de que lento a amplitude do 
vocabulario coma a altura estarem relacionadas corn urns terceira variavel, a 
idade. Uma atencao particular deve ser dada a esses casos, principalmente 
quando os valores das variaveis sao tornados ao longo de urn period° de tempo. 
0 coeficiente de correlagao parcial é estimado removendo-se as efeitos 
de outras variaveis sobre a associacao estudada. Seja, por exemplo, o caso de 
fres variaveis X1 , X2 e X3. Ora, r12 mode a correlacao total existente entre X, e 
X2, adicionado o efeito que X3 posse ter caused° sobre o comportamento dessas 
variaveis. 0 coeficiente de correlacao entre X, a X2, apas descontado o efeito de 
X3, sera denorninado de coeficiente de correlacao parole! entre X, e X2 corn 
respeito a X3, e sera denoted° por 1.12.3. A ideia da correlacao parcial pode ser 
36 
	
ANALISES ESTATIST1pAS Nfl SAEG 
SAEG 
estend ida ao caso de mais de tras variaveis. Assim, por exempla, r„,5 
representaria a correlacao entre as variaveis X, e X3 mantidas X2 e X5 constantes. 
Uma maneira generalizada para a oblencao do coeficiente de correlacao 
partial entre dues variaveis i e j, é por meio da matriz de correlacao simples de 
dimerISan (m + 2) x (m + 2), que envolve estas dues variaveis a m outras, cujos 
efeitos desejam-se remover da associacaa entre i a j, coma segue: 
rg Tit , , em que: 
•a lj 
al = elemento de ordem ij da inverse da matriz de correlagao simples. 
Para tester a hipOtese Ho: p., m = 0, pode-se aplicar o teste t: 
i 
n- v 
t
teal =-1-1_1111 , 	2 	, em que: -ripu 
 
v = nOmero de variaveis inclufdas na correlacao parcial. 
0 t calculado sera comparado ao t labelado a urn nivel a de significancia 
corn n—v graus de liberdade. Se Ici l _> tt,b, rejeita-se Ha. 
Exercicio de Aplicagao 2.1 (descrit.xls)Considere os dados oblidos pelas medidas das allures (ALT) e pesos 
(PESO) de 100 indivicluos, em cm a kg, respectivamente. 
Arquivos / Myer Arquivo de Dados Existente 
C:1SaegIDados\Descrit.xls 
Procedimento = Outras / Correlagoes 
Variaveis 	= ALT PESO 
Tipo 	= Pearson 
Correlagoes de Pearson 
Variavel 	 Variavel 
ALT 	 PESO 
Observacao: 0 coeficiente de correlacao pode ser tambern, uma medida 
de analise descritiva de uma sane de dados. 
ANAL1SES ESTATiSTICAS NO SAEG 
	
37 
n —2 
 
ObservagOes 
100 
 
Correlacao 
0.8960 
 
 
 
SAEG 
Exercicio de Aplicag5o 2.2 (correLxls) 
Considere as avaliacoes das variavels producao de graos em kg (P), peso 
de cam graos em kg (PCG), numero de espigas par planta (NES) a altura de 
planta em m (ALT). 
Arquivos / Ativar Arquivo de Dados Existente 
CASaeg\Dados\Correl.xls 
a) ObservacOes ariundas de 15 Individuas 
Procedimento = Outras / CorrelacOes 
Variaveis 	= P PCG NES ALT 
Tipo 	= Spearman 
Correlacoes de Spearman 
Variavel Variavel Observaceies Correlacao Z Significancia 
PCG 15 0.0268 0.1004 0.4600 
NES 15 0.7066 2.6439 0_0041 
ALT 15 0/221 2.7018 0.0034 
PCG NES 15 -0.1692 -0.6331 0.2633 
PCG ALT 15 -0.2764 -1.0341 0.1505 
NES ALT 15 0.9186 3.4371 0.0003 
ObservagOes: 
- As correlacoes obtidas nao levam em consideracao as componentes 
de covariancias, caso as dados sejam oriundos de delineamentos 
experimentais. 
- A prova da significancia da correlacao de Spearman estabelecida no 
SAEG, a baseada no valor calculado do taste de Z. 
- 0 valor de significancia ou de probabilidade (p), é definicio comp o major 
valor do nivel de significancia que o taste é significativo, ou seja, é ❑ 
maior valor do nivel de significancia que rejeita a hipOtese Ho. 
- 0 valor de significancia ou de probabilidade de 0.4600 para a correlacao 
entre as variaveis P a PCG, indica que o valor da correlacao de 0.0268 
e significativo a partir de 46% de probabilidade. 
38 
	
ANAL ISES ESTATiSTICAS NO SAEG 
SAEG 
- Se P s 0.05, rejeita-se Ho ao nivel de 5% de probabilidade pelo testa 
aplicado, a se P 0.01, rejeita-se Ho ao nivel de 1% de probabilidade. 
Se P 0.05 ou P X0.01, nao se rejeita Ho, aos niveis de 5 ou de 1% de 
probabilidade, respectivamente. 
Procedimento = Outras / CorrelacOes 
Variaveis 
	
P PCG NES ALT 
Tipo 
	= Pearson 
CorrelacOes de Pearson 
Variavel Variavel Observacties Come lagao T Significancia 
FOG 15 -0.0098 -0.0354 0.4861 
NES 15 0.7246 3.7909 0.0011 
P ALT 15 0.7478 4.0616 0.0007 
PCG NES 15 -0.1887 -0.6927 0.2503 
PCG ALT 15 -0.2872 -1.0809 0,1497 
NES ALT 15 0.9054 7.6901 0.0000 
Procedimento = Outras / Correlacoes 
Variaveis 	= P corn PCG ajustado NES 
Tipo 	= Pearson 
Correlac6es Parciais 
Variavel 	Variavel ObservacOes Correlacao 	T 	Significancia 
PCG 	15 	0.1875 . 	0.6882 	0.2517 
Procedimento = Outras / CorrelagOes 
Variaveis 	= P corn PCG ajustado ALT 
Tipo 	= Pearson 
Correlacoes Parciais 
Variavel Variavel Observagaes Correlacao 	T 	Significancia 
P 	PCG 	15 	0.3223 	1.2274 	0.1207 
ANAL.-USES ESTATiST1CAS NO SAEG 
 
 
SAEG 	 
Procedimento = Outras / Correlacbes 
Variaveis 	= P corn PCG ajustado NES ALT 
Tipo 	= Pearson 
CorrelacOes Parciais 
Variavel 	Variavel 	ObservacOes Correlacao 	T 	Significdncia 
PCG 	15 	0.3016 
	
1.1407 	0.1373 
Observacoes: 
- Verificou-se que a correlacao entre P a PCG (producao e o tamanho 
dos graos) foi ligeiramente negativa, apesar de n5o significativa a 5% 
de probabiiidade. Apos rernovidas as influencias de NES e ALT, a 
correlacao passou a ser positiva. Neste caso, pode-se abler major P 
atraves do aumento do PCG, desde que tambem as plantas 
selecionadas tenham maiores valores de NES e de ALT. 
- 0 valor del obtido no SAEG para a correlacao parcial, é dado por: 
b) Observaccies oriundas de urn Delineament❑ 
Tratamentos e 3 Hepatica- es 
bl) Calcular as Correlaceies para cada Tratamento 
Procedimento Outras / Correlacoes 
Variaveis 	= P PCG NES ALT 
Quebra 	= THAT 
Tipo 	= Pearson 
Correlacoes de Pearson 
Variavel Variavel Obs Valor=1 Valor=2 Valor=3 Valor=4 Valor=5 
P PCG 3 0.9078 -0.5196 0.7805 -0.9522 0.5341 
P NES 3 -0.8660 0.4539 0.2774 0.9840 0.8242 
P ALT 3 -0.8386 -0.0656 0.7328 0.9826 0.2013 
PCG NES 3 -0.5766 -0.9972 0.8171 -0.8825 -0.0385 
PCG ALT 3 -0.5329 -0.8185 0.9973 -0.8790 -0.7206 
NES ALT 3 0.9986 0.8593 0.8570 1.0000 0.7206 
Observacao: 0 valor=1 se refere ao tratamento 1, o valor=2 ao tratamento 
2, e assim por diante, ate o valor=5, que se refere as correlacoes entre as vanaveis 
dentro do tratamento 5. 
4❑ 	 ANAUSES ESTATiSTICAS NO SAEG 
SAEG 
b2) Calcular as Correlacoes entre as Medias de Tratamentos 
Procedimento 	W Lltilitarios 1 Reducao 
Variaveis 	= P PCG NES ALT por THAT 
Tipo de Reducao = Media 
Definicao do novo arquivo no padrao SAEG 
Examinar: C:\Saeg\Dados 
Nome do arquivo: Correlm 
Arquivos do tipo: Texto (*.wst) 
Abrir 
ObservacOes Lidas 	 15 
Observacties Gravadas 	 5 
Variaveis Lidas 	 7 
Variaveis Gravadas 	 5 
Arquivos / Ativar Arquivo de Dados Existente 
C:ISaegIDados\Correlm.wst 
Procedimento = Outras / CorrelacOes 
Variaveis 	= P PCG NES ALT 
Tipo 	= Pearson 
Correlacoes de Pearson 
Variavel Variavel Observagoes Correlagao T Significancia 
P PCG 5 -0.0260 -0.0451 0.4834 
NES 5 0.8682 3.0312 0.0281 
P ALT 5 0.9067 3.7232 0.0169 
PCG NES 5 -0.1743 -0.3065 0.3896 
PCG ALT 5 -0.3628 -0.6742 0.2742 
NES ALT 5 0.9378 4.6799 0.0092 
ANIALISES ESTATi 	1 1CAS NO SAEG 
	
41 
5 Experimental corn 	 ATENCAO - Para acessar o arquivo gerado pela redugao (correlm.wsI), entre 
na °Kap Arquivos / Ativar Arquivo de Dados Existente. 
 
 
roi pa l 
P02 em que: 
1 	r12 	rip 
r12 	1 	r2p 1-02 
Pop rlp rep cop 1 
SAEG 
3. Analise de Trilha 
A analise de trilha (path analysis) consiste no estudo dos efeitos diretos e 
indiretos de variaveis sabre uma vanavel principal, atraves do desdobramento 
do coeficiente de correlacao. A decomposicao da correlacao a dependente do 
conjunto de variaveis estudadas, da importancia de cada uma e das possiveis 
inter-relacoes expressas em diagramas de trilha. A estimaliva dos efeitos diretos 
de p variaveis explicativas (X i , X2, ..., X), sabre uma variavel principal Y 6 obtida 
pela solucao do seguinte sistema de equacoes: 
1301 = efeito direto da variavel X, sobre a variavel Y; 
P02 ".= efeito direto da variavel X2 sobre a variavel Y; 
pop = efeito direto da variavel Xp sabre a variavel Y; 
1.01 = correlacao simples entre a variavel X, a a variavel Y; 
1.02 = correlacao simples entre a variavel X2 a a variavel Y; 
rap = correlacao simples entre a variavel X e a variavel Y; 
r12 = correlacao simples entre a variavel X, e a variavel X2; 
= correlagao simples entre a variavel X i e a variavel Xv; 
rep = correlacao simples entre a variavel X2 a a variavel X. 
0 coeficiente de determinacao do model() causal, qua mede os efeitos 
das p variaveis explicativas sobre a variavel Y. pode ser estimado por: 
= P0Ir01 +1)02r02 ±—±Poprop 
Tambern estirna-se a efeito da variavel residual sobre a variavel Y: 
= -,j(1—RO.12•-p 
SAEG 
4. Correlacao Canonica 
A analise de correlacao cananica caracteriza-se por avaliar as relagOes 
entre dois grupos influenciados, no minimo, por duns variaveis. Par exempla, 
citam-se as casos em qua se interessa avaliar as relacaes entre as variaveis 
da parte aerea corn as do sistema radicular, variaveis monolog ices corn 
fisiolOgicas, componentes primarios corn componentes secundarios da 
producao, etc. 
De maneira geral, considera-se que a primeiro grupo é estabelecido por 
p variaveis e a segundo par q. Q nOmero de correlacaes cananicas é igual ao 
manor ntinnero de variaveis de um dos grupos (p ou q), a sua magnitude sempre 
decresce corn a ordem em qua sao estimadas. Para cada correlacao cananica 
estimado urn par cane:mica (PC), sendo as dais grupos de variaveis X a Y, 
definidos a seguir: 
X' = [X, X2 ... Xp] = vetor de p variaveis que constiluem o grupo 1; 
= [Y,Y2 = vetor de q variaveisque constiluem o grupo 2. 
❑ objelivo a estimar a maxima correlacao entre as carnbinagOes lineares 
das variaveis do grupo 1 e do grupo 2, Bern coma estimar as respectivos 
coeficientes de ponderacoes das variaveis em cada combinacao linear. Sendo 
PCX1 e PCY, uma das combinacties lineares das variaveis dos grupos 1 e 2, 
respectivamente, tern-se: 
PCX, = ai X, + a2X2 + + apXp e 
PCY, 	+ 132Y2 + + bpi; em que: 
= [a, a2 ... ap] = vetor de p coeficientes de ponderacoes das variaveis do grupo 
1, associado ao PCX1; 
b' = [13, b2 ... bpi]. valor de q coeficientes de ponderacoes das variaveis do grupo 
2, associado ao PCY,. 
Define-se coma a primeira correlacao cananica aquela associada ao 
maior autovalor de uma matriz de ordem s x s e que maximiza a relagao entre as 
funcOes PCX, e PCY,, sendo as mesmas derominadas coma o primeiro par 
canOnico associado a esta correlacao canOnica, expressa por: 
rl 	
Cav(PCX1, PCY1[ ) 
	
= 	
IINTUDCX1)'V(PCX2) 
As demais correlacoes cananicas e os pares canonicos sao estirnados, 
utilizando-se Os demais autovalores em ordeal decrescente e os autovelores 
42 
	
ANAUSES ESTAT1ST1CAS NO SAEG ANALISES ESTATiSTICAS NO SAEG 
	
43 
 
 
!: 
SAEG 	 
correspondentes (vetores de coeficientes de ponderacbes), ate a p ou q 
correlacao estimada. 
0 teste de hipOtese para Ho: p, = p2 = = ps 0 (s = minim° {p, q}) 
realizado pela estatistica de qui-quadrado. Se esta hipOtese for rejeitada, testa-
se a hipatese Ho: pi > 0 e p2 .... = ps = 0, e assim por diante, ate a nao rejeicao 
de Ho. A significancia de pelo menos urn par canonic°, leva a conclusao de que 
os grupos considerados nao sao independentes, podendo-se utilizer seus 
coeficientes pare discuss -6es mais especfficas. Os pares canOnicos nao 
significativos podem ser utilizados pare avaliar o grau de importancia das variaveis 
dentro de cada grupo, nas correlagoes entre os grupos. Nestes casos, as maiores 
correlagOes em valores absolutos das variaveis corn estes pares canOnicos ou 
os maiores coeficientes de ponderacOes em valores absolutos destes pares 
canOnicos, estao associados as variaveis de menores importancias. 
Exercicio de Aplicacao 2.3 (trican.xls) 
Foram avaiiadas as variaveis explicativas X„ X2, ; e X4, e uma variavel 
dependente Y em 13 individuos. Determiner as estimativas dos efeitos diretos e 
indiretos sobre Y e as correlacOes canonicas entre os grupos 1 (X, e X2) e 2 (X3 
e X4). 
Arquivos / Ativar Arquivo de Dados Existente 
C:ISaeg\Dados\Trican.xls 
a) Analise de Trilha 
Procedimento = Outras / Coeficientes de Trilha 
Modelo 	= Y funcao X1 X2 X3 X4 
CorrelacOes de Pearson 
Variavel Variavel Observ. Correlagao Valor de T Significancia 
X1 13 0.731 3.550 0.002 
X2 13 0.816 4.686 0.000 
X3 13 -0.535 -2.098 0.030 
X4 13 -0.821 -4.775 0.000 
X1 X2 13 0.229 0.779 0.226 
Xi X3 13 -0.824 -4.826 0.000 
X1 X4 13 -0.245 -0.840 0.209 
X2 X3 13 -0.139 -0.466 0.325 
X2 X4 13 -0.973 -13.970 0.000 
X3 X4 13 0.030 0.098 0.462 
oicko 	 
Coeficientes de Trilha 
Efeito Direto 	de X1 	(pox ) 0.6065120 
Efeito Indireto de X1 Via X2 ( Tio2r12) 0.1206227 
Efeito Indireto de X1 Via X3 ( i)o31)3) -0.0357589 
Efeito Indireto de X1 Via X4 (13o4r14) 0.0393418 
Total - Diretos e Indiretos (roi) 0.7307175 
Efeito Direto 	de X2 	( 1302) 0.5277056 
Efeito Indireto de X2 Via X1 (1301r12 ) 0.1386362 
Efeito lndireto de X2 Via X3 ( iio3r23) -0.0060417 
Efeito lndireto de X2 Via X4 ( Poo-24) 0.1559524 
Total - Diretos e Indiretos (r02) 0.8162526 
Efeito Direto 	de X3 	(1303) 0.0433897 
Efeito Indireto de X3 Via Xi ( t3oirii3) -0.4998470 
Efeito Indireto de X3 Via X2 ( 6o2r23) -0.0734790 
Efeito Indireto de X3 Via X4 ( iiO4 r34 ) -0.0047344 
Total - Diretos e Indiretos 	(r03) -0.5346707 
Efeito Direto 	de X4 	(pod ) -0.1602874 
Efeito Indireto de X4 Via Xi (1)inri4) -0.1488654 
Delta lndireto de X4 Via X2 if 	r 
, ,02-24. -0.5134338 
Efeito Indireto de X4 Via X3 	603r34) 0.0012816 
Total - Diretos e Indiretos (r04) -0.8213050 
44 
	
ANALISES ESTATiST1CAS ND SAEG ANALISES ESTATISTICAS NO SAEG 
	
45 
 
 
 
SAEG 	 
Parametros Estimados 
 
Observacoes: 
 
= 0.6065x0.73072 + 0.5277x0.8163 + 0.0434x-0.5347 + RL234 	 ( 	) 	Autovalor 	Correlacao 	Lambda 	Qui-Ouadrado 	GL 	Signif. 
(-0.1603)x(-0.8213) 
0.9969996 0.998499 	0.001128 	71.27138 	4 	0.00000 
RL234 = 	 0.6242195 	 0.375781 0.4431816 + 0.4307615 - 0.0232059 + 0.1316543 = 0.98237. 	 0.790076 	 10.27688 	1 	0.00153 - 
=V1-0.98237 =0.132778- 
Qs efeitos diretos de X3 e X4 sabre Y, sao relativamente pequenos 
quando se compare corn o efeito residual. Entao, as influencias dessas 
variaveis sabre Y devem ser rnaiores atraves das correlacoes corn as 
outras variaveis, mostradas pelo efeito indireto de ; via X, e do efeito 
indireto de X4 via X2, como tambern verificadas pelas altas correlacoes 
negatives entre cis pares das variaveis, ou seja de X, corn X3 e de X2 
corn X4. 
- As contribuicoes das variaveis X3 e X4 sao tambem consideravelmente 
baixas pare o coeficiente de delerminacao, ou seja, contribuem pouco 
-"j.1234- para a determinacao de Y, como vista no calculo do P 
- As estimativas dos efeitos diretos comparativamente elevadas a corn 
mesmo sinai das correlacoes corn a variavel Y, indicam que as variaveis 
e X2 sao as principals determinantes das veriaciDes da variavel 
principal. 
- As correlacoes oblides nao levam em consideracao os camponentes 
de covariancias, caso as dados sejam oriundos de delineamentas 
experimentais. 
b) Correlacgo Cananica 
Procedimento = Multivarladas Correlecao CanOnica 
Variaveis 	= X1 X2 corn X3 X4 
Matriz de Correlagao 
X1 X2 X3 X4 
X1 1.00000 0.22858 -0.82413 -0.24545 
X2 0.22858 1.00000 -0.13924 -0.97295 
X3 -0.82413 -0.13924 1.00000 0.02954 
X4 -0.24545 -0.97295 0.02954 1.00000 
Coeficientes Canonicos 
Variaveis 	 Coeficiente 
Grupo 1 	 12 PC 	 22 PC 
X1 	 -0.33186 	 0.96288 
X2 	 -0.88117 	 -0.53654 
Grupo 2 
X3 	 0.36934 	 -0.92131 
X4 	 0.92929 	 0.38882 
Correlacao 	 0.99850 	 0.79008 
Correlagoes corn Variaveis 
Variaveis 	 CorrelaCOes 
Grupo 1 	 12 PC 	 22 PC 
X1 	 -0.33186 	 0.96288 
X2 	 -0.07586 	 0.22010 
Grupo 2 
X3 	 0.36934 	 -0.92131 
X4 	 0.01091 	 -0.02721 
❑bservacao: Conciui-se que os grupos considerados nao sao 
independentes (correlacoes significativas a 1% de probabiiidade), e que as 
associagOes intergrupos sao estabelecidas principalmente, pelas influencias de: 
menores valores para X2 sao determinantes pare o aumento dos valores de X, 
(12 par cananico, X2 = -0.88117 a X, = 0.92929) e maiores valores para X, sao 
determinantes pare a diminuicao dos valores de X3 (22 parcanOnico, X, = 0.96288 
e X3 = -0.92131). Se o 22 par canonic() fosse nao significative, as interpretacOes 
46 ANALISES ESTATiST1CAS NO SAEG 	ANALISES ESTATISTICAS ND SAEG 	 47 
 
 
SAEG 	 
sobre as correlacifies seriam analisadas no -P par canonic°, e as variaveis menos 
importantes para as correlacOes entre os grupos seriam a X1, do grupo 1, e a X3, 
do grupo 2, devido as maiores correlacOes com o 2R par canonic° ou aos maiores 
coeficientes de ponderacOes associados ao nnesmo. 
SAEG 
 
 
 CAPi1111.0 
TESTE t DE STUDENT 
 
 
E aplicado para testar hipOteses referentes a medias populacionais, 
quando as variaveis apresentam-se normatmente distribuidas corn variancias 
desconhecidas. Se It ail tiab, a urn nivel a de significancia corn n' graus de 
liberdade, rejeita-se Ho, caso cantrario, nao se rejeita Ho. 
1. Caso de Duos Amostras Independentes 
0 objetivo e testar hipateses sobre medias de diferentes populacOes X e 
Y, quando duas amostras distintas referentes as duas populacoes sao retiradas. 
As hipateses sao: Ho: mx = myvs mx # my ou Hat: mx > my ou Has: mx < my. 
Em todo o desenvolvimento, sera aplicada uma hipOtese alternativa 
bilateral, em furicao dessa ser a realizada no SAEG. 
Antes da aplicacao do teste t sobre as medias, deve-se utilizar o teste F 
para verificar se as variancias das duas populacfiessao homogeneas ou nao, 
ou seja, se elas sao estatisticamente iguais ou nao. 0 teste F é realizado corn 
as duas seguintes hiptiteses: Ho': 	612 = 62 vs Ha': 64 > cr2 
Corn os valores das variancias amostrais, obtem-se o valor de F, dado 
por: 
2 
Fcal — SX 
Sy 
A regra é escoiher a amostra que apresentar a major variancia como 
s2x . Em outras palavras, deve-se sempre colocar a major variancia no 
numerador, de modo a obter urn valor calculado de F maior que 1 e o valor 
tabelado atraves da tabela unilateral para F > 1, corn n, = (nx-1) e n2 . (ny-1) 
graus de liberdade. Se F., Fib rejeita-se Ho', caso contrario nao se rejeita 
Ho', a urn nivel a de significancia. 
ANALISES ESTATfSTICAS NO SAEG 4B 49 ANALISES ESTATISTIOAS NO SAEG 
 
 
SAEG 
SAEG 
Se Ho' nao for rejeitada, admite-se que os valores assumidos par sX e 
2 	- sy serao estimativas de uma variancia comum a2, podendo assim, combine-
las: 
2 (nx -1)d +(ny - 1)g, 
SC 	 , em que: nx +n -2 
2 
sc = variancia amostral comum; 
sx = variancia da amostra X; 
Sy= variancia da amostra Y; 
nx numero de elementos da amostra X; 
n = ntimero de elementos da amostra Y. 
Neste caso, deve-se usar o teste t corn n" igual a nx+ny-2 graus de 
liberdade: 
R-V 
rix 
em que: 
t 
X -Y 
	
teal =- 	2 	
2 
S X 
 +
SY e 
n X ny 
(
2 	2 2 
8X Sy 
rix ± fly 
n*- 2 
S 1 jc 12 1 2 Sy 
l'IX ) 	fly) 
nx -1 
+ 	
ny -1 
Exercicio de Aplicagao 3.1 (ttind.xls) 
Considere urn experimento para testar a duragao em 1000 km (KM) de 
quatro marcas de amortecedores, onde 15 veiculos receberam o amortecedor 
da marca 1, 13 veiculos receberam o da marca 2, 10 veiculos receberam'o da 
mama 3 e 12 veiculos receberam o da marca 4. 
fly 
= media da amostra X; 
-17 =. media da amostra Y. 
Se Ho' for rejeitada, admite-se que as variancias populacionais sac) 
diferentes e, portanto, nao faz sentido combiner os valores assumidos por s2x 
e s2y. A estatistica que deve ser usada é o teste t corn n' igual a n* graus de 
liberdade: 
Arquivos / Ativar Arquivo de Dados Existente 
CASaeg\DadosVitind.xls 
a) Comparar a Marca 1 corn a Marca 2 
Procedimento = Utilitarios / Selecionar Observacbes 
Parametros = MARCA = 1 2 
Subtftulo 	= MARCAS 1 E 2 
Observacao: A descricao do subtitulo a importante para discriminar as 
paginas a serem impresses epos a selecao dos dados. 
Procedimento = Outras / Teste de t 
Veriaveis 	= KM por MARCA 
C 
2 	1 
' 
ANALISES ESTATISTICAS NO SAEG 51 
ANALISES ESTATISTICAS NO SAEG 50 
 
 
T 	GL 	Prob. 	F 	GL1 GL 2 Prob. Variancias 
MARCA 
3 
4 
Variancias T 	GL 	Prob. 	F 	GL1 GL2 Prob. 
Dados 	Medias 
	
Desvio 	Erro Padrao 
10 	41.6890 
12 	28.0642 
8.0599 
1.7047 
2.5488 
0.4921 
Observacaes: 
As variancias das populacOes das duas marcas nao foram homogeneas 
pelo taste F (P = 0.0000), e as marcas 3 e 4 apresentaram medias 
diferentes pet() teste de t, sendo a maior, a media 3 (P = 0.0004), 
considerando-se c(=1%. 
Casa seja desejado trabaihar corn todos os dados do arquivo, é 
necessario dear em Utilitarios / Recuperar apas Selecao. 
SAEG 	 
MARCA 	Dados 	Medias 
1 
2 
15 	27.5573 	3.3161 
13 	28.4777 	3.4274 
Desvio 	Erro Padrao 
Homogenea 	0.7212 26.0 0.4772 * 1.0682 12 14 0.8959 
Nao-homogenea 0.7194 25.2 0.4786 
Observacao: As variancias das populacaes das duas marcas foram 
homogeneas de acordo corn o testa F (P = 0.8959), e as marcas 1 e 2 
apresentaram medias estatisticarnente iguais pelo teste t (P = 0.4772), 
considerando-se os niveis de significancia iguais a 1 ou 5%. 
b) Comparar a Marca 3 corn a Marca 4 
Procedimento = Utilitarios / Selecionar Observacaes 
Para metros = MARCA = 3 4 
Subtitulo 	= MARCAS 3 E 4 
Procedimento = Outras / Taste de I 
Variaveis 	= KM por MARCA 
Homagenea 	5.7308 20.0 0.0000 * 22.3543 9 	11 0.0000 
Nao-homogenea 5.2487 9.7 	0.0004 * 
2. Caso de Duas Amostras Relacionadas 
Sao utilizadas quando a necessario analisar o caso de duas populacties 
dependentes. Neste caso, a variavel de interesse sera a diferenca entre os pares 
das duas amostras, no lugar das prOprias amostras, que devem ter o mesmo 
tamanho. As hipoteses testadas podem ser: Ho: b = 0 vs Hai: 5 0 ou 
Ha,: D > 0 ou Ha3: p < 0, em que 15 representa a media da diferenca entre 
as duas populacoes. 
0 taste t corn n' igual a n-1 graus de liberdade é dada por: 
tea; = 	 so 1, em que: 
= media das diferencas entre as pares das duas amostras; 
s(d) = 
 so) 
= erro padrao da media das diferencas entre os pares das duas 
-4n 
amostras; 
s(d) = desvio padrao das diferencas entre os pares das duas amostras; 
n = nunnero de diferengas entre os pares das duas amostras. 
Exercicio de Aplicacao 3.2 (ttpar.xls) 
Urn novo aditivo fd desenvolvido corn o objetivo de aumentar o km rodado 
por urn litro de combustive!. Para testar o produto, foram setecionados ao acaso 
24 veiculos, obtendo-se os resultados, antes e depois, da utilizacao do aditivo. 
ANALISES ESTATiSTICAS NO SAEG ANALISES ESTATIST1CAS NO SAEG 52 53 
SAEG 
0.8562 
0.9506 
 
 
SAEG 	 
Arquivos / Ativar Arquivo de Dados Existenle 
C:\SaeglDadosITtpar.xls 
Procedimento = Outras / Testa de t 
Variaveis 	= ANTES corn DEPOIS 
Variaveis 	Dados 	Medias 	Desvios 	T 	GL 	Prob. 
ANTES 
	
9.6625 
	
2.5748 
Diferenca 
	
24 	-0.6958 
	
0.6843 	-4.982 	23 	0.0001 
DEPOlS 
	
10.3583 
	
2.6294 
Observagao: 0 aditivo foi eficiente em aumentar a km rodada, pois a 
diferenca negativa (ANTES - DEPOIS) foi significativa, ao nivel de 1% de 
probabilidade, pefo tests t = 0.0001). 
LO 
INTERVALO DE CONFIANCA 
A estimacao de urn parametro populacional pode-se dar atraves de Urn 
estimador pontuai, isto é, especifica-se uma Tunica estimativa. Por exempla, a 
media amostral 	é urn estimador pontual da media da populagao mx, para a 
variavel X. Entretanto, em mullos casos, prefere-se uma estimativa intervalar 
que expresse a precisao do estimador. 
1. Para a Media Populacional quando a Variancia 6 Desconhecida 
1.1. Dados Oriundos de uma Amostra 
0 intervalo de canfianga é urn intervalo limitado por dais valores e usado 
pare estimar a media desconhecida de uma populacao, de forma que se possa 
afirmar corn uma probabilidade de acerto, que o verdadeiro valor do parametro 
estara contido nesse intervalo. 0 intervalo de confianga para a media populacional 
corn urn nivel de confianca 1—a, é dado por: 
T(±t ,, s(X) , em que: 
= valor de t tabelado ao nivel a corn n-1 graus de liberdade. 
Se o nivel de confiarica for de 95% a se foram retiradas urn grande nunnera 
de amostras, espera-se que 95% dos intervalos calculados contenham a media 
da populacao. No entanta, uma vez feita uma estimativa para o intervalo corn 
base em uma arnostra, ela estara certa ou errada, porem corn 95% de 
probabilidade de acerto. 0 intervalo de manor amplitude significa uma estimativa 
de major precisao. 
Exercicio de Aplioacao 4.1 (descrit.xls) 
Considere as dados oblidos pelas medidas das alturas (ALT) e pesos 
ANALISES ES 	IATiSTICAS NO SAEG 54 
ANALISES ESTATiSTICAS NO SAEG 
 
 
SAEG 	 
(PESO) de 100 indivicluos, em cm e kg, respectivamente. 
Arquivos 1 Ativar Arquivo de Dados Existente 
CASaeglDados\Descrit.xls 
Procedimento = Univariadas 1 Estatisticas Simples (1) 
Variaveis 	= ALT PESO 
ALT PESO 
NOmero de Observacdes 100 100 
Media Geral 171.450000 71.047000 
Desvia Padrao 8.123261 8.901395 
Intervalo de Confianca P (0.05) 1.616529 1.771378 
Observacoes: 
- 0 intervalo de confianca P (0.05) da coma resultado a valor da 
expressao t 	, em qua 
t.
a =1.99, corn 99 graus de liberdade e a= 5%. 
-V11 	 2 
- Para a variavel ALT, tem-se a
5
: 171.450000 ± 1.616529. 
- Para a variavel PESO, tern-se o IC(m)a95:)095: 71.047000 ± 1.771378. 
1.2. Dados Oriundos de urn Delineamento Experimental 
Casa as dados sejam obticlos de urn delineamenta experimental e 
apropriados para a execucOo de uma analise de variancia, o intervalo de 
confianca pode ser estabelecido segundo dais criterios, de acordo corn 
resultado do testa F paraa fonte de variacao tratamentos: 
a) Taste F nao significativo: 6 estabelecido urn intervalo de confianca para 
a media geral corn urn nivel de confianca 1—a, dada par: 
QMRes 
IC(m),_: ± ta
n 	
em gue: 
- 	- 
eh = media observada de todas as unidades experimentais; 
n = numero total de unidades experimentais; 
QMRes = quadrado media do residua da analise de variancia; 
t 	valor de t tabelado ao nivel a corn n' graus de liberdade do residua. 
SAEG 
b) Testa F significativo: a estabelecido separadamente, urn intervalo de 
confianca para cada media de tratamento corn um nivel de confianca 1—a, dada 
par: 
QMRes 
IC(mi)i _.: 	t -it a 	 , ern que:r
2 
rh= media observada do tratamento i; 
r. numero de repetic6es do tratamento i; 
QMRes = quadrado media do residua da analise de variancia; 
tc, = valor de t tabelado ao nivel a corn n' graus de liberdade do residua. 
ANALISES ESTATiSTICAS NO SAEG 
	
57 56 
	
ANALISES ESTATiSTICAS NO SAEG 
 
 
CAPiTU 
VALIDADE DA ANALISE DE VARIANCIA 
Para se fazer uma analise de variancia, quatro hipateses basicas devem 
ser estritamente ou aproximadamente satisfeitas. 
1. Aditividade 
Os efeitos que ocorrem no modelo estatistico devem ser aditivos. A nao-
aditividade pode ocorrer em fungao de alguma observacaqapresentar resultado 
muito discrepante da caracteristica que esta sendo estudada. A identificagao do 
valor discrepante dependera da experiencia e atengao do pesquisador. Pode 
tambem ser devida a interagao dos efeitos principals. Neste caso, a diferenca 
entre tratamentos nao é constante para as diversas repetigOes. 
2. Independencia dos Erros 
Os erros experimentais ou desvios devidos aos fatores nao controlados 
devem ser independentes. Isto implica que as efeitos de tratamentos tambem 
sejam independentes. Essa independencia dos erros pode ser assegurada por 
urn dos processos basicos da experimentagao que é a casualizagao. As 
correlagOes entre os erros frequentemente nao sao notadas, ja que as sues 
presengas sao de diffcil detecgao. 
3. Normalidade dos Erros 
Os erros experimentais el devemter distribuigao normal de probabilidades. 
Para verificar esta pressuposigao, testam-se os erros experimentais 
estimados eq. Se o resultado de normalidade for satisfeito, isto implica que os 
valores observados Yij se ajustam tambem a uma distribuigao normal. 
ANALISES ESTATISTICAS NO SAEG 
	
59 
 
 
SAEG 	 
3.1. Teste de Assimetria 
A estimative do coeficiente de assimetria (s), corn base nos erros 
experimentais estimados 	é dada par: 
3 
t r, 	_ e
f
t} 
	
IA J.1 Steil 	, em que: 
= 	 
eii = media dos erros experimentais estimados; 
s(es t,) = desvio padrao amostral dos erros experimentais estimados; 
t = I- imer° de tratamentos; 
rrjrnero de repeticifies do tratamento i; 
n = nOmero total de uniclades experimentais. 
As hipOteses Ho: s = 0 vs Ha: s 0 serao testadas. Se o resultado obtido 
for rejeitar a hipOtese de nulidade, diz-se que os dados nao estao distribuidos 
normalmente. Porem, se nao rejeitar, diz-se que os dados podem ester 
distribuidos normalmente. 
3.2. Teste de Curtose 
Para se estimar o grau de curtose (k), corn base nos erros experimentais 
estimados eii, utiliza-se a seguinte fOrmula: 
L 
	e 	,\ 4 
i=i 	s 	) 
As hipateses Ho: k = 3 vs Ha: k 3 sera° testadas. Se o resultado for 
rejeitar Ho, diz-se que o afastamento do achatamento da distribuicao é 
significativo em relagao a distribuicao normal. 
Bo 	 ANALISES ESTATISTICAS NO SAEG 
SAEG 	 
3.3. Teste de Lilliefors 
O teste de Lilliefors pressupOe o calculo de todos os valores padronizados 
(z), os quaffs devem ser ordenados em ordem crescente, pare as seguintes 
consideracOes: 
F(z,) = FE, = P 	= area da tabela de distribuicao normal 
padronizada; 
5(;) = Mr = n,/n, em que: 
FE, = freq0encla esperada para os valores s zi; 
FO, = frequencia observada para os valores < zi; 
n, = nOrnero de valores em ordem crescente zi; 
n = nOrnero total de observaciies da amostra; 
e — 
s(61i ) • 
0 valor calculado do teste 6 dado por: Dca, = Maximo IF(z,) — S(z,)I. 
O teste é bilateral, coma segue: 
Ho: 6 razoavel estudar os dados atraves da distribuicao normal; 
Ha: nao é razoavel estudar os dados atraves da distribuicao normal. 
Rejeita-se a hipOtese de nulidade, quando a valor de D., ?_ Drab, a tim 
nivel cc de significancia corn n observaciies, caso contrario nao se rejeita Ho. 
4. Homogeneidade de Variancias dos Erros 
Os erros experimentais e1I devem ter homogeneidade de variancias, ou 
seja, devem possuir uma variancia comum 62. Isto implica que a variabilidade 
das repetici5es de urn tratamento deve ser semelhante a dos outros tratamentos, 
isto e, os tratamentos devem possuir variancias homogeneas. Sendo 
QMResiduo usado coma termo de comparagao na analise de variancia, havers 
uma perda de eficiencia nas estimativas dos efeitos de tratamentos e perda de 
sensibilidade dos testes de comparacoes de medias, se ete for obtido a partir 
de variancias diferentes de tratamentos. Para verificar esta pressuposicao, 
testam-se as variancias amostrais dos erros experimentais estimados eij de 
cada tratamento, dadas por s2i. Este e a hipOtese a que os pesquisadores tern 
dada maior enfase. 
4.1. Teste de Cochran 
E usado quando o numero de graus de liberdade e o mesmo para todas 
as variancias, ou seja, quando a niimero de repeticaes forem iguais pare todos 
ANALISES ESTATISTICAS NO SAEG 
	
81 
 
 
1=1 
, em que: 
= 1+ , 
30 —1) 
I 1 	 1 
1=-1 
- 
SAEG 
Os tratamentos. 0 teste é dada por: 
2 
s max C h = t 
S 
As hip:Mesas a serem testadas sao: 
Ho: al = cr3 = • • • = cri2 vs Ha: pelo menos uma das variancias difere das demais. 
0 valor de Ch., sera comparado ao tabelado, corn (t, r-1) graus de 
liberdade, a urn nivel cc de significancia. Rejeita-se a hip:Mese Ho de 
homogeneidade de variancias quando Chtab. 
4.2. Teste de Bartlett 
E usado para festal- se as estimativas de variancias corn r-1 graus de 
liberdade de t tratamentos sao iguais, ou seja, quando o nOmero de repeticoes 
por tratamento foram desiguais. 0 teste é o seguinte: 
(ri -1)s 
E `ri1-1)log 	 E (ri -1) 
= nOmero de repetigoes do tratamento i; 
s = variancia amostral do tratamento i. 
As hipOteses a serem testadas sac): 
Ho: 0-12 = cr = • -• = 6t2 vs Ha: pelo menos uma das variancias difere das demais. 
Sob a hipOtese de nulidade de que Os valores assumidos por s2, sera° 
estimativas de urn mesmo valor 02 (variancia comum), a razao M/C tern 
distribuicao aproximada de qui-quadrado (e), onde C é urn fator de correcao, 
dado por: 
AEG 	 
Rejeita-se a hipotese Ho de homogeneidade de variancias quando o valor 
calculado da razao M/C x2ta,,, a urn nivel of de significancia, corn t-1 graus de 
liberdade. 
Exercicio de Aplicacao 5.1 (correl.xls) 
Considere as avaliacoes das variaveis producao de graos em kg (ID), peso 
de cem graos em kg (PCG), fluffier° de espigas por planta (NES) e altura de 
planta em m (ALT). Para a variavel P, verificar as pressuposigoes de normalidade 
e de homogeneidade dos erros, da analise de variancia. 
Arquivos / Ativar Arquivo de Dados Existente 
c:\Saeg\Dados\Correl.xls 
Delineamento Inteiramente Casualizado 
0 erro experimental estimado associado a observacao Yii e dada por: 
= Yii 	, em que: 
rni = 	= media observada do tratamento i; 
r1 
= Total do tratamento i; 
= nUmero de repeticOes do tratamento i. 
Drocedimento = Univariadas / Estatisticas corn Quebras (S) 
Jariaveis 	= P por TRAT 
Estatisticas corn Quebras 
)escricao Valores Medias Desvios • 	Dados 
rotal Gera! 2.169333 0.4532969 15 
PRAT 1 1.990000 0.1587451 3 
rRAT 2 1.513333 0.1457166 3 
rRAT 3 2.340000 0.1300000 3 
['RAT 4 2.330000 -0.4331282 3 
ERAT 5 2.673333 0.1738774 3 
M =-- 2,3026 
62 \NALISES ESTATiSTICAS NO SAEG 63 ANALISES ESTATiSTICAS NO SAEG 
 
 
SAM 	 SAEG 
 
 
Procedimento = Utilitarios / Comandos 
Arquivo a ser criado: C:\Saeg\Dados\Correl.cmd 
Processar 
Procedimento = Outras / Testes de Cochran eBartlett 
Variaveis 	= P EPDIC por TRAT 
Testes de COCHRAN a BARTLETT 
Variaveis Nome do Teste Valor Calculado Valor (P=0.05) Valor (P=0.01) 
Cochran 0.6672 0.684 0.789 
p Bartlett 3.9909 9.488 13.277 
EPDIC Cochran 0.6672 0.684 0.789 
EPDIC Bartlett 3.9910 9.488 13.277 
Cafouler 
Se 
Se 
Se 
Se 
Se 
Executer 
EPD1C=P*1 
TRAT=1 entao EPDIC=P-1.99 
TRAT=2 entao EPDIC=P-1.513333 
TRAT=3 entao EPDIC=P-2.34 
TRAT=4 entao EPDIC=P-2.33 
TRAT=5 entao EPDIC=P-2.673333 
Arquivo / Sair 
Deseja salver as alteracoes? Sim 
Observacdes Lidas 	 15 
Observacifses Gravadas 	15 
Variaveis Lidas 	 7 
Variaveis Totais 	 8 
Valores Perdidos 	 0 
Erros Encontrados 	 0 
Procedimento = Univariadas / Estatfsticas Simples (1) 
Variaveis 	= EPDIC 
EPDIC 
Ass imetria 	 0.896577 
Probab. da Assimetria=0 	 0.305552 
Curtose 	 3.097409 
Probab. da Curtose=0 	 0.457302 
Procedimento = Outras / Taste de Lilliefors 
Variaveis 	= EPDIC 
Taste de Lilliefors 
Variaveis 	Valor Calculado 	Valor (P=0.05) 
EPDIC 	 0.2843 	 0.220 
64 
	
ANAUSES ESTA-fiSTICAS NO SAEG 
❑bservaceies: 
- Os testes estatisticos consistem em verificar se determined° valor 
estimado a partir de uma amostra, difere significativamente do seu 
resulted° esperado, de acordo com a hipOtese Ho formulada pare urn 
determined° parametro da populacao. Portanto, os testes acima foram 
aplicados as estimativas dos erros experimentais. 
- No delinearnento inteiramente casualizado, os testes de Cochran e de 
Bartlett podem ser aplicados diretamente aos valores observados Yu, 
sem perder a validade de verificacao da homogeneidade de variancias 
dos erros. 
Algumas vezes, aparecern asterisms referentes aos valores tabelados 
dos testes de Cochran a de Bartlett, o que significarn valores nao 
encontrados nas tabelas, devido as mesma nao apresentarem todos 
os graus de liberdade. Nestes casos, é preciso recorrer as tabela para 
encontrar os valores tabelados a 5 ou a 1% de probabilidade, dos 
ref eridos testes. 
b) Delineamento em Blocos Casualizados 
0 erro experimental estimado associado a observacao Y9 é dad° por: 
= — rri, 	+m, em que: 
13 
mt =
t 
= media observada do bloco j; 
B = total do bloco j; 
G 
In = —
n 
= media geral do experimento; 
G = total geral do experimento. 
	
ANALISES ESTAT1STICAS NO SAEG 	 65 
Valor (P=0.01) 
0.257 
 
 
SAEG 	 
Se 
Se 
Se 
Executer 
 
TRAT=5 a BL000=1 entao EPDBC=P-2.673333-2.036-F2.169333 
e BL000.2 entao EPDBC =P-2.673333-2.064+2.169333 
TRAT=5 e BLOCO=3 entao EPDBC=P-2.673333-2.408+2.169333 
Arquivo / Sair 
D eseja salver as ateracoes? Sim 
Procedimento = Utilitarios / Comandos 
Arquivo encontrado: CASaeg\Dados\Correlcmd 
Processar 
Calcular 
Se 
Se 
Se 
Se 
Se 
Calcular 
Se 
Se 
Se 
Se 
Se 
Se 
Se 
Se 
Se 
Se 
Se 
Se 
EPDIC=P*1 
TRAT=1 entao EPDIC=P-1.99 
TRAT=2 entao EPDIC=P-1.513333 
TRAT=3 entao EPDIC=P-2.34 
TRAT=4 entao EPDIC=P-2.33 
TRAT=5 entao EPDIC=P-2.673333 
EPDBC=P*2 
TRAT=1 e BLOCO=1 
TRAT=1 e 13L000=2 
TRAT=1 e BL000=3 
TRAT=2 e BL000=1 
TRAT=2 e BL000=2 
TRAT=2 e BLOCO=3 
TRAT=3 a BLOCO=1 
TRAT=3 e BL000=2 
TRAT=3 e BLOCO=3 
TRAT=4 a BLOCO=1 
TRAT=4 e BLOCO=2 
TRAT=4 e BLOCO=3 
enter) EP DB C=P-1 .99-2.036+2.169333 
entao EP DBC=P-1.99-2.064+2.169333 
entao EPDBC=P-1.99-2.408+2.169333 
entao E PDBC= P-1.513333-2.036+2.169333 
entao EPDBC=P-1.513333-2.064+2.169333 
entao EPDBC=P-1.513333-2.408+2.169333 
entao EPDBC=P-2.34-2.036+2.169333 
entao EPDBC=P-2.34-2.064+2.169333 
entao EP DBC=P-2.34-2.408+2.169333 
entao EP D B C=P-2.33-2.036+2.169333 
entao EPDBC=P-2.33-2.064+2.169333 
entao EPDBC=P-2.33-2.408+2.169333 
SAEG 	 
Procedimento = Univariadas / Estatisticas corn Quebras (S) 
Variaveis = P por BLOCO 
Descricao Valores Medias Desvios Dados 
Total Gera! 2.169333 0.4532969 15 
BLOCO 1 2.036000 0.4275278 5 
BLOCO 2 2.064000 0.4276447 5 
BLOCO 3 2.408000 0.4962056 5 
Observecoes Lidas 	 15 
Observacbes Gravadas 	15 
Variaveis Lidas 	 8 
Variaveis Totals 	 9 
Valores Perdidos 	 0 
Erros Encontrados 	 0 
Procedimento = Univeriadas / Estatisticas Simples (1) 
Variaveis 	= EPDBC 
EPDBC 
Assirnetria 	 0.871690 
Probab. da Assimetria=0 	 0.310473 
Curtose 	 4.051058 
Probab. da Curtose=0 	 0.129192 
Procedimento = Outras / Taste de Lilliefors 
Variaveis 	= EPDBC 
Taste de Lilliefors 
Variaveis 
EPDBC 
 
Valor Calculado 
0.1914 
 
Valor (P=0.05) 
0.220 
 
Valor (P=0.01) 
0.257 
 
67 ANALISES ESTATISTICAS NO SAEG ANALISFS ESTATISTICAS NO SAEG 66 
 
 
SAEG 	 
Procedimento = Outras / Testes de Cochran e Bartlett 
Variaveis 
Testes 
= EPDBC por TRAT 
de COCHRAN 	e BARTLETT 
Variaveis Nome do Testa Valor Calculado Valor (P=0.05) Valor (P=0.01) 
EPDBC Cochran 0.7780 0.684 0.789 
EPDBC Bartlett 6.9769 9.488 13.277 
5. Transformacoes de Dados 
Sao necessarias quando pelo menos uma das candle -6es da analise de 
variancia nao forem satisfeitas. Quando uma transformacao for feita, deve-se 
verificar novamente as condicoes para a analise e todas as comparacOes devem 
ser realizadas na nova escala. 
5.1. Transformacao Raiz Quadrada 
A transformacao .15Z e feita quando as dados observados de uma variavel 
X seguem distribuicao de Poisson, na qual a media e a variancia sao iguais. 
Esta distribuicao se refere a contagern do numero de vezes que ocorre urn 
determinado evento por unidade de tempo ou por uma unidade de medida. Pode 
tarnbern ser usada quando a variancia de X é proporcional a media de X e para 
dados de porcentagens baseados em contagens, sendo a amplitude de 0 a 
20% ou de 80 a 100%, rnas nao ambas. Quando os dados estao situados entre 
80 e 100%, ales devem ser subtraklos de 100 antes da transformagao. Quando 
entre os dados ocorremvalores pequenos inferiores a 10 e, principalmente zeros, 
as transformacOes recomendadas sao Vx+ 0.5 , 	ouV.TC..)-17F 1 - 
5.2. Transformacao Logaritmica 
A transformacao logX ou InX e utilizada quando os desvios padrOes variam 
diretamente corn as medias dos diversos tratamentos, ou seja, quando o 
coeficiente de variacao 6 constante de tratamento para tratamento. Esse tipo 
de relacao entre a media e o desvio padre° e encontrado geralmente quando 
os efeitos sao multiplicativos em lugar de aditivos. 
Essa transformacao e indicada para observaeOes corn nOmeros inteiros 
SAEG 
positivos que cobrem uma grande amplitude, sendo que nao pode ser usada 
diretamente quando ocorrem zeros ou quando alguns dos valores sao menores 
que 10. Nesta aim, a transformacao log (X + 1) e a mais indicada. 
5.3. Transformacao Angular 
E recomendavel para dados expressos em porcentagens, que geralmente 
seguem distribuicao binomial, ou seja, para aquelas variaveis que apresentam 
somente doffs resuttados possiveis em cada avaliagao. Porem, se as 
porcentagens estiverem entre 30 e 70%, a transformacao angular nao sera 
necessaria. A transformacao tambern sera desnecessaria quando as 
porcentagens forem resultantes da divisao dos dados observados por urn valor 
constante ou quando sao representativas de concentracao. Para uma variavel 
X, esta transformagao é dada por: arcsenpic . 
100 
Exercicio de Aplicacao 5.2 (transf.xls) 
Considere as avaliacOes das caracteristicas numero de plantas atacadas 
(NPA), numero de insetos coletados (NIC) e porcentagens de danos (PDN) de 
3 tratamentos (THAT) corn 5 repeticoes. 
Arquivos / Ativar Arquivo de Dados Existente 
CASaeg\Dados\Transf.xls 
Procedimento = Utilitarios / Comandos 
Arquivo a ser criado: CASaeg\Dados\Transf.cmd 
Processar 
Calcular 
	
RNPA=raiz(NPA) 
Calcular 
	
LN1C=tog(NIC) 
Calcular 
	
ASPDN=arsen(raiz(PDN/100)) 
Executar 
Arquivo / Sair 
Deseja salvar as alteraeOes? Sim 
ObservagOes Lidas 	 15 
Observaeoes Gravadas 	15 
Variaveis Lidas 	 5 
Variaveis Totais 	 8 
Valores Perdidos 	 0 
Erros Encontrados 	 0 
69 
	
ANALISES ESTATISTICAS NO SAEG ANALISES ESTATISTICAS NO SAEG 
	
69 
 
 
SAEG 
Procedimento = Outras / Teste de Lilliefors 
Variaveis 
Teste 
= NPA NIC PDN RNPA LNIC ASPDN 
de

Mais conteúdos dessa disciplina