Prévia do material em texto
Guia pratico para utilizacao do saEG SAEG INTRODUCAO 11 CAPITULO 1 Estatistica Descritiva 13 1. Medidas de Posicao 13 1.1. Media 13 1.1.1. Media Aritmetica 13 1.1.2. Media Geometrica 14 1.1.3. Media Harmonica 14 1.2. Mediana 15 1.3. Moda 15 2. Medidas de Dispersdo 16 2.1. Amplitude Total 16 2.2. Variancia 16 2.3. Desvio Padrao 17 2.4. Coeficiente de Variacao 17 2.5. Erro Padrao da Media 17 3. Medida de Assimetria 18 4. Medida de Curtose 18 5. DistribuicOes de Frequencias 19 6. Graficos 20 6.1. Histograma 20 6.2. Grafico Ramo e Foihas 20 6.3. Grefico em Setores 21 6.4. Grano() Polar 21 6.5. Diagrama de Dispersao 21 Exercicio de Aplicacao 1.1 21 ANALISES ESTATESI !CAS NO SAEG SAEG CAPITULO 2 Relack) entre Variaveis 1. Correlack Simples 33 33 SAEG 4.1. Teste de Cochran 4.2. Teste de Bartlett Exercicio de Aplicagao 5.1 5. Transformacoes de Dados 61 62 63 68 1.1. Correlagao de Pearson 34 5.1. Transformacao Raiz Ouadrada 68 1.2. Correlacao de Spearman 35 5.2. Transformacao Logaritmica 68 2. Correlacao Partial 36 5.3. Transformacao Angular 69 Exercicio de Aplicacao 2.1 37 Exercicio de Aplicacao 5.2 69 Exercicio de Aplicagao 2.2 38 3. Analise de Trilha 42 CAPitULO 6 4. Correlagao Caniinica 43 Estatistica Nal Parametrica 71 Exercicio de Aplicacao 2.3 44 1. Teste de Wilcoxon 71 CAPITULO 3 Exercicio de Aplicacao 6.1 72 Teste t de Student 49 2. Teste de Kruskal-Wallis 72 1. Caso de Duas Amostras Independentes 49 Exercicio de Aplicacao 6.2 73 Exercicio de Aplicacao 3.1 51 2. Caso de Duas Amostras Relacionadas 53 CAPITULO 7 Exercicio de Aplicacao 3.2 53 Experimentos corn Urn Fator 77 1. Delineamento Inteiramente Casualizado 77 CAPITULO 4 2. Delineamento em Blocos Casualizados 78 Intervalo de Contianca 55 3. Delineamento em Quadrado Latino 80 1. Para a Media Populacional quando a Variancia é Desconhecida 55 4. Testes de Comparacties Multiples 81 1.1. Dados Onundos de uma Amostra 55 4.1. Teste de Tukey 82 Exercicio de Aplicacao 4.1 55 4.2. Teste de Duncan 82 1.2. Dados Oriundos de urn Delineamento Experimental 56 4.3. Teste de Student Newman Keuls 83 4.4. Criteria de Scott-Knott 83 CAPiTU LO 5 Exercicio de Aplicacao 7.1 83 Validade de Analise de Variancia 59 Exercicio de Aplicagao 7.2 88 1. Aditividade 59 Exercicio de Aplicagao 7.3 90 2. Independencia dos Erros 59 5. ❑esdobrarnento dos Graus de Liberdade de 3. Normalidade dos Erros 59 Tratamentos em Contrastes Ortogonais 92 3.1. Teste de Assimetria 60 Exercicio de Aplicacao 7.4 93 3.2. Teste de Curtose 60 6. Experimentos ern Blocos incompletos Balanceados 97 3.3. Teste de Lilliefors 61 Exercicio de Aplicagao 7.5 101 4. Homogeneidade de Variancias dos Erros .. 61 Exercicio de Aplicagao 7.6 102 Exercicio de Aplicacao 7.7 104 6 ANALISES ESTATIST1CAS NO SAEG ANAUSES Eb IATiSTICAS NO SAEG 7 SAEG CAPiTULO 8 SAEG CAPiTULO 9 Experimentos com mais de Urn Fator 107 Analise Conjunta de Experimentos 157 1. Experimentos corn Dais Fatores 107 Exercicio de Apficacao 9.1 158 1.1. Experimentos Fatoriais 107 1.1.1. Comparacties de Medias 110 CAPITULO 10 1.1.1.1. Interacao Nao Significativa 110 Analise de Covariancia 165 1.1.1.2. Interacao Significativa 111 Exercicio de Aplicacao 10.1 166 1.2. Experimentos em Parcelas Subdivididas 112 1.2.1. Comparacties de Medias 113 CAPITULO -11 1.2.1.1. Interacao Nao Significativa 113 Analise de Regressao 169 1.2.1.2. Internal Significative 114 1. Regressao Linear corn Uma Variavel lnidependente 169 Exercicio de Aplicagao 8.1 114 1.1. Dados sem Repeticao 171 Exercicio de Ap1icacao 8.2 129 1.1.1. Analise de Regressao 171 1.3. Experimentos corn Classificacao Hierarquica 133 Exercicio de Aplicacao 11.1 173 Exercicio de Aplicacao 8.3 134 1.2. Dados corn Repeticao 180 2. Experimentos corn Tres Fatores 135 1.2.1. Experimentos corn Urn Fator Quantitativo 180 2.1. Experimentos Fatoriais 137 1.2.1.1. Analise de Variancia 180 2.1.1. ComparacOes de Medias 138 1.2.1.2. Analise de Regressao 180 2.1.1.1. Interacao Ndo Significativa 138 1.2.1.2.1. ObservacOes Individuals 181 2.1.1.2. Interacao Significativa 140 1.2.1.2.2. Totais de Tratamentos 182 2.1.1.2.1. Interacao AxB 140 1.2.1.2.3. Medias de Tratamentos 183 2.1.1.2.2. Interacao AxC 141 1.2.1.3. Teste t Para os Parametros 184 2.1.1.2.3. Interacao BxC 142 Exercicio de Aplicacao 11.2 186 2.1.1.2.4. Interacao AxBxC 143 1.2.2. Experimentos corn Um Fator Qualitativo e 2.2. Experimentos em Parcelas Sub-subdivididas 145 Urn Fator Quantitativo 207 2.2.1. Comparacaes de Medias 147 Exercicio de Aplicacao 11.3 207 2.2.1.1. Interacao Nao Significativa 147 2. Regressao Linear Multipla 217 2.2.1.2. Interacao Significative ....147 Exercicio de Aplicacao 11.4 218 2.2.1.2.1. Interacao AxB 147 3. Regressao {Tao Linear 221 2.2.1.2.2. Interagao AxC 148 Exercicio de Aplicacao 11.5 222 2.2.1.2.3. Interacao BxC 149 4. Regressao Linear Response Plateau (LAP) 224 2.2.1.2.4. Interacao AxBxC 149 Exercicio de Aplicacao 11.6 225 Exercicio de Aplicacao 8.4 150 ANALISES ESTATiSTICAS NO SAEG ANALISES ESTAT(STICAS NO SAEG 9 SAM CAPITULO 12 Superficie de Resposta 227 Exercicio de Aplicac5o 12.1 227 Exercicio de Aplicacao 12.2 231 CAI:4111LO 13 AnaIlse Muitivariada 237 Exercicio de Aplicacao 13.1 238 CAPITULO 14 AnaIlse de Agrupamento 241 1. Medidas de ❑ issinnitaridade 242 1.1. Distancia Euclidiana 242 1.2. Distal-Iola de Mahalanobis 243 1.3. Ouiras Medidas 244 Exercicio de Aplicacao 14.1 244 CAPITULO 15 Componentes Principais 257 Exercicio de Apficacao 15.1 260 CAPITULO 16 Variavels Caneinicas 269 Exercicio de Aplicacao 16.1 271 Exercicio de Aplicacao 16.2 277 CAPITULO 17 Analise Discriminante 283 Exercicio de Aplicacao 17.1 284 CAPITULO 18 Analise de Fatores 288 Exercicio de Aplicagao 18.1 292 131BLIOGRAFIA 301 SAEG INTROD 1 Os arquivos de dados devem conter na primeirafinha o nome das variavers formadas par uma se palavra em letras maiusculas, e devem ser criados numa pasta que nao contenha os arquivos executaveis do programa SAEG, coma per exempla, na pasta de trabalho CASaeg \Dados. Este recomendacao torna o trabalho mais organizado, alem de que quaisquer manipulacaes feitas nos arquivos, nao irao comprometer o programa, ja que o mesmo cria na pasta de trabalho, outros arquivos corn extensdes diferentes e corn a mesmo name fornecido pelo usuario. Os resultados das analises geradas pelos procedimentos estatfsticos, podem ser editados, impresses ou salvos corn extensao "doc", pare posterior acesso por editores de textos, sendo todos os resultados salvos incluidos no mesmo arquivo. Nos arquivos criados no padrao texto, as cases decimals dos valores numericos devem ser separadas par ponto. Quando ocorrerern valores perdidos para uma ou mais unidades experimentais, baste digital- urn ponto decimal no local do valor perdido. Nos arquivos do tipo Excel, Lotus e SmartSuite-Lotus, os dados nurnericos sao sempre alinhados a direita na celula, sendo qualquer outra formatacao sem significado para fins de calculo. Portant°, dependendo da configuracao, as casas decimals dos valores numericos podem ser separadas por ponto ou par virgule. Quando ocorrerem valores perdidos para uma ou mais unidades experimentais, as celulas dos arquivos de dados correspondentes a esses valores, devem ser deixadas em Branco. Casa ocorram variavels que sao combinacifes de Quiresavaliadas no experimento, cujos resultados foram obtidos atraves de formulas, devem-se substituf-las por valores numericas. Nestes tipos de arquivos, deve-se evifar quaisquer tipos de formataci5es, preocupando-se somenie corn a correta digilacao dos dados. Os passos pare acessar o arquivo de dados sac) os seguintes: - Arquivos / Myer Arquivo de dados Existente; - Informer a nome, o tipo do arquivo e o diretOrio onde se enconire; - Informer corretamente a padrao de armazenamento dos dados; ANALISES ESTA7fSTICAS NO SAEG 1 1 10 ANALISES FRTATIST1CAS NO SAEG SAEG - A descrieao do titulo é necessaria, caso seja importante sua impressao junto aos resultados das analises; - Observar corn atencao o resultado da descried° do arquivo; - Observar se a conversao foi executada. Antes de executar qualquer analise estalfstica, é importante utilizar o procedimento Utilitarios / Listar Dados, para verificar a autenticidade dos dados digitados e, conseqUentemente, ter total seguranca sobre os resultados obtidos. Para sair do SAEG sem eliminar os arquivos gerados para processamento posterior, clica-se em Arquivos / Sair do SAEG. Para eliminar os arquivos para processamento posterior, é necessario antes de sair, clicar em Utilitarios / Eliminar Arquivo Ativo. Todos os arquivos de dados desenvolvidos coma exercfcios de aplicagoes para os procedimentos estatisticos abordados, estao inclufdos no disquete de 3,5" HD quo acompanha o livro, como arquivos do tipo texto (*.txt), arquivos do tipo Microsoft Excel (*.xls) e arquivos do tipo Lotus 1-2-3 (*.wk1). SAEG CA iTULOI ESTAT1STICA DESCRITIVA E a parte da estatfstica que tern a finalidade de descrever os dados amostrais por meio de medidas de posicao, de dispersao, de assimetria, de curtose e da apresentacao em tabelas ou graficos, sem fazer nenhuma inferencia sabre a populagao dos dados. 1. Medidas de Posicao Sao chamadas medidas de tendencia central,. pois representam as caracterfsticas avaliadas pelos seus valores medics, em torno dos quais tandem a concentrar-se os dados. Tais medidas possibilitam comparagoes de series de dados pelo confronto de seus valores. 1.1. Media E a medida mais comumente usada para descrever resumidamente uma serie de dados. Ha varios tipos de medias, sendo quo as mesmas podem ser influenciadas pelos valores extremos da serie. 1.1.1. Media Aritmetica A media aritmetica é obtida pela soma de todos os valores de uma variavel X dividida pelo numero total de observaeOes (n): 1_ X +X2+—+X, X— — n Entretanto, se na serie existirem dados repetidos, os k diferentes valores da variavel X podem ser agrupados, ou seja, a cada valor Xi estara associada uma respective freqUencia f,, obtendo-se entao, a media aritmetica ponderada: 1=1 ANALISES ESTATISTICAS NO SAEG ANALISES ESTATIST1CAS NO SAEG 13 12 SAEG SAEG k X — f1X1 f2X2 -FikXk 1-1 -1- f2 ' +fit EfiXi f , ern que: 1.1.2. Media Geornetrica A media geannetrica a definida coma a raiz de ordem n do produto de todos os valores que uma variavel X assume, sendo dada por: = -ijX] •X2--Xn r Xi 1=1 Se a cada X estiver associada uma respectiva treq0encia f, entao: Xc = "11)(11 •)q...Xk = Ir Lima propriedade importante desta medida, a que o produto das razOes de cada observacao pela media geometrica a igual a urn. Como desvantagem, se a serie de dados tiver valores menores ou iguais a zero, a media geometrica nao podera ser calculada. 1.1.3. Media Harmonica A media harmOnica a definida como o inverso da media aritmetica dos :inversos dos valores da serie de dados: n n XH 1 1 1` n 1 Xi + X2 Xn X 1=1 I Se os cliterentes valores X1, X2, Xk de uma variavel X, estiverem associados as fregClencias f„ f2, respectivarnente, entao: 14 ANALISES ESTAT[S11CAS NO SAEG fl + f2 +...+ f k 1=1 fl f f2 k X] X2 Xk Xi Se a serie tiver pelo menos urn elemento nulo, a media harm:Mica nao podera ser calculada. Em termos de valores, a media harmOnica a menor que a media geometrica, que é manor que a media aritmetica, para urn mesmo conjunlo de dados. Nos casos em que nao se comentar o tipo de media, estara se tratando da media aritmetica. 1.2. Mediana Colocados os valores em ordem crescente de grandeza (rol), a mediana (Md) sera o valor que ocupa a posicao central da serie de dados, ou seja, é o valor que divide a serie em dues panes corn niimeros iguais de elementos. A mediana a preferivel a media quando se este interesssado em conhecer exatamente o centro da distribuicao dos dados, ou ainda, quando as valores extrernos podem afetar sensivelmente a media. 0 calculo da mediana é feito sob duas condicoes: X r,_,1 a) n impar: Md sera o valor do rol que ocupa a posicao Xn +X n+2 2 2 b) n par: Md sera o valor do rol que ocupa a posicao Essa ideia de dividir o conjunto ordenado de dados em pales iguais pole ser estendida em: quartil, decil e percentil. Os quartis Qv 02 e 02 dividem a serie de dados em quatro pales iguais, cada parte corn 25% dos dados. Os decis D1, E:15, ..., D9 dividem a serie em dez partes iguais, cada parte corn 10% dos dados. Os percentis P i , Pp, ..., P50, ..., P99 dividem a serie em cem partes iguais, cada parte corn 1% dos dados. Em termos de comparacoes entre estas medidas, tem-se: 02 = D5 = Pso = Md. 1.3. Moda A moda (Mo) e o valor que ocorre corn major fregOencia ou o valor que mais se repete. Quando a serie de dados 6 sal que as freqUencias sao maiores ANALISES ESTATiSTICAS NO SAES 15 2 SAM X1 , X2, ..., Xh de uma variavel X, associados as freqUencias fl, fv fk , respectivamente, sere dada por: k k XI 1'1 k 2.3. desvio Padrao Para se retornar a unidade original de avaliaga❑ de uma variavel X e obter uma medida de melhor interpretagao, define-se o desvio padrao coma sendo a raiz quadrada positiva da variancia: s(X)= is2 (X) Intuitivamente, a desvio representa a media do's desvios absolutos que todos os valores amostrais possuem ao redor da media. Valores da serie prOximos uns dos outros originam urn desvio padrao manor, enquanto valores muito afastados uns dos outros dao urn desvio padrao maior. A serie de dados que apresentar desvio padrao maior, bra uma distribuigao de frequencias mais aberta qua a serie corn desvio padrao manor. 2.4. Coeficiente de Variacao E uma medida admensional, util para compararvariabilidades de diferentes amostras, onde as medias saa muito desiguais ou as unidades de medidas sao diferentes. 0 coeficiente de variagao (CV) 6 a desvio padre() expresso em porcentagem da media, sendo dada por: s(x) CV(%)= 100 2.5. Erro Padre° da Media O erro padrao da media representa a variabilidade media entre as medias amostrais possiveis de saran coletadas e da ideia da precisao da estimativa ANALISF:q ESTATiSTICAS NO SAEG 17 1,1 Efi Efi(x, s2(X)= 1=1 If, —1 1,1 SAEG nos extremos, ou quando se quer destacar um valor de alta frequencia ou quando se pretende obter uma medida rapida a aproximada da tendencia central, a moda pode entao, ser considerada para a interpretagao dos dados. Corn relacao a moda, uma serie de dados pixie ser classificada em amodal (nao possui moda), unimodal (possui apenas uma moda), bimodal (possui dues modas) ou multinnodal (possui mais de duas modas). 2_ Medidas de ❑ispersao Sao utilizadas para avaliar ❑ grau de variabilidade dos dados. Nao se justifica ca;cular uma media de urn conjunto de dados onde nao haja variagao, todavia se a variabilidade desses for muito grande, a representatividade da media sera muito pequena. Assim, 6 importante caracterizar a dispersao dos dados, uma vez que diferentes amostras corn medias semelhantes, p❑dem apresentar diferentes variabilidades. 2.1. Amplitude Total E a diferenga entre o maior e a manor dos valores da serie de dados, ou seja, e ❑ maior desvio da amostra. A sua ulilizagao, Wen] de mostraro maxima desvio, serve para uma avaliacao preliminar dos dados, verificando-se a possibilidade de passiveis erros nas coletas dos dados ou nas digitacOes, ja que as variaveis podem apresentar extremos con hecidos. AT =X — maior menor' 2.2. Vanancia A variancia mode a dispersao dos valores em torno da media. A variancia dada pela soma de quadrados dos desvios de dada observagaa em relagao media, dividida polo nOrnero de graus de liberdade da amostra, ou seja, ela 6 a media dos n-1 desvios quadraticos a independentes. Assim, se a unidade de uma variavel for por exempla m, a variancia tare coma resultado m2. Para uma amostra de n valores X1, X2, ..., X, de uma variavel X, a variancia dada par: IX! E _yo2 2 , s 2 (X)= 1'1 1.1 n-1 Se na serie existirem dados repetidos, a variancia dos k diferentes valores 16 ANALJSES ESTATISTICAS NO SAEG SAEG obtida para a media, sendo que aquela que apresentar major erro padrao lard manor precisao. Ele a inversamente proporcional ao tamanho da amostra e diretamente proporcional ao desvio padrao da amostra, sendo definido coma: s(5-‹)__ E usual apresentar a media e o erro padrao da media corn a seguinte indicacao: R±s(R). 3. Medida de Assimetria Denornina-se assimetria o grau de afastamento da simetria de uma dislribuicao de dados. Em uma distribuicao sinnetrica, tern-se igualdade dos valores da media, mediana e moda. Entretanto, se numa distribuicao ocorrer: - X < Md < Mo: existirao mais dados da serie maiores do que a media, porem a curva da distribuicao tera uma cauda mais longa para os dados menores do que a media, isto 6, diz-se que a distribuicao tern assimetria negativa. - X Md > Mo: existirao mais dados da serie menores do que a media, porem a curva da distribuicao tera uma cauda mais longa para os dados maiores do que a media, isto 6, diz-se que a distribuicao tern assimetria positiva. A estimativa do coeficiente de assimetria (s) de uma varievel X é dada por: 3 v Xi X SOO Se ❑ resultado for zero, a distribuicao a simetrica, se ❑ resultado for --negativo, a distribuicao a assimetrica negativa (inclinada para a esquerda) e se o resultado for positivo, a distribuicao é assimetrica positiva (inclinada para a -direita). 4. 1\iledida de Curtose Denomina-se curtose o grau de achatamento da distribuicao. Para se estimar o grau de curtose (k), utiliza-se a seguinte fOrmula: 4 in (Xi — X = s(X) SAEG Se o resultado for igual a tits, entao a distribuicao de frequencias 6 a propria distribuicao normal, sendo chamada de mesocOrtica, se o resultado for manor do qua tres, entao a clistribuicao e achatada (alta variabilidade) e chamada de planictIrtica e se o resultado for maiar do que ties, a distribuicao 6 concentrada em torn° da media, distruibuicao corn pica (alta homogeneidade) a chamada de leptacUrlica. 5. Distribuicoes de FreqUencias Ao estudar grandes conjuntos de dados, a conveniente resumi-las numa tabela, atraves do agrupamento dos dados em classes, com suas respectivas frequencias. Quando os dados sao discretos corn valores repetidos, a simples identificacao dos mesmos corn as respectivas freqUencias, pode ser urn procedinnento adequado. Quando os dados sao continuos, pode acontecer que poucos, ou ate nenhum dales, apresente freqUencia. Nestes casos, o procedimento comeca pela definicao de classes. Cada classe e determinada por urn interval° (diferenca entre Os limites superior a inferior). Na estalfstica descritiva, o interval° aberto a direita, onde a variavel assume o valor do extremo inferior (LI; x < LS), 6 o mais usado. HO diversos metodos para determinar o nOnnero de classes (k), sendo apresentado os seguintes: a) k = , se n > 25, caso contraria, k = 5; b) k = 1 + 3,22 log n (regra de Sturges); c) born senso a experiencia. 0 segundo passo na construcao da tabela de freqiiencias a determinar aproximadamente o interval° de classe (h): 11- AT k 1 B ANALISES ESTATiSTICAS NO SAEG ANALISES ESTATiSTICAS NO SAEG 19 SAEG SAEG Tabela 1.1. FreqUencias de determinadas classes obtidas de observagOes urn nUmero em duas parles. 0 ramo consiste nos algarismos rnais a esquerda, originals Classes fa fr. far. PM. 1 LI, I— LS1 ft ft ft /Ft f t /Ft (Llt+LS1)/2 2 LI, LS2 f2 1(42 f21Ft (f t4f2)1F, (L12-EL52)/2 3 LI3 1— LS3 t3 f3/F. (t,+f2+f3)/F, (L13+1_53)/2 k Llk LSk fk F, fk/F, 1 (L1k+LSk)/2 (treqUencia simples) = numero de elementos contidos na classe i; (frequencia acumulada) = f, da classe I somada as f das classes anteriores; (frequbncia total) = nOmero total de dados (f1+12+...+10; f (f requencia relativa) = f da classe i dividida pela F,; (frequencia acumulada relativa) = fa, da classe i dividida pela pont° medio da classe i. A partir dos dados originals ou dos dados distribuidos em classes, podem- !-43 represents-los graficamente. 6_ Graficos 6.1. Histograma E uma representagao grafica dos resultados das distribuigOes de frequencias construida de retangulos justapostos, cujas alturas sao os segmentos de retas dados pelas frequencias de cada classe e cujas larguras sao proporcionadas pelo h. Quando for desejado, pode-se apresentar o polfgono de freqUencia por • ..uma linha, que une os pontos medios das bases superiores dos retangulos quo o compEiem. Para finalizar, pi5e-se uma classe antes da primeira e uma depois da Ultima, marcando-se os dois pontos medics corn freqUencias nulas. Uma outra maneira de representar graficamente, é atraves do polfgano de freqUencia acumulada (ogiva), quo a tracado utilizando-se as frequencias acumuladas a partir dos limites superiores de cada classe. 6.2. Grafico Ramo e Folhas Permite classificar os dados originals, sem perda de informagao, segundo urn padrao que revels a distribuigao dos mesmos. 0 padrao consiste em separar e as folhas consistem nos algarismos mail a direita. 6.3. Grafico em Setores Ilustra graficamente uma distribuigao de fregOencias como fatias de uma pizza. Para construf-lo, parte-se do principio de que o nrimero total de observaceies corresponde a 360°. 6.4. Grafico Polar Para construf-lo, divide-se uma circunferencia em tantos arcos iguais quantas forem as classes a serem representadas. Palos pontos de divisas tragam-se os raios. Em cada raio a representado urn valor, marcando-se urn panto cuja distancia ao centro é diretamente proportional ao valor da frequencia da classe. E tambem chamado de "radar'. 6.5. Diagrama de Dispersao E urn grafico que envolve os dados originais de duas variavels X e Y. Para a sua construgao, traga-se urn eixo horizontal para os valores da primeira variavel e urn eixo vertical para as valores da segunda, marcando-se os pontos correspondentes. 0 padrao dos pontos costuma ajudar a determinar se existe algum relacionamento entre as duas variaveis. Exercicio de Aplicacao 1.1 (descrit.xls) Considere os dados obtidos pelas medidas das alturas (ALT) e pesos (PESO) de 100 indivicluos, ern cm e kg, respectivamente. Estudar, de forma descritiva, a variavel ALT. Arquivos / Ativar Arquivo de Dados Existente CASaeglDados\Descrit.xls Procedimento = Univariadas I Estatisticas Simples (1) Variaveis = ALT Warner() de ObservagOes 100 Media Geral 171.450000 Desvio Padrao 8.123261 Erro Padrao 0.812326 Coeficiente de Variagao 4.737977 20 ANALISES ESTATiSTICAS NO SAEG ANALISES ESTATiSTICAS ND SAEG 21 SAEG Maximo 190.000000 Minim° 151.000000 Amplitude 39.000000 Assimetria —0.013643 Probab. da Assimetria=0 0.500000 C u nose 2.890362 Probab. da Curtose=0 0.479098 Observacao: Para a interpretacao dos valores de assimetria e de curtose, deve-se analisar os valores das probabilidades associadas. Se estes valores forem maiores do que 0.05 0110.01, a medida de assimetria e significativamente igual a zero e a medida de curtose 6 significativamente igual a tres, considerando-se os niveis de significancia de 5% ou de 1%, respectivamente. Procedimento = Univariadas / Estatisticas Simples (2) Variaveis = ALT Box-Piot = Sim interval° = FOrmula Media Aritrnetica (100) 171.4500 Media Geometrica (100) 171.2589 Media Harmonica (100) 171.0670 Percentil 1 151.0200 Percentil 5 156.1000 Percentil 10 161.1000 Percentil 25 .. Quartil 1 167.0000 Percentil 50 .. Quartil 2 Mediana 170.5000 Percentil 75 .. Quartil 3 177.0000 Percentil 90 182.0000 Percentil 95 185.9500 Percentil 99 190.0000 Moda 168.0000 SAEG Grafica de Gaihos e Folhas NOrnero Galho Folhas (1) 151 0 (1) 153 0 (1) 154 0 (1) 155 0 (1) 156 0 (1) 158 0 (1) 159 0 (1) 160 0 (2) 161 00 (3) 162 000 (2) 163 00 (1) 164 0 (2) 165 00 (4) 166 0000 (6) 167 000000 (9) 168 000000000 (8) 169 00000000 (5) 170 00000 (4) 171 0000 (4) 172 0000 (3) 173 000 (4) 174 0000 (5) 175 00000 (3) 176 000 (7) 177 0000000 (1) 178 0 (1) 179 0 (2) 180 00 (4) 181 0000 4) 182 0000 (1) 183 0 (1) 184 0 (1) 185 0 (1) 186 0 (1) 187 0 (1) 188 0 (2) 190 0 22 ANALISES ESTATIST1CAS NO SAEG 23 ANALISES ESTATiST1CAS NO SAEG SAEG GRAFICO ESQUEMATICO (B❑XPL❑T) Fregilencias da Variavel **ALT** Apas Recodificacao em **8** Classes SAEG Nunnera Galho I B❑XPL❑T (1) 151 ❑ (1) 153 ❑ (1) 154 ❑ ( 1) 155 ❑ ( 1) 156 (1) 158 (1) 159 (1) 160 (2) 161 (3) 162 (2) 163 (1) 164 (2) 165 (4) 166 (6) 167 + (9) 168 1 (8) 169 l (5) 170 (4) 171 I X 1 (4) 172 I I (3) 173 I I (4) 174 I I (5) 175 I I (3) 176 1 I (7) 177 + -1- (1) 178 I (t) 179 I (2) 180 I (4) 181 I (4) 182 I (1) 183 l (1) 184 1 (1) 185 I (1) 186 0 (1) 187 0 (1) 188 0 (2) 190 0 Valor Minima Valor Maximo ❑ados Freq.Simples Freq.Acum. Classes 151.0000 155.8750 4 4.000 4.000 1 155.8750 160.7500 4 4.000 8.000 2 160.7500 165.6250 10 10.000 18.000 3 165.6250 170.5000 32 32.000 50.000 4 170.5000 175.3750 20 20.000 70.000 5 175.3750 180.2500 14 14.000 84.000 6 180.2500 185.1250 11 11.000 95.000 7 185.1250 190.0000 5 5.000 100.000 8 ❑bservacbes: Quando a sada de dados tern mais de uma moda, o programa reconhece apenas uma, que é a de manor valor. Caso haja interesse nesta medida, seria irnportante usar a procedimento Univariadas / Frequencias Simples, que gem a freq0encia de urn valor observado canto sendo a nOmera de repOigOes (Jesse valor. Portanta, na existencia de mais de uma moda, alas serao os valores que possuem a mesma frquencia simples maxima. No grafica de galhos e folhas, Os valores colocados a esquerda sao Os valores situados a esquerda da casa decimal, e as valores colocados a direita Sao as valores situados a direita da casa decimal. Caso ocorram valores muito grandes ou corn mais de uma casa decimal, os valores a esquerda sao multiplicados par uma constante, e Os da direita, representados por urn Unica valor aproximado. Na caixa central do "box-plot" estao agrupados 50% dos valores amastrais, sendo 25% na parte abaixo da mediana (X = 170,5) a 25% na parte acima. No inicia da caixa, tern-se o 12 quartil igual a 167 e, no final da caixa, tem-se o 3Q quarlil igual a 177. Na parte inferior a caixa, encontram-se 25% dos valores a mostrais e, na parte superior, encontram-se os restantes 25% dos dados. Para determinar o ralmero de classes (k), pode-se informal- na opcao "intervalo", valores de 2 a 13, ou escolher a item formula. Nesta Ultima escolha, a regra de Sturges sera utilizada no SAEG, para a determinacao do k. 24 ANJALISES ESTATiSTICAS NO SAEG ANALISES ESTATfSTICAS NO SAEG 25 Procedirnento = Univariadas / FreqUencias Simples Variaveis = ALT Histograma = Sim Observacao: Apes manipular o grafico, clicar em Arquivo / Abandonar. Tabela de Freqfiencias Descricao Valor Casos Simples Acurns.ilada Seq. ALT 151.00 1 1.000 1.000 1 ALT 153.00 1 1.000 2.000 2 ALT 154.00 1 1.000 3.000 3 ALT 155.00 1 1.000 4.000 4 ALT 156.00 1 1.000 5.000 5 ALT 158.00 1 1.000 6.000 6 ALT 159.00 1 1.000 7.000 7 ALT 160.00 1 1.000 8.000 8 ALT 161.00 2 2.000 10.000 9 ALT 162.00 3 3.000 13.000 10 ALT 163.00 2 2.000 15.000 11 ALT 164.00 1 1.000 16.000 12 ALT 165.00 2 2.000 18.000 13 ALT 166.00 4 4.000 22.000 14 SAEG SAEG ALT 167.00 6 6.000 28.000 15 ALT 168.00 9 9.000 37.000 16 ALT 169.00 8 8.000 45.000 17 ALT 170.00 5 5.000 50.000 18 ALT 171.00 4 4.000 54.000 19 ALT 172.00 4 4.000 58.000 20 ALT 173.00 3 3.000 61.000 21 ALT 174.00 4 4.000 65.000 22 ALT 175.00 5 5.000 70.000 23 ALT 176.00 3 3.000 73.000 24 ALT 177.00 7 7.000 80.000 25 ALT 178.00 1 1.000 81.000 26 ALT 179.00 1 1.000 82.000 27 ALT 180.00 2 2.000 84.000 28 ALT 181.00 4 4.000 88.000 29 ALT 182.00 4 4.000 92.000 30 ALT 183.00 1 1.000 93.000 31 ALT 184.00 1 1.000 94.000 32 ALT 185.00 1 1.000 95.000 33 ALT 186.00 1 1.000 96.000 34 ALT 187.00 1 1.000 97.000 35 ALT 188.00 1 1.000 98.000 36 ALT 90.00 2 2.000 100.000 37 Total Geral 100 100.000 100.000 37 Observacao: Como o rainier° de valores diferentes para a variavel ALT é muito grande (37) e corn freq0encias pequenas, torna-se necessario criar classes de intervalos continuos, para melhor visualizacao do grAfico. Para o exempla, sera° utilizadas as alto classes fornecidas anteriarmente, pelo procedimento Univariadas / Estatisticas Simples (2). Proceclimento ,-. Utilitarios / Comandos Arquivo a ser criado: CASaeglDados\Descrit.cmd Calcular DFALT = ALT*1 Recodificar DFALT (151 ate 155.875 = 1)(155.875 ate 160.75 = 2) (160.75 ate 165.625 = 3)(165.625 ate 170.5 .-- 4)(170.5 ate 175.375= 5)(175.375 ate 180.25 = 6)(180.25 ate 185.125 = 7)(185.125 ate 190.1 = 8) Executar 26 ANALISES ESTATiST1CAS NO SAEG ANALISES ESTATiST1CAS NO SAEG 27 SAEG SAEG Arquivo / Sair Deseja salver as alteracijes? Sim ObservacOes Lidas 100 ObservacOes Gravadas 100 Variaveis Lidas 3 Variaveis Totals 4 Valores Perdidos 0 Erros Encontrados 0 ObservacOes: O comando calcular gera novas variaveis par meio de expressOes aritmeticas envolvendo variaveis je existentes no arquivo de dados. A variavel DFALT foi criada corn a finalidade de que os valores originais da variavel ALT, nao sejam alterados. O comando recodificar altera todos os valores contidos nos intervalos continuos pare a valor especificado, criando-se neste caso, uma nova variavel corn apenas 8 valores diferentes e repetitivos. 0 comando recodificar reconhece intervalos fechados a esquerda e abertos a direita. Par isso, pode-se repetir os limites superiores das classes anteriores como limites inferiores das subsequentes, e no final, deve-se fornecer urn valor maior que o valor maxima da sone de dados. Procedimento = Univariadas / Frequencies Simples Variaveis = DFALT Histograma = Sim Observacoes: - Para a construca'o do grafico, o procedimento Univariadas / Histogramas poderia, tambern, ser utilizado. - Os seguintes tipos de graficos podem ser construidos: histograma vertical, histograma horizontal, grafico de setores, grafico polar e disperser) simples. Abaixo, sea mostrados mais dais tipos de graficos. - Ap6s manipular o grafico, clicar em Arquivo / Abandonar. Grefico em Setores Grafico Polar ANALJSES ESTATiSTICAS NO SAEG 29 28 ANALISES ESTATISTICAS NO SAEG 170 180 190 ALT 150 160 0,06 0,05 0,04 00:0023 1 "- ..► 0,01 ..... 40 0 150 160 170 180 190 ALT SAEG Tabela de Frequencies Descricao Valor Casos Simples Acumulada Seq. DFALT 1.00 4 4.000 4.000 1 DFALT 2.00 4 4.000 8.000 2 DFALT 3.00 10 10.000 18.000 3 DFALT 4.00 32 32.000 50.00❑ 4 DEALT 5.00 20 20.000 70.000 5 DFALT 6.00 14 14.000 84.000 6 DFALT 7.00 11 11.000 95.000 7 DEALT 8.00 5 5.000 100.000 8 Total Gera! 100 100.000 100.000 8 Procedimento = Univariadas/ Dispersao Variaveis = ALT por PESO Padrao = Simples SAEG Procedimento = Univariadas / Graficos Equagao = Y=(1/20.3620yexp(-1/2*(ALT-171.45).(ALT-171.45)165.9874) Intervalo = ALT = 150,191 Observecoes: - Este procedimento gera um grafico de dispersao simples, de acoido corn uma fOrmula fornecida, por exemplo, a funcao densidade de probabilidade da distribuicao normal, representada por Y, igual a: 2 x- a ) 2 , em ue: ti f(x) = - x representa os valores da variavet ALT; - os valores assumidos pelos parametros is a cr, foram respectivamente, de 171.45 e de 8.123261. - No grafico existem 37 pontos, representando Os 37 valores diferentes da variavel ALT, corn as sues respectivas freqUencias esperadas. 3 0 ANALISES ESTATISTICAS NO SAEG ANIAL1SES ESTATISTICAS NO SAEG 31 SAEG AMMO 7 RELAcA0 ENTRE VARIAVEIS 1. Correlagao Simples Made corn qua intensidade se manifesta uma asseciacao entre duas variaveis. 0 coeficiente de cerrelacao é urn numero puro, sem unidade ou dimensae, que varia entre —1 e 1. 0 coeficiente de correlacao linear é usado para expressar o quanto os pontos se aproximam de uma reta imaginaria. Urn coeficiente prOximo da unidade positiva ou negativa, significa uma grande concentracao dos pontos em tomb da reta, enquanto que urn coeficiente menor, significa major dispersao dos pontos em relacao a esta rata. Valores positives indicam a tendencia de uma variavel aumentar quando a outra aumenta. Quando o coeficiente 6 negativo, valores altos de uma variavei estao associados a valores baixos da outra. 0 coeficiente de correlacao entre duas variaveis X e Y, e urn Unico valor definido pela expressao: SPDxy que: r Cov(X, Y) n-1 SPDxy xy ern VIT(X).v(y) ilSODx SQDy IISQDx • SQDy n-1 n-1 Cov (X, Y) = covariancia amostral entre as variaveis X a Y; V (X) = variancia amostral da variavel X; (V) = variancia amostral da vanavel Y; SPDxy = some dos produtos dos desvios em relacao as medias de X e Y; SOD, = soma dos quadrados dos desvios em relacao a media de X; SOD, = soma dos quadrados dos desvios em relacao a media de Y; ANIALISES ESTATISTICAS NO SAEG 33 r= 111 n 1Ni — (yi - 7 2 i=1 34 ANAL1SES ESTATiSTICAS NO SAEG n(n 2 -1) 6/c1 i=1 emque: -1- SAEG n = numero de pares de observagOes das variaveis X e Y. Quando as dados sac' oriundos de delineamentos, as variancias podem ser obtidas a partir dos quadrados medios das analises de variancias individuals, e a covariancia a partir do produto media. E muito importante lembrar que, ao estimar as coeficientes de correlagoes de dados experimentais, deve-se respeitar o model❑ ennpregacia, a fim de abler estimativas corretas dos componentes de variancia e de covariancia. Porem, para a simplificagaa do calculo, o coeficiente de correlagao entre as variaveis X e Y pode ser obtido corn base nos t pares de medias dos tratamentos ou corn base nos r pares de observagOes dentro de cada tratannento. 1.1. Correlacao de Pearson 0 caeficiente de correlacao de Pearson (r) 6 mats apropriadamente utilizado para as variaveis continuas e pode ser obtido pela seguinte fOrmula: 0 valor de r calculado atraves dos n pares de valores das variaveis X e Y, representa apenas uma estimative do verdadeiro coeficiente de correlagao populacional p. Para testar a hipatese de que o coeficiente de correlagao é igual a zero (Ho: p = 0), e necessario aplicar o teste t: In-2 tcal r 1-r2 SAEG 0 t calculado sera comparado ao t ha belado, a urn nivel a de significancia, corn n-2 grans de liberdade. Se cab, rejeita-se Ho, ou seja, existe uma correlacao entre as variaveis avaliadas, dada pe[o valor de r. 1.2. Correlagao de Spearman uma medida de associagao que exige que ambas as variaveis sejam discretas, de modo que as escalas de mensuracoes das observagoes em estudo, possam dispor-se par pastas (ordem crescente das observagOes) em duas series ordenadas. A correlagao de Spearman (c) é obtida por mei° da seguinte expressao: d = P, - Pyr = diferenga entre o posto do individuo i em relacao a variavel X e seu posto em relagao a variavel Y para cada par de observagbes. Ocastionalmente, dais ou mais individuos podem receber o mesmo pasta para a mesnna variavel. Quando isso ocorre, a cada urn doles atribui-se a media dos pastas que Ihes caberiam se nao tivesse havido empate. Se a propargaa de empates nao for grande, seu efeito sabre r, sera desprezivel, a a fOrmula anterior podera ainda ser utilizada para a calculo. Mas se a proporgaa de empates for grande, deve-se utilizar da seguinte formula para o calculo de c: n Ex2+I y2 -1,d2 rs 1=1 - 2-j/ X2 Y2 n3 - n 12 Tx n3 -n T 12 y 0 fator de carrec5o Tx é dada par: Tx t -tx 12 , em que: ANALISES ESTATiSTICAS SAEG n xi I x? 1,1 n - E Ys y12 1=1 ) 1-1 x2 = 1172 em que: 35 SAEG tx = nOmero de observacOes empatadas em determined° posto para a variavel X; ETx = somatorio dos valores de Tx para todos os grupos de observacOes empatadas. 0 fator de correcao Ty é dada poi': 3 Ty = ty -ty 12 em que: tY = nOmero de ❑bservacifies empatadas em determined° posto para a variavel Y; ETy = somatario dos valores de T para todos os grupos de observacries empatadas. A prove de significancia para tester a hipatese Ho: p, = 0, pode ser feita pelo taste t: rs 11— r 01 calculado sera coMparado act tabelado a urn nivel o: de significancia corn n-2 graus de liberdade. Se It.,1 t tab, rejeita-se Ho. 2. Correlagab Parcial Muitas vexes, urn alto e significativo valor do coeficiente de correlacao, pode nao implicar relacao, mas simplesnnente parque ambas as variaveis estao relacionadas corn uma terceira. Desta forma, mudancas em uma delas afetaria a outra, somente quando as condigOes de associacties corn a terceira permanecessem constantes. For exemplo, em urn grupo de alunos de diversas idades, pode-se constatar uma alta correlacao entre a amplitude do vocabulario e a altura. Tal correlacao, entretanto, pode nao refletir nenhurn relacionamento direto entre essas dues variaveis, sendo resultante do fato de que lento a amplitude do vocabulario coma a altura estarem relacionadas corn urns terceira variavel, a idade. Uma atencao particular deve ser dada a esses casos, principalmente quando os valores das variaveis sao tornados ao longo de urn period° de tempo. 0 coeficiente de correlagao parcial é estimado removendo-se as efeitos de outras variaveis sobre a associacao estudada. Seja, por exemplo, o caso de fres variaveis X1 , X2 e X3. Ora, r12 mode a correlacao total existente entre X, e X2, adicionado o efeito que X3 posse ter caused° sobre o comportamento dessas variaveis. 0 coeficiente de correlacao entre X, a X2, apas descontado o efeito de X3, sera denorninado de coeficiente de correlacao parole! entre X, e X2 corn respeito a X3, e sera denoted° por 1.12.3. A ideia da correlacao parcial pode ser 36 ANALISES ESTATIST1pAS Nfl SAEG SAEG estend ida ao caso de mais de tras variaveis. Assim, por exempla, r„,5 representaria a correlacao entre as variaveis X, e X3 mantidas X2 e X5 constantes. Uma maneira generalizada para a oblencao do coeficiente de correlacao partial entre dues variaveis i e j, é por meio da matriz de correlacao simples de dimerISan (m + 2) x (m + 2), que envolve estas dues variaveis a m outras, cujos efeitos desejam-se remover da associacaa entre i a j, coma segue: rg Tit , , em que: •a lj al = elemento de ordem ij da inverse da matriz de correlagao simples. Para tester a hipOtese Ho: p., m = 0, pode-se aplicar o teste t: i n- v t teal =-1-1_1111 , 2 , em que: -ripu v = nOmero de variaveis inclufdas na correlacao parcial. 0 t calculado sera comparado ao t labelado a urn nivel a de significancia corn n—v graus de liberdade. Se Ici l _> tt,b, rejeita-se Ha. Exercicio de Aplicagao 2.1 (descrit.xls)Considere os dados oblidos pelas medidas das allures (ALT) e pesos (PESO) de 100 indivicluos, em cm a kg, respectivamente. Arquivos / Myer Arquivo de Dados Existente C:1SaegIDados\Descrit.xls Procedimento = Outras / Correlagoes Variaveis = ALT PESO Tipo = Pearson Correlagoes de Pearson Variavel Variavel ALT PESO Observacao: 0 coeficiente de correlacao pode ser tambern, uma medida de analise descritiva de uma sane de dados. ANAL1SES ESTATiSTICAS NO SAEG 37 n —2 ObservagOes 100 Correlacao 0.8960 SAEG Exercicio de Aplicag5o 2.2 (correLxls) Considere as avaliacoes das variavels producao de graos em kg (P), peso de cam graos em kg (PCG), numero de espigas par planta (NES) a altura de planta em m (ALT). Arquivos / Ativar Arquivo de Dados Existente CASaeg\Dados\Correl.xls a) ObservacOes ariundas de 15 Individuas Procedimento = Outras / CorrelacOes Variaveis = P PCG NES ALT Tipo = Spearman Correlacoes de Spearman Variavel Variavel Observaceies Correlacao Z Significancia PCG 15 0.0268 0.1004 0.4600 NES 15 0.7066 2.6439 0_0041 ALT 15 0/221 2.7018 0.0034 PCG NES 15 -0.1692 -0.6331 0.2633 PCG ALT 15 -0.2764 -1.0341 0.1505 NES ALT 15 0.9186 3.4371 0.0003 ObservagOes: - As correlacoes obtidas nao levam em consideracao as componentes de covariancias, caso as dados sejam oriundos de delineamentos experimentais. - A prova da significancia da correlacao de Spearman estabelecida no SAEG, a baseada no valor calculado do taste de Z. - 0 valor de significancia ou de probabilidade (p), é definicio comp o major valor do nivel de significancia que o taste é significativo, ou seja, é ❑ maior valor do nivel de significancia que rejeita a hipOtese Ho. - 0 valor de significancia ou de probabilidade de 0.4600 para a correlacao entre as variaveis P a PCG, indica que o valor da correlacao de 0.0268 e significativo a partir de 46% de probabilidade. 38 ANAL ISES ESTATiSTICAS NO SAEG SAEG - Se P s 0.05, rejeita-se Ho ao nivel de 5% de probabilidade pelo testa aplicado, a se P 0.01, rejeita-se Ho ao nivel de 1% de probabilidade. Se P 0.05 ou P X0.01, nao se rejeita Ho, aos niveis de 5 ou de 1% de probabilidade, respectivamente. Procedimento = Outras / CorrelacOes Variaveis P PCG NES ALT Tipo = Pearson CorrelacOes de Pearson Variavel Variavel Observacties Come lagao T Significancia FOG 15 -0.0098 -0.0354 0.4861 NES 15 0.7246 3.7909 0.0011 P ALT 15 0.7478 4.0616 0.0007 PCG NES 15 -0.1887 -0.6927 0.2503 PCG ALT 15 -0.2872 -1.0809 0,1497 NES ALT 15 0.9054 7.6901 0.0000 Procedimento = Outras / Correlacoes Variaveis = P corn PCG ajustado NES Tipo = Pearson Correlac6es Parciais Variavel Variavel ObservacOes Correlacao T Significancia PCG 15 0.1875 . 0.6882 0.2517 Procedimento = Outras / CorrelagOes Variaveis = P corn PCG ajustado ALT Tipo = Pearson Correlacoes Parciais Variavel Variavel Observagaes Correlacao T Significancia P PCG 15 0.3223 1.2274 0.1207 ANAL.-USES ESTATiST1CAS NO SAEG SAEG Procedimento = Outras / Correlacbes Variaveis = P corn PCG ajustado NES ALT Tipo = Pearson CorrelacOes Parciais Variavel Variavel ObservacOes Correlacao T Significdncia PCG 15 0.3016 1.1407 0.1373 Observacoes: - Verificou-se que a correlacao entre P a PCG (producao e o tamanho dos graos) foi ligeiramente negativa, apesar de n5o significativa a 5% de probabiiidade. Apos rernovidas as influencias de NES e ALT, a correlacao passou a ser positiva. Neste caso, pode-se abler major P atraves do aumento do PCG, desde que tambem as plantas selecionadas tenham maiores valores de NES e de ALT. - 0 valor del obtido no SAEG para a correlacao parcial, é dado por: b) Observaccies oriundas de urn Delineament❑ Tratamentos e 3 Hepatica- es bl) Calcular as Correlaceies para cada Tratamento Procedimento Outras / Correlacoes Variaveis = P PCG NES ALT Quebra = THAT Tipo = Pearson Correlacoes de Pearson Variavel Variavel Obs Valor=1 Valor=2 Valor=3 Valor=4 Valor=5 P PCG 3 0.9078 -0.5196 0.7805 -0.9522 0.5341 P NES 3 -0.8660 0.4539 0.2774 0.9840 0.8242 P ALT 3 -0.8386 -0.0656 0.7328 0.9826 0.2013 PCG NES 3 -0.5766 -0.9972 0.8171 -0.8825 -0.0385 PCG ALT 3 -0.5329 -0.8185 0.9973 -0.8790 -0.7206 NES ALT 3 0.9986 0.8593 0.8570 1.0000 0.7206 Observacao: 0 valor=1 se refere ao tratamento 1, o valor=2 ao tratamento 2, e assim por diante, ate o valor=5, que se refere as correlacoes entre as vanaveis dentro do tratamento 5. 4❑ ANAUSES ESTATiSTICAS NO SAEG SAEG b2) Calcular as Correlacoes entre as Medias de Tratamentos Procedimento W Lltilitarios 1 Reducao Variaveis = P PCG NES ALT por THAT Tipo de Reducao = Media Definicao do novo arquivo no padrao SAEG Examinar: C:\Saeg\Dados Nome do arquivo: Correlm Arquivos do tipo: Texto (*.wst) Abrir ObservacOes Lidas 15 Observacties Gravadas 5 Variaveis Lidas 7 Variaveis Gravadas 5 Arquivos / Ativar Arquivo de Dados Existente C:ISaegIDados\Correlm.wst Procedimento = Outras / CorrelacOes Variaveis = P PCG NES ALT Tipo = Pearson Correlacoes de Pearson Variavel Variavel Observagoes Correlagao T Significancia P PCG 5 -0.0260 -0.0451 0.4834 NES 5 0.8682 3.0312 0.0281 P ALT 5 0.9067 3.7232 0.0169 PCG NES 5 -0.1743 -0.3065 0.3896 PCG ALT 5 -0.3628 -0.6742 0.2742 NES ALT 5 0.9378 4.6799 0.0092 ANIALISES ESTATi 1 1CAS NO SAEG 41 5 Experimental corn ATENCAO - Para acessar o arquivo gerado pela redugao (correlm.wsI), entre na °Kap Arquivos / Ativar Arquivo de Dados Existente. roi pa l P02 em que: 1 r12 rip r12 1 r2p 1-02 Pop rlp rep cop 1 SAEG 3. Analise de Trilha A analise de trilha (path analysis) consiste no estudo dos efeitos diretos e indiretos de variaveis sabre uma vanavel principal, atraves do desdobramento do coeficiente de correlacao. A decomposicao da correlacao a dependente do conjunto de variaveis estudadas, da importancia de cada uma e das possiveis inter-relacoes expressas em diagramas de trilha. A estimaliva dos efeitos diretos de p variaveis explicativas (X i , X2, ..., X), sabre uma variavel principal Y 6 obtida pela solucao do seguinte sistema de equacoes: 1301 = efeito direto da variavel X, sobre a variavel Y; P02 ".= efeito direto da variavel X2 sobre a variavel Y; pop = efeito direto da variavel Xp sabre a variavel Y; 1.01 = correlacao simples entre a variavel X, a a variavel Y; 1.02 = correlacao simples entre a variavel X2 a a variavel Y; rap = correlacao simples entre a variavel X e a variavel Y; r12 = correlacao simples entre a variavel X, e a variavel X2; = correlagao simples entre a variavel X i e a variavel Xv; rep = correlacao simples entre a variavel X2 a a variavel X. 0 coeficiente de determinacao do model() causal, qua mede os efeitos das p variaveis explicativas sobre a variavel Y. pode ser estimado por: = P0Ir01 +1)02r02 ±—±Poprop Tambern estirna-se a efeito da variavel residual sobre a variavel Y: = -,j(1—RO.12•-p SAEG 4. Correlacao Canonica A analise de correlacao cananica caracteriza-se por avaliar as relagOes entre dois grupos influenciados, no minimo, por duns variaveis. Par exempla, citam-se as casos em qua se interessa avaliar as relacaes entre as variaveis da parte aerea corn as do sistema radicular, variaveis monolog ices corn fisiolOgicas, componentes primarios corn componentes secundarios da producao, etc. De maneira geral, considera-se que a primeiro grupo é estabelecido por p variaveis e a segundo par q. Q nOmero de correlacaes cananicas é igual ao manor ntinnero de variaveis de um dos grupos (p ou q), a sua magnitude sempre decresce corn a ordem em qua sao estimadas. Para cada correlacao cananica estimado urn par cane:mica (PC), sendo as dais grupos de variaveis X a Y, definidos a seguir: X' = [X, X2 ... Xp] = vetor de p variaveis que constiluem o grupo 1; = [Y,Y2 = vetor de q variaveisque constiluem o grupo 2. ❑ objelivo a estimar a maxima correlacao entre as carnbinagOes lineares das variaveis do grupo 1 e do grupo 2, Bern coma estimar as respectivos coeficientes de ponderacoes das variaveis em cada combinacao linear. Sendo PCX1 e PCY, uma das combinacties lineares das variaveis dos grupos 1 e 2, respectivamente, tern-se: PCX, = ai X, + a2X2 + + apXp e PCY, + 132Y2 + + bpi; em que: = [a, a2 ... ap] = vetor de p coeficientes de ponderacoes das variaveis do grupo 1, associado ao PCX1; b' = [13, b2 ... bpi]. valor de q coeficientes de ponderacoes das variaveis do grupo 2, associado ao PCY,. Define-se coma a primeira correlacao cananica aquela associada ao maior autovalor de uma matriz de ordem s x s e que maximiza a relagao entre as funcOes PCX, e PCY,, sendo as mesmas derominadas coma o primeiro par canOnico associado a esta correlacao canOnica, expressa por: rl Cav(PCX1, PCY1[ ) = IINTUDCX1)'V(PCX2) As demais correlacoes cananicas e os pares canonicos sao estirnados, utilizando-se Os demais autovalores em ordeal decrescente e os autovelores 42 ANAUSES ESTAT1ST1CAS NO SAEG ANALISES ESTATiSTICAS NO SAEG 43 !: SAEG correspondentes (vetores de coeficientes de ponderacbes), ate a p ou q correlacao estimada. 0 teste de hipOtese para Ho: p, = p2 = = ps 0 (s = minim° {p, q}) realizado pela estatistica de qui-quadrado. Se esta hipOtese for rejeitada, testa- se a hipatese Ho: pi > 0 e p2 .... = ps = 0, e assim por diante, ate a nao rejeicao de Ho. A significancia de pelo menos urn par canonic°, leva a conclusao de que os grupos considerados nao sao independentes, podendo-se utilizer seus coeficientes pare discuss -6es mais especfficas. Os pares canOnicos nao significativos podem ser utilizados pare avaliar o grau de importancia das variaveis dentro de cada grupo, nas correlagoes entre os grupos. Nestes casos, as maiores correlagOes em valores absolutos das variaveis corn estes pares canOnicos ou os maiores coeficientes de ponderacOes em valores absolutos destes pares canOnicos, estao associados as variaveis de menores importancias. Exercicio de Aplicacao 2.3 (trican.xls) Foram avaiiadas as variaveis explicativas X„ X2, ; e X4, e uma variavel dependente Y em 13 individuos. Determiner as estimativas dos efeitos diretos e indiretos sobre Y e as correlacOes canonicas entre os grupos 1 (X, e X2) e 2 (X3 e X4). Arquivos / Ativar Arquivo de Dados Existente C:ISaeg\Dados\Trican.xls a) Analise de Trilha Procedimento = Outras / Coeficientes de Trilha Modelo = Y funcao X1 X2 X3 X4 CorrelacOes de Pearson Variavel Variavel Observ. Correlagao Valor de T Significancia X1 13 0.731 3.550 0.002 X2 13 0.816 4.686 0.000 X3 13 -0.535 -2.098 0.030 X4 13 -0.821 -4.775 0.000 X1 X2 13 0.229 0.779 0.226 Xi X3 13 -0.824 -4.826 0.000 X1 X4 13 -0.245 -0.840 0.209 X2 X3 13 -0.139 -0.466 0.325 X2 X4 13 -0.973 -13.970 0.000 X3 X4 13 0.030 0.098 0.462 oicko Coeficientes de Trilha Efeito Direto de X1 (pox ) 0.6065120 Efeito Indireto de X1 Via X2 ( Tio2r12) 0.1206227 Efeito Indireto de X1 Via X3 ( i)o31)3) -0.0357589 Efeito Indireto de X1 Via X4 (13o4r14) 0.0393418 Total - Diretos e Indiretos (roi) 0.7307175 Efeito Direto de X2 ( 1302) 0.5277056 Efeito Indireto de X2 Via X1 (1301r12 ) 0.1386362 Efeito lndireto de X2 Via X3 ( iio3r23) -0.0060417 Efeito lndireto de X2 Via X4 ( Poo-24) 0.1559524 Total - Diretos e Indiretos (r02) 0.8162526 Efeito Direto de X3 (1303) 0.0433897 Efeito Indireto de X3 Via Xi ( t3oirii3) -0.4998470 Efeito Indireto de X3 Via X2 ( 6o2r23) -0.0734790 Efeito Indireto de X3 Via X4 ( iiO4 r34 ) -0.0047344 Total - Diretos e Indiretos (r03) -0.5346707 Efeito Direto de X4 (pod ) -0.1602874 Efeito Indireto de X4 Via Xi (1)inri4) -0.1488654 Delta lndireto de X4 Via X2 if r , ,02-24. -0.5134338 Efeito Indireto de X4 Via X3 603r34) 0.0012816 Total - Diretos e Indiretos (r04) -0.8213050 44 ANALISES ESTATiST1CAS ND SAEG ANALISES ESTATISTICAS NO SAEG 45 SAEG Parametros Estimados Observacoes: = 0.6065x0.73072 + 0.5277x0.8163 + 0.0434x-0.5347 + RL234 ( ) Autovalor Correlacao Lambda Qui-Ouadrado GL Signif. (-0.1603)x(-0.8213) 0.9969996 0.998499 0.001128 71.27138 4 0.00000 RL234 = 0.6242195 0.375781 0.4431816 + 0.4307615 - 0.0232059 + 0.1316543 = 0.98237. 0.790076 10.27688 1 0.00153 - =V1-0.98237 =0.132778- Qs efeitos diretos de X3 e X4 sabre Y, sao relativamente pequenos quando se compare corn o efeito residual. Entao, as influencias dessas variaveis sabre Y devem ser rnaiores atraves das correlacoes corn as outras variaveis, mostradas pelo efeito indireto de ; via X, e do efeito indireto de X4 via X2, como tambern verificadas pelas altas correlacoes negatives entre cis pares das variaveis, ou seja de X, corn X3 e de X2 corn X4. - As contribuicoes das variaveis X3 e X4 sao tambem consideravelmente baixas pare o coeficiente de delerminacao, ou seja, contribuem pouco -"j.1234- para a determinacao de Y, como vista no calculo do P - As estimativas dos efeitos diretos comparativamente elevadas a corn mesmo sinai das correlacoes corn a variavel Y, indicam que as variaveis e X2 sao as principals determinantes das veriaciDes da variavel principal. - As correlacoes oblides nao levam em consideracao os camponentes de covariancias, caso as dados sejam oriundos de delineamentas experimentais. b) Correlacgo Cananica Procedimento = Multivarladas Correlecao CanOnica Variaveis = X1 X2 corn X3 X4 Matriz de Correlagao X1 X2 X3 X4 X1 1.00000 0.22858 -0.82413 -0.24545 X2 0.22858 1.00000 -0.13924 -0.97295 X3 -0.82413 -0.13924 1.00000 0.02954 X4 -0.24545 -0.97295 0.02954 1.00000 Coeficientes Canonicos Variaveis Coeficiente Grupo 1 12 PC 22 PC X1 -0.33186 0.96288 X2 -0.88117 -0.53654 Grupo 2 X3 0.36934 -0.92131 X4 0.92929 0.38882 Correlacao 0.99850 0.79008 Correlagoes corn Variaveis Variaveis CorrelaCOes Grupo 1 12 PC 22 PC X1 -0.33186 0.96288 X2 -0.07586 0.22010 Grupo 2 X3 0.36934 -0.92131 X4 0.01091 -0.02721 ❑bservacao: Conciui-se que os grupos considerados nao sao independentes (correlacoes significativas a 1% de probabiiidade), e que as associagOes intergrupos sao estabelecidas principalmente, pelas influencias de: menores valores para X2 sao determinantes pare o aumento dos valores de X, (12 par cananico, X2 = -0.88117 a X, = 0.92929) e maiores valores para X, sao determinantes pare a diminuicao dos valores de X3 (22 parcanOnico, X, = 0.96288 e X3 = -0.92131). Se o 22 par canonic() fosse nao significative, as interpretacOes 46 ANALISES ESTATiST1CAS NO SAEG ANALISES ESTATISTICAS ND SAEG 47 SAEG sobre as correlacifies seriam analisadas no -P par canonic°, e as variaveis menos importantes para as correlacOes entre os grupos seriam a X1, do grupo 1, e a X3, do grupo 2, devido as maiores correlacOes com o 2R par canonic° ou aos maiores coeficientes de ponderacOes associados ao nnesmo. SAEG CAPi1111.0 TESTE t DE STUDENT E aplicado para testar hipOteses referentes a medias populacionais, quando as variaveis apresentam-se normatmente distribuidas corn variancias desconhecidas. Se It ail tiab, a urn nivel a de significancia corn n' graus de liberdade, rejeita-se Ho, caso cantrario, nao se rejeita Ho. 1. Caso de Duos Amostras Independentes 0 objetivo e testar hipateses sobre medias de diferentes populacOes X e Y, quando duas amostras distintas referentes as duas populacoes sao retiradas. As hipateses sao: Ho: mx = myvs mx # my ou Hat: mx > my ou Has: mx < my. Em todo o desenvolvimento, sera aplicada uma hipOtese alternativa bilateral, em furicao dessa ser a realizada no SAEG. Antes da aplicacao do teste t sobre as medias, deve-se utilizar o teste F para verificar se as variancias das duas populacfiessao homogeneas ou nao, ou seja, se elas sao estatisticamente iguais ou nao. 0 teste F é realizado corn as duas seguintes hiptiteses: Ho': 612 = 62 vs Ha': 64 > cr2 Corn os valores das variancias amostrais, obtem-se o valor de F, dado por: 2 Fcal — SX Sy A regra é escoiher a amostra que apresentar a major variancia como s2x . Em outras palavras, deve-se sempre colocar a major variancia no numerador, de modo a obter urn valor calculado de F maior que 1 e o valor tabelado atraves da tabela unilateral para F > 1, corn n, = (nx-1) e n2 . (ny-1) graus de liberdade. Se F., Fib rejeita-se Ho', caso contrario nao se rejeita Ho', a urn nivel a de significancia. ANALISES ESTATfSTICAS NO SAEG 4B 49 ANALISES ESTATISTIOAS NO SAEG SAEG SAEG Se Ho' nao for rejeitada, admite-se que os valores assumidos par sX e 2 - sy serao estimativas de uma variancia comum a2, podendo assim, combine- las: 2 (nx -1)d +(ny - 1)g, SC , em que: nx +n -2 2 sc = variancia amostral comum; sx = variancia da amostra X; Sy= variancia da amostra Y; nx numero de elementos da amostra X; n = ntimero de elementos da amostra Y. Neste caso, deve-se usar o teste t corn n" igual a nx+ny-2 graus de liberdade: R-V rix em que: t X -Y teal =- 2 2 S X + SY e n X ny ( 2 2 2 8X Sy rix ± fly n*- 2 S 1 jc 12 1 2 Sy l'IX ) fly) nx -1 + ny -1 Exercicio de Aplicagao 3.1 (ttind.xls) Considere urn experimento para testar a duragao em 1000 km (KM) de quatro marcas de amortecedores, onde 15 veiculos receberam o amortecedor da marca 1, 13 veiculos receberam o da marca 2, 10 veiculos receberam'o da mama 3 e 12 veiculos receberam o da marca 4. fly = media da amostra X; -17 =. media da amostra Y. Se Ho' for rejeitada, admite-se que as variancias populacionais sac) diferentes e, portanto, nao faz sentido combiner os valores assumidos por s2x e s2y. A estatistica que deve ser usada é o teste t corn n' igual a n* graus de liberdade: Arquivos / Ativar Arquivo de Dados Existente CASaeg\DadosVitind.xls a) Comparar a Marca 1 corn a Marca 2 Procedimento = Utilitarios / Selecionar Observacbes Parametros = MARCA = 1 2 Subtftulo = MARCAS 1 E 2 Observacao: A descricao do subtitulo a importante para discriminar as paginas a serem impresses epos a selecao dos dados. Procedimento = Outras / Teste de t Veriaveis = KM por MARCA C 2 1 ' ANALISES ESTATISTICAS NO SAEG 51 ANALISES ESTATISTICAS NO SAEG 50 T GL Prob. F GL1 GL 2 Prob. Variancias MARCA 3 4 Variancias T GL Prob. F GL1 GL2 Prob. Dados Medias Desvio Erro Padrao 10 41.6890 12 28.0642 8.0599 1.7047 2.5488 0.4921 Observacaes: As variancias das populacOes das duas marcas nao foram homogeneas pelo taste F (P = 0.0000), e as marcas 3 e 4 apresentaram medias diferentes pet() teste de t, sendo a maior, a media 3 (P = 0.0004), considerando-se c(=1%. Casa seja desejado trabaihar corn todos os dados do arquivo, é necessario dear em Utilitarios / Recuperar apas Selecao. SAEG MARCA Dados Medias 1 2 15 27.5573 3.3161 13 28.4777 3.4274 Desvio Erro Padrao Homogenea 0.7212 26.0 0.4772 * 1.0682 12 14 0.8959 Nao-homogenea 0.7194 25.2 0.4786 Observacao: As variancias das populacaes das duas marcas foram homogeneas de acordo corn o testa F (P = 0.8959), e as marcas 1 e 2 apresentaram medias estatisticarnente iguais pelo teste t (P = 0.4772), considerando-se os niveis de significancia iguais a 1 ou 5%. b) Comparar a Marca 3 corn a Marca 4 Procedimento = Utilitarios / Selecionar Observacaes Para metros = MARCA = 3 4 Subtitulo = MARCAS 3 E 4 Procedimento = Outras / Taste de I Variaveis = KM por MARCA Homagenea 5.7308 20.0 0.0000 * 22.3543 9 11 0.0000 Nao-homogenea 5.2487 9.7 0.0004 * 2. Caso de Duas Amostras Relacionadas Sao utilizadas quando a necessario analisar o caso de duas populacties dependentes. Neste caso, a variavel de interesse sera a diferenca entre os pares das duas amostras, no lugar das prOprias amostras, que devem ter o mesmo tamanho. As hipoteses testadas podem ser: Ho: b = 0 vs Hai: 5 0 ou Ha,: D > 0 ou Ha3: p < 0, em que 15 representa a media da diferenca entre as duas populacoes. 0 taste t corn n' igual a n-1 graus de liberdade é dada por: tea; = so 1, em que: = media das diferencas entre as pares das duas amostras; s(d) = so) = erro padrao da media das diferencas entre os pares das duas -4n amostras; s(d) = desvio padrao das diferencas entre os pares das duas amostras; n = nunnero de diferengas entre os pares das duas amostras. Exercicio de Aplicacao 3.2 (ttpar.xls) Urn novo aditivo fd desenvolvido corn o objetivo de aumentar o km rodado por urn litro de combustive!. Para testar o produto, foram setecionados ao acaso 24 veiculos, obtendo-se os resultados, antes e depois, da utilizacao do aditivo. ANALISES ESTATiSTICAS NO SAEG ANALISES ESTATIST1CAS NO SAEG 52 53 SAEG 0.8562 0.9506 SAEG Arquivos / Ativar Arquivo de Dados Existenle C:\SaeglDadosITtpar.xls Procedimento = Outras / Testa de t Variaveis = ANTES corn DEPOIS Variaveis Dados Medias Desvios T GL Prob. ANTES 9.6625 2.5748 Diferenca 24 -0.6958 0.6843 -4.982 23 0.0001 DEPOlS 10.3583 2.6294 Observagao: 0 aditivo foi eficiente em aumentar a km rodada, pois a diferenca negativa (ANTES - DEPOIS) foi significativa, ao nivel de 1% de probabilidade, pefo tests t = 0.0001). LO INTERVALO DE CONFIANCA A estimacao de urn parametro populacional pode-se dar atraves de Urn estimador pontuai, isto é, especifica-se uma Tunica estimativa. Por exempla, a media amostral é urn estimador pontual da media da populagao mx, para a variavel X. Entretanto, em mullos casos, prefere-se uma estimativa intervalar que expresse a precisao do estimador. 1. Para a Media Populacional quando a Variancia 6 Desconhecida 1.1. Dados Oriundos de uma Amostra 0 intervalo de canfianga é urn intervalo limitado por dais valores e usado pare estimar a media desconhecida de uma populacao, de forma que se possa afirmar corn uma probabilidade de acerto, que o verdadeiro valor do parametro estara contido nesse intervalo. 0 intervalo de confianga para a media populacional corn urn nivel de confianca 1—a, é dado por: T(±t ,, s(X) , em que: = valor de t tabelado ao nivel a corn n-1 graus de liberdade. Se o nivel de confiarica for de 95% a se foram retiradas urn grande nunnera de amostras, espera-se que 95% dos intervalos calculados contenham a media da populacao. No entanta, uma vez feita uma estimativa para o intervalo corn base em uma arnostra, ela estara certa ou errada, porem corn 95% de probabilidade de acerto. 0 intervalo de manor amplitude significa uma estimativa de major precisao. Exercicio de Aplioacao 4.1 (descrit.xls) Considere as dados oblidos pelas medidas das alturas (ALT) e pesos ANALISES ES IATiSTICAS NO SAEG 54 ANALISES ESTATiSTICAS NO SAEG SAEG (PESO) de 100 indivicluos, em cm e kg, respectivamente. Arquivos 1 Ativar Arquivo de Dados Existente CASaeglDados\Descrit.xls Procedimento = Univariadas 1 Estatisticas Simples (1) Variaveis = ALT PESO ALT PESO NOmero de Observacdes 100 100 Media Geral 171.450000 71.047000 Desvia Padrao 8.123261 8.901395 Intervalo de Confianca P (0.05) 1.616529 1.771378 Observacoes: - 0 intervalo de confianca P (0.05) da coma resultado a valor da expressao t , em qua t. a =1.99, corn 99 graus de liberdade e a= 5%. -V11 2 - Para a variavel ALT, tem-se a 5 : 171.450000 ± 1.616529. - Para a variavel PESO, tern-se o IC(m)a95:)095: 71.047000 ± 1.771378. 1.2. Dados Oriundos de urn Delineamento Experimental Casa as dados sejam obticlos de urn delineamenta experimental e apropriados para a execucOo de uma analise de variancia, o intervalo de confianca pode ser estabelecido segundo dais criterios, de acordo corn resultado do testa F paraa fonte de variacao tratamentos: a) Taste F nao significativo: 6 estabelecido urn intervalo de confianca para a media geral corn urn nivel de confianca 1—a, dada par: QMRes IC(m),_: ± ta n em gue: - - eh = media observada de todas as unidades experimentais; n = numero total de unidades experimentais; QMRes = quadrado media do residua da analise de variancia; t valor de t tabelado ao nivel a corn n' graus de liberdade do residua. SAEG b) Testa F significativo: a estabelecido separadamente, urn intervalo de confianca para cada media de tratamento corn um nivel de confianca 1—a, dada par: QMRes IC(mi)i _.: t -it a , ern que:r 2 rh= media observada do tratamento i; r. numero de repetic6es do tratamento i; QMRes = quadrado media do residua da analise de variancia; tc, = valor de t tabelado ao nivel a corn n' graus de liberdade do residua. ANALISES ESTATiSTICAS NO SAEG 57 56 ANALISES ESTATiSTICAS NO SAEG CAPiTU VALIDADE DA ANALISE DE VARIANCIA Para se fazer uma analise de variancia, quatro hipateses basicas devem ser estritamente ou aproximadamente satisfeitas. 1. Aditividade Os efeitos que ocorrem no modelo estatistico devem ser aditivos. A nao- aditividade pode ocorrer em fungao de alguma observacaqapresentar resultado muito discrepante da caracteristica que esta sendo estudada. A identificagao do valor discrepante dependera da experiencia e atengao do pesquisador. Pode tambem ser devida a interagao dos efeitos principals. Neste caso, a diferenca entre tratamentos nao é constante para as diversas repetigOes. 2. Independencia dos Erros Os erros experimentais ou desvios devidos aos fatores nao controlados devem ser independentes. Isto implica que as efeitos de tratamentos tambem sejam independentes. Essa independencia dos erros pode ser assegurada por urn dos processos basicos da experimentagao que é a casualizagao. As correlagOes entre os erros frequentemente nao sao notadas, ja que as sues presengas sao de diffcil detecgao. 3. Normalidade dos Erros Os erros experimentais el devemter distribuigao normal de probabilidades. Para verificar esta pressuposigao, testam-se os erros experimentais estimados eq. Se o resultado de normalidade for satisfeito, isto implica que os valores observados Yij se ajustam tambem a uma distribuigao normal. ANALISES ESTATISTICAS NO SAEG 59 SAEG 3.1. Teste de Assimetria A estimative do coeficiente de assimetria (s), corn base nos erros experimentais estimados é dada par: 3 t r, _ e f t} IA J.1 Steil , em que: = eii = media dos erros experimentais estimados; s(es t,) = desvio padrao amostral dos erros experimentais estimados; t = I- imer° de tratamentos; rrjrnero de repeticifies do tratamento i; n = nOmero total de uniclades experimentais. As hipOteses Ho: s = 0 vs Ha: s 0 serao testadas. Se o resultado obtido for rejeitar a hipOtese de nulidade, diz-se que os dados nao estao distribuidos normalmente. Porem, se nao rejeitar, diz-se que os dados podem ester distribuidos normalmente. 3.2. Teste de Curtose Para se estimar o grau de curtose (k), corn base nos erros experimentais estimados eii, utiliza-se a seguinte fOrmula: L e ,\ 4 i=i s ) As hipateses Ho: k = 3 vs Ha: k 3 sera° testadas. Se o resultado for rejeitar Ho, diz-se que o afastamento do achatamento da distribuicao é significativo em relagao a distribuicao normal. Bo ANALISES ESTATISTICAS NO SAEG SAEG 3.3. Teste de Lilliefors O teste de Lilliefors pressupOe o calculo de todos os valores padronizados (z), os quaffs devem ser ordenados em ordem crescente, pare as seguintes consideracOes: F(z,) = FE, = P = area da tabela de distribuicao normal padronizada; 5(;) = Mr = n,/n, em que: FE, = freq0encla esperada para os valores s zi; FO, = frequencia observada para os valores < zi; n, = nOrnero de valores em ordem crescente zi; n = nOrnero total de observaciies da amostra; e — s(61i ) • 0 valor calculado do teste 6 dado por: Dca, = Maximo IF(z,) — S(z,)I. O teste é bilateral, coma segue: Ho: 6 razoavel estudar os dados atraves da distribuicao normal; Ha: nao é razoavel estudar os dados atraves da distribuicao normal. Rejeita-se a hipOtese de nulidade, quando a valor de D., ?_ Drab, a tim nivel cc de significancia corn n observaciies, caso contrario nao se rejeita Ho. 4. Homogeneidade de Variancias dos Erros Os erros experimentais e1I devem ter homogeneidade de variancias, ou seja, devem possuir uma variancia comum 62. Isto implica que a variabilidade das repetici5es de urn tratamento deve ser semelhante a dos outros tratamentos, isto e, os tratamentos devem possuir variancias homogeneas. Sendo QMResiduo usado coma termo de comparagao na analise de variancia, havers uma perda de eficiencia nas estimativas dos efeitos de tratamentos e perda de sensibilidade dos testes de comparacoes de medias, se ete for obtido a partir de variancias diferentes de tratamentos. Para verificar esta pressuposicao, testam-se as variancias amostrais dos erros experimentais estimados eij de cada tratamento, dadas por s2i. Este e a hipOtese a que os pesquisadores tern dada maior enfase. 4.1. Teste de Cochran E usado quando o numero de graus de liberdade e o mesmo para todas as variancias, ou seja, quando a niimero de repeticaes forem iguais pare todos ANALISES ESTATISTICAS NO SAEG 81 1=1 , em que: = 1+ , 30 —1) I 1 1 1=-1 - SAEG Os tratamentos. 0 teste é dada por: 2 s max C h = t S As hip:Mesas a serem testadas sao: Ho: al = cr3 = • • • = cri2 vs Ha: pelo menos uma das variancias difere das demais. 0 valor de Ch., sera comparado ao tabelado, corn (t, r-1) graus de liberdade, a urn nivel cc de significancia. Rejeita-se a hip:Mese Ho de homogeneidade de variancias quando Chtab. 4.2. Teste de Bartlett E usado para festal- se as estimativas de variancias corn r-1 graus de liberdade de t tratamentos sao iguais, ou seja, quando o nOmero de repeticoes por tratamento foram desiguais. 0 teste é o seguinte: (ri -1)s E `ri1-1)log E (ri -1) = nOmero de repetigoes do tratamento i; s = variancia amostral do tratamento i. As hipOteses a serem testadas sac): Ho: 0-12 = cr = • -• = 6t2 vs Ha: pelo menos uma das variancias difere das demais. Sob a hipOtese de nulidade de que Os valores assumidos por s2, sera° estimativas de urn mesmo valor 02 (variancia comum), a razao M/C tern distribuicao aproximada de qui-quadrado (e), onde C é urn fator de correcao, dado por: AEG Rejeita-se a hipotese Ho de homogeneidade de variancias quando o valor calculado da razao M/C x2ta,,, a urn nivel of de significancia, corn t-1 graus de liberdade. Exercicio de Aplicacao 5.1 (correl.xls) Considere as avaliacoes das variaveis producao de graos em kg (ID), peso de cem graos em kg (PCG), fluffier° de espigas por planta (NES) e altura de planta em m (ALT). Para a variavel P, verificar as pressuposigoes de normalidade e de homogeneidade dos erros, da analise de variancia. Arquivos / Ativar Arquivo de Dados Existente c:\Saeg\Dados\Correl.xls Delineamento Inteiramente Casualizado 0 erro experimental estimado associado a observacao Yii e dada por: = Yii , em que: rni = = media observada do tratamento i; r1 = Total do tratamento i; = nUmero de repeticOes do tratamento i. Drocedimento = Univariadas / Estatisticas corn Quebras (S) Jariaveis = P por TRAT Estatisticas corn Quebras )escricao Valores Medias Desvios • Dados rotal Gera! 2.169333 0.4532969 15 PRAT 1 1.990000 0.1587451 3 rRAT 2 1.513333 0.1457166 3 rRAT 3 2.340000 0.1300000 3 ['RAT 4 2.330000 -0.4331282 3 ERAT 5 2.673333 0.1738774 3 M =-- 2,3026 62 \NALISES ESTATiSTICAS NO SAEG 63 ANALISES ESTATiSTICAS NO SAEG SAM SAEG Procedimento = Utilitarios / Comandos Arquivo a ser criado: C:\Saeg\Dados\Correl.cmd Processar Procedimento = Outras / Testes de Cochran eBartlett Variaveis = P EPDIC por TRAT Testes de COCHRAN a BARTLETT Variaveis Nome do Teste Valor Calculado Valor (P=0.05) Valor (P=0.01) Cochran 0.6672 0.684 0.789 p Bartlett 3.9909 9.488 13.277 EPDIC Cochran 0.6672 0.684 0.789 EPDIC Bartlett 3.9910 9.488 13.277 Cafouler Se Se Se Se Se Executer EPD1C=P*1 TRAT=1 entao EPDIC=P-1.99 TRAT=2 entao EPDIC=P-1.513333 TRAT=3 entao EPDIC=P-2.34 TRAT=4 entao EPDIC=P-2.33 TRAT=5 entao EPDIC=P-2.673333 Arquivo / Sair Deseja salver as alteracoes? Sim Observacdes Lidas 15 Observacifses Gravadas 15 Variaveis Lidas 7 Variaveis Totais 8 Valores Perdidos 0 Erros Encontrados 0 Procedimento = Univariadas / Estatfsticas Simples (1) Variaveis = EPDIC EPDIC Ass imetria 0.896577 Probab. da Assimetria=0 0.305552 Curtose 3.097409 Probab. da Curtose=0 0.457302 Procedimento = Outras / Taste de Lilliefors Variaveis = EPDIC Taste de Lilliefors Variaveis Valor Calculado Valor (P=0.05) EPDIC 0.2843 0.220 64 ANAUSES ESTA-fiSTICAS NO SAEG ❑bservaceies: - Os testes estatisticos consistem em verificar se determined° valor estimado a partir de uma amostra, difere significativamente do seu resulted° esperado, de acordo com a hipOtese Ho formulada pare urn determined° parametro da populacao. Portanto, os testes acima foram aplicados as estimativas dos erros experimentais. - No delinearnento inteiramente casualizado, os testes de Cochran e de Bartlett podem ser aplicados diretamente aos valores observados Yu, sem perder a validade de verificacao da homogeneidade de variancias dos erros. Algumas vezes, aparecern asterisms referentes aos valores tabelados dos testes de Cochran a de Bartlett, o que significarn valores nao encontrados nas tabelas, devido as mesma nao apresentarem todos os graus de liberdade. Nestes casos, é preciso recorrer as tabela para encontrar os valores tabelados a 5 ou a 1% de probabilidade, dos ref eridos testes. b) Delineamento em Blocos Casualizados 0 erro experimental estimado associado a observacao Y9 é dad° por: = — rri, +m, em que: 13 mt = t = media observada do bloco j; B = total do bloco j; G In = — n = media geral do experimento; G = total geral do experimento. ANALISES ESTAT1STICAS NO SAEG 65 Valor (P=0.01) 0.257 SAEG Se Se Se Executer TRAT=5 a BL000=1 entao EPDBC=P-2.673333-2.036-F2.169333 e BL000.2 entao EPDBC =P-2.673333-2.064+2.169333 TRAT=5 e BLOCO=3 entao EPDBC=P-2.673333-2.408+2.169333 Arquivo / Sair D eseja salver as ateracoes? Sim Procedimento = Utilitarios / Comandos Arquivo encontrado: CASaeg\Dados\Correlcmd Processar Calcular Se Se Se Se Se Calcular Se Se Se Se Se Se Se Se Se Se Se Se EPDIC=P*1 TRAT=1 entao EPDIC=P-1.99 TRAT=2 entao EPDIC=P-1.513333 TRAT=3 entao EPDIC=P-2.34 TRAT=4 entao EPDIC=P-2.33 TRAT=5 entao EPDIC=P-2.673333 EPDBC=P*2 TRAT=1 e BLOCO=1 TRAT=1 e 13L000=2 TRAT=1 e BL000=3 TRAT=2 e BL000=1 TRAT=2 e BL000=2 TRAT=2 e BLOCO=3 TRAT=3 a BLOCO=1 TRAT=3 e BL000=2 TRAT=3 e BLOCO=3 TRAT=4 a BLOCO=1 TRAT=4 e BLOCO=2 TRAT=4 e BLOCO=3 enter) EP DB C=P-1 .99-2.036+2.169333 entao EP DBC=P-1.99-2.064+2.169333 entao EPDBC=P-1.99-2.408+2.169333 entao E PDBC= P-1.513333-2.036+2.169333 entao EPDBC=P-1.513333-2.064+2.169333 entao EPDBC=P-1.513333-2.408+2.169333 entao EPDBC=P-2.34-2.036+2.169333 entao EPDBC=P-2.34-2.064+2.169333 entao EP DBC=P-2.34-2.408+2.169333 entao EP D B C=P-2.33-2.036+2.169333 entao EPDBC=P-2.33-2.064+2.169333 entao EPDBC=P-2.33-2.408+2.169333 SAEG Procedimento = Univariadas / Estatisticas corn Quebras (S) Variaveis = P por BLOCO Descricao Valores Medias Desvios Dados Total Gera! 2.169333 0.4532969 15 BLOCO 1 2.036000 0.4275278 5 BLOCO 2 2.064000 0.4276447 5 BLOCO 3 2.408000 0.4962056 5 Observecoes Lidas 15 Observacbes Gravadas 15 Variaveis Lidas 8 Variaveis Totals 9 Valores Perdidos 0 Erros Encontrados 0 Procedimento = Univeriadas / Estatisticas Simples (1) Variaveis = EPDBC EPDBC Assirnetria 0.871690 Probab. da Assimetria=0 0.310473 Curtose 4.051058 Probab. da Curtose=0 0.129192 Procedimento = Outras / Taste de Lilliefors Variaveis = EPDBC Taste de Lilliefors Variaveis EPDBC Valor Calculado 0.1914 Valor (P=0.05) 0.220 Valor (P=0.01) 0.257 67 ANALISES ESTATISTICAS NO SAEG ANALISFS ESTATISTICAS NO SAEG 66 SAEG Procedimento = Outras / Testes de Cochran e Bartlett Variaveis Testes = EPDBC por TRAT de COCHRAN e BARTLETT Variaveis Nome do Testa Valor Calculado Valor (P=0.05) Valor (P=0.01) EPDBC Cochran 0.7780 0.684 0.789 EPDBC Bartlett 6.9769 9.488 13.277 5. Transformacoes de Dados Sao necessarias quando pelo menos uma das candle -6es da analise de variancia nao forem satisfeitas. Quando uma transformacao for feita, deve-se verificar novamente as condicoes para a analise e todas as comparacOes devem ser realizadas na nova escala. 5.1. Transformacao Raiz Quadrada A transformacao .15Z e feita quando as dados observados de uma variavel X seguem distribuicao de Poisson, na qual a media e a variancia sao iguais. Esta distribuicao se refere a contagern do numero de vezes que ocorre urn determinado evento por unidade de tempo ou por uma unidade de medida. Pode tarnbern ser usada quando a variancia de X é proporcional a media de X e para dados de porcentagens baseados em contagens, sendo a amplitude de 0 a 20% ou de 80 a 100%, rnas nao ambas. Quando os dados estao situados entre 80 e 100%, ales devem ser subtraklos de 100 antes da transformagao. Quando entre os dados ocorremvalores pequenos inferiores a 10 e, principalmente zeros, as transformacOes recomendadas sao Vx+ 0.5 , ouV.TC..)-17F 1 - 5.2. Transformacao Logaritmica A transformacao logX ou InX e utilizada quando os desvios padrOes variam diretamente corn as medias dos diversos tratamentos, ou seja, quando o coeficiente de variacao 6 constante de tratamento para tratamento. Esse tipo de relacao entre a media e o desvio padre° e encontrado geralmente quando os efeitos sao multiplicativos em lugar de aditivos. Essa transformacao e indicada para observaeOes corn nOmeros inteiros SAEG positivos que cobrem uma grande amplitude, sendo que nao pode ser usada diretamente quando ocorrem zeros ou quando alguns dos valores sao menores que 10. Nesta aim, a transformacao log (X + 1) e a mais indicada. 5.3. Transformacao Angular E recomendavel para dados expressos em porcentagens, que geralmente seguem distribuicao binomial, ou seja, para aquelas variaveis que apresentam somente doffs resuttados possiveis em cada avaliagao. Porem, se as porcentagens estiverem entre 30 e 70%, a transformacao angular nao sera necessaria. A transformacao tambern sera desnecessaria quando as porcentagens forem resultantes da divisao dos dados observados por urn valor constante ou quando sao representativas de concentracao. Para uma variavel X, esta transformagao é dada por: arcsenpic . 100 Exercicio de Aplicacao 5.2 (transf.xls) Considere as avaliacOes das caracteristicas numero de plantas atacadas (NPA), numero de insetos coletados (NIC) e porcentagens de danos (PDN) de 3 tratamentos (THAT) corn 5 repeticoes. Arquivos / Ativar Arquivo de Dados Existente CASaeg\Dados\Transf.xls Procedimento = Utilitarios / Comandos Arquivo a ser criado: CASaeg\Dados\Transf.cmd Processar Calcular RNPA=raiz(NPA) Calcular LN1C=tog(NIC) Calcular ASPDN=arsen(raiz(PDN/100)) Executar Arquivo / Sair Deseja salvar as alteraeOes? Sim ObservagOes Lidas 15 Observaeoes Gravadas 15 Variaveis Lidas 5 Variaveis Totais 8 Valores Perdidos 0 Erros Encontrados 0 69 ANALISES ESTATISTICAS NO SAEG ANALISES ESTATISTICAS NO SAEG 69 SAEG Procedimento = Outras / Teste de Lilliefors Variaveis Teste = NPA NIC PDN RNPA LNIC ASPDN de