Buscar

Apostila de estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 58 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 58 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 58 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

APLICAÇÕES DE ALGUMAS TÉCNICAS MULTIVARIADAS 
(Componentes Principais, Variáveis Canônicas e Correlações Canônicas) 
 
 
 
 
ÍNDICE 
Página 
 
 
1. INTRODUCÃO.......................................................................................................... 1 
2. COMPONENTES PRINCIPAIS................................................................................ 1 
2.1. Introdução............................................................................................................ 1 
2.2. Obtenção dos Componentes Principais ............................................................... 2 
2.3. Importância Relativa de um Componente Principal............................................ 4 
2.4. Correlação Entre o Componente Yk e a Variável Xi ........................................... 5 
APLICAÇÃO 1 .......................................................................................................... 6 
2.5. Componentes Principais Obtidos de Variáveis Padronizadas ............................. 9 
APLICAÇÃO 2 .......................................................................................................... 11 
2.6. Sumarização da Variação Amostral por Componetes Principais ........................ 14 
2.7. Descarte de Variáveis .......................................................................................... 14 
2.8. Análises de Componentes Principais e Análise de Agrupamento....................... 15 
APLICAÇÃO 3 .......................................................................................................... 16 
3. VARIÁVEIS CANÔNICAS ...................................................................................... 21 
3.1. Introdução............................................................................................................ 21 
3.2. Obtenção das Variáveis Canônicas...................................................................... 22 
3.3. Importância Relativa de uma Variável Canônica ................................................ 25 
3.4. Descarte de Variáveis .......................................................................................... 25 
3.5. Análise de Variáveis Canônica e Análise de Agrupamento ................................ 26 
APLICAÇÃO 4 .......................................................................................................... 27 
4. CORRELAÇÕES CANÔNICAS............................................................................... 31 
4.1. Introdução............................................................................................................ 31 
4.2. Obtenção das Correlações Canônicas e dos Pares Canônicos............................. 32 
APLICAÇÃO 5 .......................................................................................................... 35 
4.3. Algumas Aplicações na Área Florestal ............................................................... 36 
5. ANÁLISE DE VARIÂNCIA MULTIVARIADA ..................................................... 38 
5.2. Considerações sobre a MANOVA ...................................................................... 39 
5.2.1. Desenvolvimento Matemático.......................................................................... 40 
APLICAÇÃO 1 .......................................................................................................... 47 
5.3. Procedimentos para Comparações Múltiplas ...................................................... 51 
6. REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................... 55 
 
 
 
 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 1 
1. INTRODUCÃO 
 A análise estatística multivariada ou simplesmente análise multivariada é o ramo da 
estatística direcionado ao estudo das amostras e distribuição multidimensionais, ou seja, são 
métodos estatísticos apropriados para estudos em que várias variáveis são consideradas 
simultaneamente. 
 No entanto, apesar de as técnicas multivariadas terem eficiência comprovada e propor-
cionarem enriquecimento das informações extraídas de dados experimentais, é necessária para 
seu uso a disponibilidade de recursos computacionais, motivo pelo qual a referida técnica 
ficou limitada no seu uso e do repasse entre os pesquisadores das diversas áreas da ciência, no 
Brasil. Entretanto, com a incrementação dos recursos da informática nos últimos anos, a 
técnica atraiu a atenção dos pesquisadores das diversas áreas, tornando o seu emprego 
potencialmente grande e, conseqüentemente, o seu conhecimento indispensável. 
 A análise multivariada compreende várias técnicas que, segundo KENDALL (1980), 
citado por CRUZ (1987), distinguem-se em: 
a) Técnicas de Avaliação da Interdependência: estuda as relações de um conjunto 
de variáveis entre si. 
 - “Cluster Analysis” ou Análise de Agrupamento 
 - Componentes Principais 
 - Correlações Canônicas 
 - Análise Fatorial 
 - Escala 
 
b) Técnicas de Avaliação da Dependência: estuda a dependência de uma ou mais 
variáveis em relação às outras. 
 - Regressão 
 - Relação Funcional 
 - Múltipla Contigência 
 - Análise Discriminante 
 
 Devido à complexidade e extensão do assunto, o presente trabalho teve como objetivo 
fazer uma abordagem sobre a utilização de algumas técnicas multivariadas na área florestal, 
tomando-se como base os seguintes estudos: Componentes Principais, Variáveis Canônicas e 
Correlações Canônicas. 
 
2. COMPONENTES PRINCIPAIS 
2.1. Introdução 
 A análise de componentes principais é uma técnica multivariada, que segundo 
KENDAL (1950), é uma técnica de avaliação da interdependência, ou seja, estuda as relações 
de um conjunto de variáveis entre si. 
 A técnica de componentes principais foi originalmente descrita por Karl Pearson, em 
1901, em um artigo onde deu ênfase à sua utilização no ajustamento de um subespaço a uma 
nuvem de pontos. Posteriormente, a técnica foi consolidada por Hotelling em 1933 e 1936, 
para o propósito particular de analisar estruturas de correlações (MORRISON, 1976, 
MARDIA et al., 1979; MANLY, 1986; CRUZ, 1990). Entretanto, o uso da análise só foi 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 2 
difundida após desenvolvimento de computadores eletrônicos e atualmente, devido a grande 
disponibilidade de recursos de computadores sofisticados e de software aplicados, a técnica 
tornou-se amplamente disponível e utilizada nas várias áreas da ciência. 
 A técnica de componentes principais procura explicar a estrutura de variâncias-
covariâncias através de poucas combinações lineares das variáveis originais, com os objetivos 
de reduzir os dados, colocá-los numa forma mais adequada para análise, evidenciar as 
tendências e facilitar sua interpretação. Segundo LIBERATO (1995), a utilização da análise 
de componentes principais tem por finalidade proporcionar simplificação estrutural dos dados, 
de modo que a diversidade, influenciada a princípio por um conjunto p-dimensional (p = 
números de caracter considerados no estudo), possa ser avaliada por um complexo bi ou 
tridimensional de fácil interpretação geométrica. Ou ainda, a análise por componentes 
principais, segundo CRUZ (1994), consiste em transformar um conjunto original de variáveis 
em outro conjunto, de dimensões equivalentes, mas com propriedades importantes de grande 
interesse em certos estudos. 
 Os princípios básicos desta técnica são descritos por vários autores, tais como 
MORRISON, 1976; MARDIA et al. (1979); KENDAL (1980); MANLY (1986);JOHNSON e 
WICHERN (1988); CRUZ e REGAZZI (1994); entre outros. Segundo estes autores, cada 
componente principal é uma combinação linear das variáveis originais, que são independentes 
entre si e estimadas com o propósito de reter, em ordem de estimação, o máximo da 
informação, em termos de variação total, contida nos dados originais. Assim, entre todos os 
componentes principais, o primeiro tem a maior variância, o segundo tem a segundamaior e 
assim sucessivamente. 
 A grande importância do conhecimento da técnica dos componentes principais, 
segundo SOUZA (1988), reside no fato de ela constituir um procedimento básico do qual 
derivam vários outros métodos de análise de dados multivariados, como por exemplo, análise 
de agrupamento “cluster analysis”. 
Assim, segundo CRUZ (1990) o uso da técnica de componentes principais pode 
atender os seguintes propósitos: 
i) examinar as correlações entre caracteres estudados; 
ii) resumir um grande conjunto de caracteres em outro menor e de sentido biológico; 
iii)avaliar a importância de cada caracter e promover a eliminação daqueles que contri-
buem pouco , em termos de variação, no grupo de indivíduos avaliados; 
iv) construir índices que possibilitem o agrupamento de indivíduos; e 
v) permitir o agrupamento de indivíduos com o mais alto grau de similaridade, 
mediante exames visuais em dispersões gráficas no espaço bi ou tridimensional. 
2.2. Obtenção dos Componentes Principais 
 Algebricamente, componentes principais são combinações lineares particulares das p 
variáveis aleatórias X1, X2, ... , Xp. Geometricamente, estas combinações lineares representam 
a seleção de um novo sistema de coordenadas obtidas pela rotação do sistema original como 
X1, X2, ... , Xp como eixos. Os novos eixos representam as direções com variablidade máxima 
e fornece uma descrição mais simples e mais parcimoniosa da estrutura de covariâncias. 
 Os componentes principais dependem somente da matriz de covariâncias (S) ou da 
matriz de correlação (R) de X1, X2, ..., Xp. Assim, a técnica de componentes principais 
caracteriza-se por trabalhar com a média amostral ou ser usada nas situações em que não há 
repetições de dados. 
O seu desenvolvimento não necessita de normalidade. No entanto, a análise de compo-
nentes derivada de populações normais multivariadas têm suas interpretações usuais em 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 3 
termos de elipsóides de densidade constante (JOHNSON e WICHERN, 1988). Entretanto, 
embora a análise, formalmente não requeira a distribuição normal multivariada, ela é mais 
apropriada para variáveis quantitativas contínuas. Quando os dados são constituidos de 
contagem, razões, proporções ou percentagens, a transformação é recomendada para tornar 
sua distribuição mais apropriada, previamente à análise de componentes principais. Como 
exemplo, STAUFFER et al. (1985) recomenda a transformação de arco seno da raiz quadrada 
para dados provenientes de percentagem e os dados de contagem a transformação de raiz 
quadrada (PIMENTEL GOMES, 1984). 
 Seja o vetor aleatório X’ = [X1, X2, ... , Xp] que tem a matriz de covariâncias (S) com 
auto- valores ( λ1 ≥ λ2 ≥ ... ≥ λp ≥ 0) e considerando as seguintes combinações lineares: 
 
 Y1 = 1’1X = 111 X1 + 121X2 + ... + 1P1XP 
 
 Y2 = 1’2X = 112X1 + 122X2 + .... + 1P2XP 
 . 
 . 
 . 
 YP = 1’PX = 11PX1 + 12pX2 + ... + 1PPXP 
 
Sendo: 
 
 Var (Yi) = 1’i S 1i i = 1, 2, ... , p 
 
 Cov (Yi ,Yk) = 1’i S 1k i, k = 1, 2, .... , p 
 
 Os componentes principais são combinações lineares não correlacionadas, cujas 
variâncias são tão grandes quanto possível. assim: 
a) O primeiro componente principal (Y1) é a combinação linear com variância 
máxima, isto é, é a combinação linear 1’1 X que maximiza Var (1’1X) sujeito a 
1’111 = 1; 
b) O segundo componente principal (Y2) é a combinação linear 1’2X que maximiza 
Var (1’2X), sujeito a 1’212 e com Cov (1’1X, 1’2X) = 0; 
c) O i-ésimo componente principal (Yi) é a combinação linear 1’iX que maximiza 
Var (1’iX), sujeito a 1’i1i = 1 e, em todos os casos, a Cov (1’iX, 1’kX) = 0. 
 Desta forma, verifica-se que entre todos os componentes principais, Y1 apresenta a 
maior variância, Y2 a segunda maior e, assim sucessivamente, e independente entre si. 
 Assim, segundo CRUZ e REGAZZI (1994), o problema estatístico consiste funda-
mentalmente em estimar os coeficientes de ponderação dos caracteres em cada componente e 
a variância a eles associada. 
 Sendo Y1 o primeiro componente principal, sua variância é dada por: 
 
Var (Y1) = 1’1 S 11 
 
O que se deseja é obter estimativas para o vetor 11 de tal forma que a variância de Y1 
seja a maior de todas. Para atingir este objetivo impõe-se a restrição 1’11= 1, a qual é 
introduzida na expressão Var (Y1) = 1’1 S 11 pelo multiplicador λ1 de Lagrante. Assim: 
 
 W1 = 1’1 S 11 + λ1 (1 - 1’1 11) 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 4 
 A solução que maximiza Var (Y1) é obtida pela derivação de W1 em relação a 11, que 
é dada por: 
 
  S - λ1 I a = 0 
 
 A solução deste sistema deve ser tal que 1 ≠ φ, assim é necessário que o determinante 
de (S - λ1I) seja mulo, para que o sistema se torne indeterminado e a solução possa ser 
escolhida entre aquelas que satisfaçam a condição 1’111 = 1. 
 Sendo λ1 o valor que satisfaz  S - λ1I = 0, então, por definição, λ1 é a raiz 
característica (ou autovalor) de S e 11, o vetor característico (autovetor) associado. 
 Sendo o vetor 1’1 o escolhido para maximizar Var (Y1), tem-se que λ1 é o maior valor 
entre o conjunto de autovalores de S. 
 A variância do segundo componente principal é dada por: Var (Y2) = 1’2 S 12. Para 
obtenção das estimativas do vetor 1’2, deve-se considerar as restrições 1’2 12 = 1 e 1’211 = 1’1 
12 = 0, as quais são incorporadas na função de maximização por meio dos multiplicadores λ2 e 
θθθθ de Lagrande. Assim, é estabelecido que: 
 
 W2 = 1’2 S 12 + λ2 ( 1 - 1’212) + θθθθ 1’2 11 
 
 A solução que maximizar Var (Y2), obtida pela derivação de W2 em relação ao 12, é 
dada por: 
 
 (S - λ2I) 12 = φφφφ 
 
em que λ2 é a segunda maior raiz característica de S e 12 o seu autovetor associado. 
 
 As restrições consideradas neste segundo componente principal atendem aos seguintes 
propósitos: 
 a) a primeira restrição é necessária para garantir a unicidade de 12; 
 b) a segunda restrição garante que 11 e 12 sejam ortogonais. 
 
 Os demais componentes principais são estimados de maneira análoga ao descrito para 
os dois primeiros. 
2.3. Importância Relativa de um Componente Principal 
 Baseando no fato de que: 
 
 Var (Yi) = λ i; 
 
 Var (Y1) ≥ Var (Y2) ≥ ... ≥ V (Yp) ≥ 0 
 
 Cov (Yi, Yk) = 0, para i ≠ k 
 
 p 
 ∑ Var (Yi) = tr S 
 
i=1 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 5 
ou seja, 
 
 p p 
 ∑ Var (Yi) = λ1 + λ2 + ... + λp = tr S = ∑ Var (Xi) = σσσσ211 + σσσσ222 + ... σσσσ2pp 
i = 1
 
i = 1 
 
 Assim, a importância relativa de um componente principal (IRk) é avaliada pela 
percentagem da variância que ela explica, ou seja, a proporção da variação total explicada 
pela k-ésima componente principal é dada por: 
 
 λk 
 IRk= 
_____________________________ k = 1, 2, ... , p 
 λ1 + λ2 + ... + λp 
 
 Ou ainda, a proporção da variação total explicada pelos primeiros k componentes 
principais (PVk’s) é dada por: 
 
 λ1 + λ2 + ... + λk 
 PVk’s =
 __________________________ k = 1, 2, ..., p 
 λ1 + λ2 + ... + λp 
 
 Desta forma, verifica-se que a proporção da variação total explicada pelos primeiros 
componentes principais é uma medida da quantidade de informação retida pela redução de p 
para k dimensão. 
 Em certos estudos é desejável que a variância acumulada nos dois primeiros compo-
nentes principais exceda 70-80%. Nesta condição, a distorção das coordenadas no gráfico de 
dispersão, cujos eixos são os componentes principais, será considerada aceitável e as inferên-
cias no estudo satisfatório (CRUZ e REGAZZI, 1994). 
2.4. Correlação Entre o Componente Yk e a Variável Xi 
 Se Y1 = 1’1X; Y2 = 1’2X; .... , Yp = 1’pX são os componentes principais obtidos da 
matriz de covariância (S), então o coeficiente de correlação entre o componente Y1 e a 
variável Xk é dado por: 
 Cov (Yi , Xk) λ i 1 ki 1ki [ λ i ]½ 
 Yi, Xk = 
________________________________= ____________________ = ______________ 
 [Var (Yi)]½
 [Var (Xk)]½
 [λ i ]½ [σσσσkk]½ [σσσσkk]½ 
 
em que: 
 
 i, k = 1, 2, ... , p 
 
 Cov (Yi, Xk) = λ i 1ki 
 
 Var (Yi) = λi 
 
 Var (Xk) = σσσσ kk 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 6 
APLICAÇÃO 1 
 Supondo os seguintes dados, organizados na forma de uma matriz X, representando 
uma amostra de uma vegetação constituída de duas espécies e cinco parcelas, 
 
 
 2 5 2 1 0 _ 2,0 
 X = X = 
 0 1 4 3 1 1,8 
 
 
 
 Em que os vetores linhas representam as espécies e os vetores colunas representam as 
parcelas: 
 
 A matriz de covariância amostral para as duas espécies da matriz X é: 
 
 S11 S12 3,5 -0,5 
 S = = 
 S21 S22 -0,5 2,7 
 
 
 * A covariância amostral foi obtida pela fórmula: 
 
 n _ _ 
 Shi = [ ∑ (Xhj - Xh) (Xij - Xi) ] / (n - 1) , j = 1 , ... n, 
 i = 1 
 
em que Xh é a média da espécie h e Xi é a média da espécie i. 
 Assim, obteve-se os seguintes pares de autovalores-autovetores: 
 
 λ1 = 3,74; 1’1 = [-0.901 0,433] 
 
 λ2 = 2,46; 1’2 = [ 0,433 0,901] 
 
 Observa-se que a soma dos autovalores é igual a soma das variâncias das espécies: 
 
 S11 + S22 = λ1 + λ2 = 3,5 + 2,7 = 3,74 + 2,46 = 6,2 
 
ou ainda: 
 
Var (Y1) = Var (0,901 X1 + 0,433 X2) 
 
Var (Y1) = (-0,901)
2 Var (X1) + (0,433)
2 Var (X2) + 2(-0,901) (0,433) Cov (X1, X2) 
 
Var (Y1) = (0,812) (3,5) + (0,187) (2,7) + (0,39) (-0,5) 
 
Var (Y1) = 3,74 = λ1 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 7 
Var (Y2) = Var (0,433 X1 + 0,901 X2) 
 
Var (Y2) = (0,433)
2 Var (X1) + (0,901)
2 Var(X2) + 2(0,433) (0,901) Cov (X1, X2) 
 
Var (Y2) = (0,187) (3,5) + (0,812) (2,7) + (-0,39) (-0,5) 
 
Var (Y2) = 2,46 = λ2 
 
 A importância relativa de cada um dos componentes principais é dada por: 
 
 λk 
 IRk =
 _______________ k = 1 ,2 
 λ1 + λ2 
 
 p 
 σσσσ11 + σσσσ22 = V (X1) = λ1 + λ2 = ∑ V (Yi) = 6,2 
 i =1 
 
Assim, 
 
 λ1 3,74 
 IR1 = 
_____________ = _________ = 0,6033 ∴∴∴∴ 60,33% 
 λ1 + λ2 6,20 
 
 
 λ2 2,46 
 IR2 = 
____________ = __________ = 0,3967 ∴∴∴∴ 39,67% 
 λ1 + λ2 6,20 
 
 Verifica-se, neste caso, que 60,37% da variação total está concentrada em Y1, ou seja, 
Y1 explica 60,33% da variação total. O segundo componente principal (Y2) explica 39,67% da 
variação total. 
 
 
 O coeficiente da correlação entre Y1 e as variáveis X1 e X2 são: 
 
 111 [λ1]½ -0,901 [3,74]½ 
 ρρρρY1,X1 = ______________ = _____________________ = -0,93 
 [σσσσ11]½ [3,50]½ 
 
 
 121 [λ1]½ 0,433 [3,74]½ 
 ρρρρY1,X2 = ______________ = _____________________ = 0,51 
 [σσσσ22]½ [2,70]½ 
 
 
 Estes resultados mostram que existem uma grande correlação entre Y1 e X1, 
mostrando que X1 é de grande importância para o primeiro componente principal. 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 8 
 O coeficiente de correlação entre Y2 e as variáveis X1 e X2 são: 
 
 112 [λ2]½ 0,433 [2,46]½ 
 ρρρρY2,X1 = ______________ = ____________________ = 0,36 
 [σσσσ11]½ [3,50]½ 
 
 
 122 [λ2]½ 0,901 [2,46]½ 
 ρρρρY2,X2 = ______________ = _____________________ = 0,86 
 [σσσσ22]½ [2,70]½ 
 
 
 Neste caso, é verificado que a variável X2 é a de maior importância para o segundo 
componente principal (Y2). 
 
 Em resumo, tem-se: 
 
Componente Variância CPA (Autovetores) 
Principal Autovalor (%) X1 X2 
Y1 3,74 60,33 -0,901 0,433 
Y2 2,46 39,67 0,433 0,901 
CPA = Coeficiente de ponderação associado. 
 
 
 Os escores dos componentes são obtidos por: 
 
 Y11 = -0,901 (2) + 0,433 (0) = -1,802 
 
 Y12 = -0,901 (5) + 0,433 (1) = -4,072 
 
 Y13 = -0,901 (2) + 0,433 (4) = -0,070 
 . 
 . 
 . 
 Y25 = 0,433 (0) + 0,901 (1) = 0,901 
 
 
 Assim, obtém-se: 
 
Parcelas Componentes 
 Y1 Y2 
1 -1,802 0,866 
2 -4,072 3,066 
3 -0,070 4,470 
4 0,398 3,136 
5 0,433 0,901 
Variância 3,740 2,460 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 9 
Os escores dos componentes são coordenadas retangulares da ordenação e podem ser 
plotados e produzir o seguinte diagrama (Figura 1), que mostra a distribuição agrupada dos 
componentes. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 1 - Dispersão das Cinco Parcelas em Relação aos Dois Componentes Principais 
(Y1 e Y2). 
 
2.5. Componentes Principais Obtidos de Variáveis Padronizadas 
 Segundo CRUZ (1987), o método de obtenção dos componentes principais a partir de 
uma matriz de covariâncias (S), como descrito anteriormente, tem sido aconselhável apenas 
nos casos em que os caracteres apresentam uma mesma unidade e dimensão não muito 
discrepante. No entanto, em situações em que este fato não se verifica, ou seja, os caracteres 
em estudo são bastante diferentes em suas unidades e em sua magnitude, tem sido 
recomendada a padronização dos mesmos, da seguinte forma: 
 
 X1 - µµµµ 
 Zi = 
___________ 
 σσσσi 
 
 Neste caso, a matriz de covariâncias das variáveis Zi, i = 1, 2, ..., p, torna-se: 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 10 
 
 1 r12 . . . r1p 
 
 r12 1 . . . r2p 
 R = . . . 
 . . . 
 . . . 
 rp1 rp2 . . . 1 
 
em que: 
 
Cov (Xi , Xj) 
 rij = Cov (Zi, Zj) = 
________________________ 
 [Var (Xi) Var (Xj)]½ 
 
 De acordo com CRUZ (1987), as estimativas dos componentes principais, quando se 
usa a matriz S pode ser muito diferente daquelas encontradas quando se utiliza da matriz R. 
Assim, é recomendado o uso de matriz S, somente naqueles casos em que as unidades 
originais não são fixadas arbitrariamente, mas sim sugeridas por razões objetivas. 
 
 Seja o vetor aleatório X’ = [ X1, X2, .... , Xp]. Considerando a padronização destas 
variáveis, tem-se: 
 
 X1 - µµµµ1 X2 - µµµµ2 Xp - µµµµp 
 Z1 = 
___________ ; Z2 = 
___________ ; . . . ; Zp = 
___________ 
 [σσσσ11]½ [σσσσ22]½ [σσσσpp]½ 
 
 
 A notação matricial é: 
 
 Z = (V ½ )-1 (X - µµµµ) 
 
em que 
 
 σσσσ 11 
 σσσσ22 
 . 
 V = . 
 . 
 σσσσpp 
 
 
 É claro que: 
 
 E (Z) = φφφφ e Var (Z) = (V ½ )-1 Var (X - µµµµ) (V ½ )-1 
 
 Var (Z) = (V ½)-1 S (V ½ )-1 = R (matriz de correlação) 
 
tem-se que: V ½ . R . V ½ = S. 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 11 
em que: 
 
 σσσσ11 σσσσ21 . . . σσσσp1 
 
 σσσσ12 σσσσ22 . . . σσσσp2 
 
 S = . . 
 . . 
 . . 
 σσσσ1p σσσσ22 . . . σσσσpp 
 
 Os componentes principais de Z podem ser obtidos dos autovalores-autovetores da 
matriz de correlação R de X. Assim, se continuarmos denotando Yi para referir o i-ésimo 
componente principal e (λ i, 1i) para os pares de autovalores-autovetores. O i-ésimo 
componente principal das variáveis padronizadas Z’= [ Z1, Z2, ... , Zp], com Var (Z) = R, é 
dado por: 
 
 Yi = 1’i Z = 1’i (V 
½ )-1 (X - µµµµ), i = 1,2,..., p 
 
 p p 
 com : ∑ Var (Yi) = ∑ Var (Zi) = p 
 i = 1 i = 1 
 
 ρρρρYi , Zk = 1ki [λi]½, i , k = 1, 2, ..., p 
 
 
 Neste caso (λ1 , 11), (λ2 , 12), ... , (λp , 1p) são pares de autovalores-autovetores de R. 
 
 Desta forma, baseando no fato de que ∑ Var (Zi) = p, a proporção da variação total 
devido ao k-ésimo componente principal é dada por: 
 
 λk 
 IRk = 
________ , k = 1, 2, ..., p 
 p 
 
em que os λ k’s são os autovalores da matriz R. 
 
 
APLICAÇÃO 2 
Seja a matriz de covariâncias S: 
 
 
 1 4 
 S = 
 4 100 
 
 
MANEJOFLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 12 
e a matriz de correlação R: 
 
 
 1,0 0,4 
 R = 
 0,4 1,0 
 
 Os pares de autovalores-autovetores de S são: 
 
 λ1 = 100,16 1’1 = [0,040 0,999] 
 
 λ2 = 0,84 1’2 = [0,999 -0,040] 
 
 
 Similarmente, os autovalores-autovetores de R são: 
 
 λ1 = 1 + ρρρρ = 1,4; 1’1 = [0,707 0,707] 
 
 λ2 = 1 - ρρρρ = 0,6; 1’2 = [0,707 -0,707] 
 
 
 Os respectivos componentes principais são: 
 
 a) A partir de S; 
 
 Y1 = 0,040 X1 + 0,999 X2 
 
 Y2 = 0,999 X1 - 0,040 X2 
 
 
 b) A partir de R: 
 
 Y1 = 0,707 Z1 + 0,707 Z2 
 
 X1 - µµµµ1 X2 - µµµµ2 
 Y1 = 0,707 
_____________ + 0,707 _____________ 
 1 10 
 
 Y1 = 0,707 (X1 - µµµµ1) + 0,0707 (X2 - µµµµ2) 
 
 
 
 Y2 = 0,707 Z1 - 0,707 Z2 
 
 X1 - µµµµ1 X2 - µµµµ2 
 Y2 = 0,707 
_____________ - 0,707 _____________ 
 1 10 
 
 Y2 = 0,707 (X1 - µ1) - 0,0707 (X2 - µ2) 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 13 
 A proporção da variação total explicada por cada um dos componentes principais são: 
 
 a) A partir de S: 
 
 λ1 100,16 
 IR1 = 
___________ = ___________ = 0,992 
 λ1 + λ2 101,00 
 
 
 λ2 0,84 
 IR2 = 
___________ = ___________ = 0,008 
 λ1 + λ2 101,00 
 
 O primeiro componente principal (Y1) explica 99,2% da variação total. 
 
 b) A partir de R: 
 
 λ1 1,40 
 IR1 = 
_______ = _______ = 0,70 
 p 2,00 
 
 λ2 0,60 
 IR2 = 
_______ = _______ = 030 
 p 2,00 
 
 O primeiro componente principal (Y1), neste caso, explica 70% da variação total. 
 
 Os coeficientes de correlação entre Yi e as variáveis X1 e X2, são: 
 
 a) A partir de S: 
 
 111 [λ1 ]½ 0,040 [100,16]½ 
 ρρρρY1,X1 = ____________ = _____________________ = 0,400 
 [σ11 ]½ [1,0]½ 
 
 
 121 [λ1 ]½ 0,999 [100,16]½ 
 ρρρρY1,X2 = ____________ = _____________________ = 0,998 
 [σ22 ]½ [100]½ 
 
 
 112 [λ2 ]½ 0,999 [0,840]½ 
 ρρρρY2,X1 = ____________ = _____________________ = 0,916 
 [σ11 ]½ [1,0]½ 
 
 
 122 [λ2 ]½ -0,040 [0,840]½ 
 ρρρρY2,X2 = ____________ = _____________________ = -0,004 
 [σ22 ]½ [100]½ 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 14 
 b) A partir de R: 
 
 ρρρρY1,Z1 = 111 [λ1 ]½ = 0,707 [1,4]½ = 0,837 
 
 ρρρρY1,Z2 = 121 [λ1 ]½ = 0,707 [1,4]½ = 0,837 
 
 ρρρρY2,Z1 = 112 [λ2 ]½ = 0,707 [0,6]½ = 0,548 
 
 ρρρρY2,Z2 = 122 [λ2 ]½ = -0,707 [0,6]½ = -0,548 
 
 
 Da aplicação 2, pode-se concluir que a variável X2 praticamente domina o primeiro 
componente principal, quando este é determinado a partir de S, em que o primeiro 
componente principal (Y1) explica 99,2% da variação total. Quando as variáveis X1 e X2 são 
padronizadas, no entanto, as duas variáveis contribuem igualmente, e o primeiro componente 
principal explica 70% da variação total. 
 O presente exemplo demonstra que os componentes principais derivados a partir de S 
são diferentes daqueles derivados a partir de R. Um grupo de componentes principais não é 
uma simples função do outro. Isto sugere que a padronização não é inconseqüente. 
 Assim, variáveis podem ser padronizadas se elas possuem medidas ou escalas muito 
diferentes ou as unidades de medida são incomesuráveis. 
2.6. Sumarização da Variação Amostral por Componetes Principais 
 Embora p-componentes principais sejam necessários para reproduzir a variabilidade 
total do sistema, a viabilidade de utilização da técnica de componentes principais reside na 
possibilidade de resumir o conjunto de variáveis originais em poucos componentes. Nestas 
condições, esta técnica proporcionará uma simplificação considerável nos cálculos estatísticos 
e na interpretação dos resultados com relação aos demais métodos altenativos, principalmente 
quando o número de indivíduos avaliados for relativamente grande. 
 Assim, se os primeiros componentes principais acumularem uma porcentagem 
relativament alta da variação total, em geral referida como acima de 80%, eles explicarão 
satisfatoriamente a variabilidade manifestada entre os indivíduos avaliados e, portanto, o 
fenômeno poderá ser interpretado com considerável satisfação. Segundo CRUZ e REGAZZI 
(1994), em estudos da divergência genética, em geral, têm optado pela representação gráfica 
quando os dois primeiros componentes principais envolvem pelo menos 70 a 80% da variação 
total. Nos casos em que este limite não é alcançado nos dois primeiros componentes, a análise 
é complementada pela dispersão gráfica em relação ao terceiro e quarto componente. 
2.7. Descarte de Variáveis 
 Em certos estudos, quando o número de variáveis é muito grande, procura-se descartar 
aquelas de poucas relevância na discriminação do material avaliado, reduzindo, assim, mão-
de-obra, tempo e custo despendido na análise e interpretação dos dados experimentais. 
 Em estudos de divergência genética, caracteres dispensáveis são aqueles relativamente 
invariantes entre as espécies/clones estudados,e, ou, redundantes, por estarem correlacionados 
com outros caracteres (CRUZ & REGAZZI , 1994). Segundo ADANS e WIERSMA (1978), 
citado por CRUZ e REGAZZI (1994), os caracteres a serem preservados na análise de 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 15 
divergência genética deverão ser apenas aqueles que representam a estrutura fundamental do 
sistema biológico que está sendo estudado, devendo ainda serem suficientemente diversos 
para representarem, no mínimo, as dimensões mais importantes do sistema. 
 Uma das técnicas de descartes de variáveis é aquela citada por MARDIA et al. (1979) 
e CRUZ e REGAZZI (1994), em que baseia-se no princípio de que a importância relativa dos 
componentes principais decresce do primeiro para o último; assim, têm-se que os últimos 
componentes são responsáveis pela explicação de uma fração mínima da variância total 
disponível. Desta forma, segundo estes autores, a variável que apresentam maior coeficiente 
de ponderação (elemento do autovetor) no componente de menor autovalor, é considerada de 
menor importância para explicar a variabilidade do material estudado, sendo, portanto, 
possível de descarte. 
 Este princípio de descarte de variáveis é consistente com a notação que considera que 
um componente com um pequeno autovalor é de pouca importância e, consequentemente, a 
variável que domina este deve ser de pequena importância ou redundante. 
 Segundo recomendações de JOLLIFFE (1972, 1973), MARDIA et al. (1979) e CRUZ 
e REGAZZI (1994) tem sido comum descartar a variável de maior coeficiente de ponderação 
(em valor absoluto) a partir do último componente até aquele cujo autovetor não excede a 
0,70 (válido para dados padronizados). Quando em um componente de menor variância, o 
maior coeficiente de ponderação está associado a uma variável já previamente descartada, 
tem-se optado por não fazer nenhum outro descarte com base nos coeficientes daquele 
componente, mas prosseguir a identificação da importância relativa das variáveis no outro 
componente de variância imediatamente superior. 
 Uma variação deste método de descarte de variáveis, segundo MARDIA et al. (1979), 
consiste a cada estágio de descarte da variável associada com o componente de menor 
autovalor, refazer a análise de componentes principais com as variáveis remanescentes. Este 
processo é conduzido até que todos os componentes principais tenham autovalores altos. 
2.8. Análises de Componentes Principais e Análise de Agrupamento 
 O uso dos componentes principais na redução do número dedimensões de uma matriz 
permite a apresentação gráfica. Assim, quando os primeiros componentes explicam a maior 
parte da variação do sitema em estudo, estes podem ser representados graficamente e apre-
sentar uma importante aplicação em conexão com a análise de agrupamento (MARDIAet al., 
1979; MARRIOT, 1974). 
 Segundo CRUZ e REGAZZI (1994), um dos objetivos do uso dos componentes 
principais em estudo sobre a divergência genética é avaliar a dissimilaridade dos genótipos, 
clones, etc., em gráficos de dispersão, em que tem os primeiros componentes como eixo de 
referência. Este procedimento é satisfatório quando os odis primeiros componentes utilizados 
como eixo do sistema cartsiano envolvem uma fração considerável da variação total, 
normalmente citada como acima de 70 a 80%. Nos casos em que o limite não é atingido com 
os dois primeiros componentes, a análise é complementada com a dispersão gráfica em 
relação ao terceiro e quarto componente. 
 MARRIOT (1974) comenta que uma das dificuldades na análise de agrupamento, 
utilizando métodos numéricos, é com relação a decisão da divisão de um conjunto de 
observações em grupos. Em alguns casos, métodos visuais são mais eficientes do que os 
baseados em valores numéricos. Assim, gráficos de dispersão provenientes dos componentes 
principais podem auxiliar a análise de agrupamento em vários sentidos. Em primeiro lugar, 
como forma particular de análise de agrupamento, ou seja, naquelas situações em que os 
grupos são claramente definidos e bem separados, um método analítico elaborado, neste caso, 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 16 
é usualmente desnecessário. Pode mostrar que uma técnica particular de agrupamento não 
apresenta resultados satisfatórios, sugerindo assim, alternativas. Finalmente, se testes de 
significância não são possíveis, a representação gráfica por componentes principais confirma 
os agrupamentos sugeridos pelos métodos numéricos. 
 Segundo CRUZ e REGAZZI (1994), como nesta técnica é feita uma simplificação do 
espaço n-dimensional para o bi ou tri-dimensional, há certas distorções nas distâncias. 
Entretanto, há entre as estimativas das distâncias euclideanas baseadas nos escores dos 
primeiros componentes principais e as distâncias Euclideanas baseadas nos dados originais, 
uma relação matemática dada por: 
 
 ∑ ∑ dcp2ii’ 
 αααα = ____________________ , para i < i’. 
 n ∑ ∑ d2ii’ 
 
em que: 
 
dcp2ii’ = quadrado da distância Euclidiana estimada a partir dos escores de n1 componentes 
principais; 
d2ii’ = quadrado da distância Euclidiana média estimada a partir das n variáveis originais. 
 
 Assim, segundo estes autores, o parâmetro (1 - αααα) mede o grau de distorção 
proporcionado pela técnica dos componentes principais, ao se passar do espaço n-dimensional 
para o n1-dimensional (n1 < n). 
 Nos casos em que a dispersão gráfica não provê informações adequadas sobre o grau 
de similaridade dos indivíduos estudados, CRUZ (1990) comenta que certos autores têm 
utilizado os escores dos primeiros componentes principais para o cálculo da distância 
Euclideana, valendo-se, para esse fim, da propriedade de independência entre tais compo-
nentes. Tal procedimento é, muitas das vezes, utilizado para complementar as informações da 
dispersão gráfica, em virtude de permitir o estabelecimento de grupos de maneira menojs 
subjetiva do que aquela que se verifica em exames visuais. Maiores detalhes sobre a utilização 
combinada das duas técnicas (componentes principais e conglomeração) em estudos sobre 
divergência genética são encontrados em ADANS e WIERSMA (1978). 
 
APLICAÇÃO 3 
 Caso base em dados de um teste de progênies de Eucalyptus sp., em que foram 
avaliadas 10 características (X1, X2, X3, X4, X5, X6, X7, X8, X9 e X10) em 10 progênies, num 
delineamento em blocos ao acaso com quatro repetições e seis plantas por parcela, realizou-se 
a análise por componentes principais. A seguir são apresentados as matrizes de médias, 
variância, covariância e de correlações. 
 
 
 
 
 
 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 17 
Quadro 1 – Médias dos Dados Originais das 10 Progênies em Relação a 10 características 
(X1, X2, X3, X4, X5, X6, X7, X8, X9 e X10) 
Características 
Prog. 
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 
1 10.7542 0.6708 16.4708 12.8417 0.0750 0.0575 0.0175 0.4786 0.3659 0.1559 
2 10.3417 0.6000 17.0833 13.0708 0.0731 0.0556 0.0175 0.4791 0.3647 0.1513 
3 11.2625 0.6750 17.0250 13.2875 0.0832 0.0649 0.0184 0.5509 0.4274 0.1842 
4 10.3583 0.6083 16.7542 13.1375 0.0768 0.0587 0.0181 0.5230 0.3975 0.1475 
5 9.8083 0.5542 15.9250 11.6000 0.0616 0.0480 0.0136 0.4943 0.3846 0.1244 
6 10.2292 0.6833 16.6208 13.0708 0.0691 0.0525 0.0167 0.4953 0.3750 0.1402 
7 9.6042 0.6500 15.7333 11.5958 0.0621 0.0479 0.0142 0.5147 0.3939 0.1201 
8 9.5208 0.5833 15.8167 11.6208 0.0579 0.0439 0.0140 0.4950 0.3758 0.1169 
9 11.6333 0.7458 16.6833 12.9125 0.0954 0.0736 0.0218 0.4924 0.3769 0.1979 
10 10.4292 0.6792 15.7208 11.7958 0.0687 0.0527 0.0161 0.4803 0.3674 0.1422 
 
 
 
Quadro 2 – Médias Padronizadas das 10 Progênies em Relação a 10 Características (X1, X2, 
X3, X4, X5, X6, X7, X8, X9 e X10) 
Características 
Prog. 
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 
1 15,78 11,66 30,73 17,47 06,69 06,54 07,04 20,82 19,03 05,90 
2 15,17 10,43 31,87 17,78 06,52 06,32 07,04 20,84 18,97 05,73 
3 16,52 11,73 31,76 18,08 07,42 07,38 07,41 23,97 22,23 06,98 
4 15,19 10,57 31,26 17,88 06,85 06,68 07,28 22,75 20,68 05,59 
5 14,39 9,63 29,71 15,78 5,50 5,36 5,55 21,47 19,23 4,71 
6 15,01 11,87 31,01 17,78 06,17 05,97 06,72 21,55 19,51 05,31 
7 14,09 11,29 29,35 15,78 05,54 05,45 05,71 22,39 20,49 04,55 
8 13,97 10,14 29,51 15,81 05,17 04,99 05,63 21,54 19,55 04,43 
9 17,07 12,96 31,12 17,57 08,51 08,37 08,77 21,42 19,60 07,49 
10 15,30 11,80 29,33 16,05 06,13 05,99 06,48 20,89 19,11 05,38 
 Xi 
* Padronização : Z i = 
______ . 
 ρρρρi 
 
 
Quadro 3 – Matriz de Variâncias e Covariâncias Entre as Variáveis originais 
 
0,4646 0,0291 0,2361 0,3507 0,0074 0,0058 0,0016 0,0026 0,0025 0,0178 
 0,0033 0,0730 0,0171 0,0005 0,0004 0,0001 0,00004 0,000009 0,0011 
 0,2872 0,3772 0,0142 0,0032 0,0009 0,0034 0,0025 0,0099 
 0,5401 0,0061 0,0046 0,0014 0,0044 0,0030 0,0141 
 0,0001 0,0001 0,00003 0,00005 0,00005 0,0003 
 0,00008 0,00002 0,00005 0,00004 0,00006 
 0,000006 0,000006 0,000004 0,000006 
 0.00053 0,0004 0,0001 
 0,0004 0,0001 
 0,0007 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 18 
Quadro 4 – Matriz de Correlação entre Variáveis Originais 
1,0 0,7419 0,6462 0,7000 0,9626 0,9663 0,9263 0,1668 0,1932 0,9885 
 1,0 0,2391 0,4050 0,7043 0,6992 0,7097 0,0295 0,0081 0,7032 
 1,0 0,9577 0,6977 0,6835 0,7294 0,2726 0,2418 0,7035 
 1,0 0,7365 0,7176 0,7860 0,2619 0,2112 0,7263 
 1,0 0,9983 0,9785 0,2060 0,2087 0,9768 
 1,0 0,9647 0,2352 0,2457 0,9803 
 1,0 0,1012 0,0768 0,9395 
 1,0 0,9857 0,2279 
 1,0 0,2485 
 1,0 
 
 
 Baseado na teoria descrita anteriormente sobre componentes principais, os autovalores 
e autovetores associados são apresentados a seguir (Quadro 5). Estes foram obtidos a partir da 
matriz de correlação entre as características originais (R) (ou matriz de covariâncias entre as 
características padronizadas). 
 A obtenção destes autovalores e autovetores associados por um processo manual é 
impraticável. Desta forma, utilizou-se o Software GENES. 
 
 
Quadro 5 – Componentes Principais Obtidos da Análise de 10 Características (X1, X2, X3, 
X4, X5, X6, X7, X8, X9 e X10) 
 
Variância Coeficiente de Ponderação Associado (Autovetores) 
Componente 
Principal Autovalor 
Acumul. 
(%) 
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 
Y1 6,6879 66,88 0,3713 0,2715 0,3041 0,3218 0,3788 0,3778 0,3728 0,1117 0,1090 0,3778 
Y2 1,9454 86,33 -0,0862 -0,2067 0,0954 0,0537 -0,0639 -0,0406 -0,1411 0,6752 0,6744 -0,0398 
Y3 0,9508 95,79 -0,1511 -0,5276 0,6051 0,4980 -0,0863 -0,1151 0,0137 -0,1405 -0,1838 -0,1012 
Y4 0,2950 98,84 -0,1973 0,7308 0,1132 0,4413 -0,2375 -0,2799 -0,0621 0,1362 -0,0554 -0,2432 
Y5 0,0849 99,64 -0,5509 -0,0580 -0,1532 -0,0238 0,3027 0,2162 0,5664 0,2195 -0,1465-0,3746 
Y6 0,0255 99,87 -0,4299 0,2392 0,6111 -0,5532 0,0263 0,0539 -0,0943 -0,0505 0,0272 0,2501 
Y7 0,0099 99,99 0,1078 -0,0855 -0,0135 -0,1496 -0,2984 -0,5076 0,4868 0,3609 -0,2933 0,3981 
Y8 0,0003 99,99 0,4077 0,0557 0,2788 -0,2880 -01295 -0,1633 0,4069 -0,2360 0,3195 -0,5507 
Y9 0,00009 99,99 -0,3560 -0,0092 -0,2113 0,1968 -0,1537 -0,1377 0,3015 -0,5032 0,5305 0,3488 
Y10 0,00002 100,00 -0,0029 -0,0047 0,0002 0,0008 -0,7529 0,6411 0,1175 0,0589 -00686 0,0057 
 
 
 
 No Quadro 3, pode-se constatar numericamente que: 
 
 ∑ λ i = ∑ Var (Yi) = Traço R = 10 
 i 
 
 ∑ a21 = 1 e ∑ aj bj = φφφφ 
 j 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 19 
 Os resultados apresentados no Quadro 5 evidenciam que o primeiro componente 
principal (Y1) explica 66,88% da variação total disponível. Os dois primeiros componentes 
principais (Y1 e Y2) explicam 86,33% e os três primeiros (Y1, Y2 e Y3) explicam 95,84% da 
variância total disponível. Portanto, para o presente exemplo, a técnica de componentes 
principais sumariza muito bem a variação total disponível dos dados amostrais pelo três 
primeiros componentes principais. 
 Assim, a utilização destes componentes no estudo de divergência genética por meio da 
dispersão dos escores em gráficos cujos eixos são os referidos componentes (Y1 e Y2), 
apresentará resultados satisfatórios. 
 Em estudos que utilizam a técnica dos componentes principais como meio de descartes 
de variáveis com a finalidade de redução de mão-de-obra, tempo e custo despendido na 
análise e interpretação dos dados experimentais, a importância relativa das características 
pode ser avaliada pela magnitude do coeficiente de ponderação destas. Assim, com base em 
MARDIA et al. (1978) e CRUZ e REGAZZI (1994), para o presente exemplo, identifica-se, 
em ordem crescente, os caracteres X5, X10, X6, X3, X7 e X2, com maiores pesos em Y10 
(-0,7529), Y9 (0,5305), Y8 (-0,5507), Y7 (-0,5076), Y6 (0,6111), Y5 (0,5664) e Y4 (0,7308), 
respectivamente, como os de menores importância no estudo realizado, são possíveis de 
descarte. 
 No exemplo em consideração, o descarte de X2, X3, X5, X6, X7 e X10 é minimizado 
pela presença de X1 e X4, cujas correlações entre estas são altas (ver matriz de correlações 
entre variáveis originais). O descarte da variável X9 é minimizado pela presença de X8, cuja 
correlação com X9 é de 0,9857. 
 Os escores relativos a cada progênie, em cada componente, é estimado com base nas 
informações do Quadro 2 (médias padronizadas das 10 progênies em relação as 10 
características X1, X2, X3, X4, X5, X6, X7, X8, X9 e X10) e do Quadro 5 (componentes 
principais obtidos da análise de 10 características X1, X2, X3, X4, X5, X6, X7, X8, X9 e X10). 
Assim, tem-se: 
 
 Y11 = 0,3713 (15,78) + 0,2715 (11,66) + 0,3041 (30,73) 
 + 0,3218 (17,47) + 0,3788 (6,69) + 0,3778 ( 6,54) + 
 + 0,3728 (7,04) + 0,1117 (20,82) + 0,1090 (19,03) + 
 + 0,3778 (5,90) 
 Y11 = 38,2770 
 
 
 Os demais escores encontram-se no Quadro 6. 
 
 A dispersão destes escores em eixos cartesianos é apresentada na Figura 2. 
 
 Com base na Figura 2, observa-se que, em relação aos caracteres considerados, as 
progênies 1, 2, 6 e 10 e as progênies 5, 7 e 8 são as mais similares, havendo, entretanto, 
considerável divergência entre as progênies 3, 4 e 9. 
 
 As distâncias gráficas podem se estimadas pelas distâncias Euclideanas: 
 
 dcpii = [(Yi1 - Y’i’1)
2 + (Yi2 - Y’i’2)
2]½ 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 20 
Quadro 6 – Escores Relativos a 10 Progênies, Obtidos em Relação aos Dois Primeiros 
Componentes Principais 
Genótipos Y1’ Y2 
1 38,2570 25,0736 
2 37,9302 25,5050 
3 40,8988 29,2319 
4 38,5141 27,7958 
5 34,6232 26,9303 
6 37,5891 26,9303 
7 35,0461 27,4731 
8 34,1564 26,5848 
9 41,9986 25,0295 
10 36,4273 25,1353 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 2 – Dispersão de 10 Progênies em Relação aos Dois Primeiros Componentes 
Principais (Y1 e Y2). 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 21 
 Por esta expressão são obtidas as medidas de dissimilaridade, que são apresentadas no 
Quadro 7. Como ilustração é obtida a estimativa de dcp1,2: 
 
 dcp1,2 = [ (38,2570 - 37,9302)
2 + (25,0736 - 25,5050)2]½ 
 
 dcp1,2 = 0,5412 
 
 
Quadro 7 – Dissimilaridade entre Genótipos, com Base na Distância Euclideana, Obtida de 
Escores dos Dois Primeiros Componentes Principais 
 
- 0,5412 4,9265 2,7343 4,0807 1,2030 4,0083 4,3702 3,7419 1,8307 
 - 4,7647 2,3640 3,6011 0,6635 3,4915 3,9252 4,0961 1,5477 
 - 2,7837 6,6843 4,5745 6,1111 7,2434 4,3439 6,0644 
 - 3,9860 1,9544 3,4828 4,5228 4,4491 3,3813 
 - 3,0870 0,6882 0,5808 7,6164 2,5450 
 - 2,9022 3,4705 4,5315 1,4937 
 - 1,2574 7,3692 2,7152 
 - 7,9949 2,6941 
 - 5,5723 
 - 
 
 
3. VARIÁVEIS CANÔNICAS 
3.1. Introdução 
 A análise de variáveis canônicas é uma técnica multivariada cujo procedimento foi 
relatada por Fischer (1936). Posteiormente, desenvolvida por vários outros autores nas diver-
sas áreas da ciência, tais como M.S. Batlet, P. C. Mahalanobis e C. R. Rao, citadas por 
CAMPBELL e ATCHLEY (1981), para examinar alguns problemas significantes relativos à 
sistemática biológica. Mais recentemente, CRUZ e REGAZZI (1994), descreveram a referida 
técnica na utilização em estudos de divergência genética, com propósito de identificação de 
grupos similares no espaço bi ou tridimensional. 
 Segundo CRUZ e REGAZZI (1994), a análise multivariada com base em variáveis 
canônicas, trata-se de um processo alternativo para a avaliação do grau de similaridade entre 
acessos que leva em consideração tanto a matriz de covariância residual quanto a covariância 
entre médias fenotípicas dos caracteres avaliados. 
 As variáveis canônicas são combinações lineares das variáveis originais, sendo 
determinadas de tal modo que a variação entre grupos é maximizada em relação à variação 
dentro de grupos. A semelhança da análise de componentes principais, espera-se que a 
configuração do grupo possa ser adequadamente representada em um sub-espaço bi ou 
tridimensional pelos primeiros dois ou três vetores canônicos (Campbell e Atechley, 1981, 
citados por LIBERATO, 1995). 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 22 
 Assim, a viabilidade do uso das variáveis canônicas em estudo nas diversas áreas da 
ciência, em gráficos de dispersão, também está restrita à concentração da variabilidade 
disponível entre as primeiras variáveis. 
 A semelhança da análise de componentes principais, a técnica de análise canônica 
pode atender a vários propósitos, tais como: 
a) Examinar as correlações entre caracteres estudados; 
b) Resumir um conjunto de caracteres em outro de menor dimensão e de sentido 
interpretável; 
c) Avaliar a importância de cada caracter e promover a eliminação daqueles que com-
tribuem pouco, em termos de variação, no grupo de amostras em estudo; 
d) Construir índices que possibilitem o agrupamento de amostras ou populações; 
e) entre outros. 
 CAMUSSI et al. (1985) relata que as transformações para variáveis canônicas permi-
tem a visualização ótima de diferenças entre populações, pela redução de dimensões que 
preserve a maioria das informações biológicas. É um método de ordenação cujo objetivo é 
avaliar o grau de similaridade entre materiais experimentais, considerando tanto a matriz de 
variâncias e covariâncias residuais quanto a matriz de variâncias e covariâncias entre médias 
fenotípicas dos caracteres avaliados, ou seja, a análise só é empregada nas situações em que 
existem dados provenientes de delineamentos experimentais. 
 Esta técnica, diferentemente da análise de componentes principais, considera as 
possíveis diferenças na dispersão sobre as médias. Desta forma, esta técnica apresenta 
vantagem de manter o princípio da Análise de Agrupamento, utilizando a distância de 
Mahalanobis, qual seja a de considerar as correlações residuais existentesentre a média dos 
tratamentos. Também, esta técnica, possui estreita relação com a análise de função 
discriminante linear e com a distância de Mahalanobis. 
 Em resumo, a utilização de análise canônica tem por finalidade básica, a de propor-
cionar uma simplificação estrutural de dados, de modo que a diversidade influenciada a 
princípio por um conjunto p-dimensional ( p = no de caracteres considerados no estudo), possa 
ser avaliada por um complexo bi ou tridimensional de fácil interpretação geométrica. 
 Os princípios básicos dessa técnica são descritos por vários autores, tais como 
MARDIA et al. (1979); CHATFIELD e COLLINS (1986); JOHNSON e WICHERN (1988); 
CRUZ e REGAZZI (1994), entre outros. Segundo esses autores, devido normalmente as 
variáveis em estudo possuirem diferentes escalas, na utilização desse procedimento é comum 
a transformação das variáveis originais em variáveis padronizadas e não-correlacionadas, de 
modo que a matriz de dispersão residual se iguala a identidade. A transformação comumente 
utilizada tem sido o processo de condensação pivotal descrito por RAO (1952) e exempli-
ficado por SINGH e CHAUDHARG (1979), bem como por CRUZ e REGAZZI (1994). Após 
a transformação, o processo de estimação das variáveis canônicas equivale ao descrito para as 
componentes principais. 
 Semelhante à técnica de componentes principais, a análise canônica está se difundindo 
nas diversas áreas da ciência devido a disponibilidade de recursos computacionais e de 
“software” aplicados atualmente existentes. Entretanto, uma das grandes dificuldades ainda 
encontrada é a exigência de alguma experiência sobre análise multivariada. 
3.2. Obtenção das Variáveis Canônicas 
 A técnica de variáveis canônicas , à semelhança dos componentes principais, consiste 
em transformar o conjunto de “n” variáveis originais em um novo conjunto, as variáveis 
canônicas. 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 23 
 Seja Xij a média da j-ésima característica (j = 1,2,....,p) avaliada na i-ésima população 
ou amostra (i = 1,2,...,n), tal que as seguintes propriedades são verificadas: 
 
 a) Se Yj é uma variável canônica, então, Yj é uma combinação linear de X’s. 
 
 Yj = a1X1 + a2X2 + ... + apXp 
 
 b) Se Yj’ é uma outra variável canônica, então: 
 
 Yj’ = b1X1 + b2X2 + ... + bpXp 
 
 p p p p 
e ainda: ΣΣ ajaj’ σσσσ jj’ = ΣΣ bjbj’ σσσσ jj’ = 1 
 j=1 j’=1 j=1 j’=1 
 
 p p 
 ΣΣ ajbj σσσσ jj’ = 0 
 j=1 j’=1 
 
em que σσσσjj’ é a covariância residual entre as características j e j’. 
 
 c) Dentre todas as variáveis canônicas, Y1 apresenta a maior variância, Y2 a segunda 
maior e assim sucessivamente, ou seja: 
 
 σσσσ2222 (Y1) > σσσσ2 (Y2) > . . . > σσσσ2 (Yp) 
 
 A propriedade (b) garante a ponderação da influência das variâncias e covariâncias 
residuais sobre as estimativas dos coeficientes de cada característica, bem como a indepen-
dência entre estas variáveis. 
 Desta forma, fundamentalmente a técnica de variáveis canônicas à semelhança da 
técnica de componentes principais, consiste em transformar um conjunto de p variáveis X1, 
X2, . . . , Xp, pertencentes a n amostras ou populações em um novo conjunto de variáveis Y1, 
Y2, . . . , Yp, as quais sejam função linear das X’s e independentes entre si. Vale salientar que 
o número de variáveis canônicas obtidas (Y1, Y2, . . . , Yp) é igual ao número de variáveis 
originais. 
 Assim, segundo RAO (1952) e CRUZ e REGAZZI (1994), o problema estatístico 
consiste fundamentalmente em estimar os coeficientes de ponderação das características em 
cada variável canônica e as suas respectivas variâncias. Assim, segundo estes autores, estas 
estimativas podem ser obtidas pela solução do sistema: 
 
(T - λ jE) ααααj = φ 
 
em que a j-ésima variância é dada pelo autovalor de ordem correspondente, obtido pela 
solução de: 
 det [T - λ jE] = 0 
 
em que: 
 
αj = autovetor associado a cada estimativa dos autovalores de E-1 T, cujos elementos são os 
coeficientes de ponderação dos caracteres para estabelecimento das variáveis canônicas; 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 24 
λj = autovalores da matriz E-1 T; 
 T = matriz de covariâncias entre as médias das amostras ou populações avaliadas; e 
 E = matriz de covariâncias residuais. 
 
 As matrizes T e E são simétricas. Entretanto, o produto de ambas (E-1T) não é uma 
matriz simétrica. Assim, dada a complexidade de cálculo das raízes características de uma 
matriz assimétrica, tem sido recomendado a utilização de dados transformados através da 
condensação pivotal, conforme descrito por RAO (1952) e mais recentemente por CRUZ e 
REGAZZI (1994). Esta técnica consiste em justapor, à direita da matriz de dispersão que se 
está operando, a matriz-identidade. Posteriormente, transforma-se por operações nas linhas, os 
elementos de cada coluna, de tal forma que ela tenha 1 na linha diagonal e zeros abaixo da 
diagonal, ou seja, é obtida uma matriz triangular superior em um processo sistemática. Este 
processo tem a vantagem de proporcionar novas variáveis que apresentam covariâncias 
residuais nula e variâncias residuais igual a unidade. 
 Assim, as variâncias originais Xj são transformadas pelo processo de condensação 
pivotal, em variáveis padronizadas Zj, com matriz de variâncias e covariâncias em amostras 
ou populações igual a T* e a matriz de variâncias e covariâncias residuais igual à matriz 
identidade I . Desta forma, a determinação dos autovalores de T* é dada pela equação: 
 
 det (T* - λI) = 0 
 
Obtendo-se, assim, as variâncias das j-ésimas variáveis canônicas. Os autovetores da matriz 
T* correspondem aos da matriz E-1T, são obtidos pela solução da seguinte equação: 
 
 (T* - λ jI) αj = 0 
 
onde: 
 λj = a raiz característica que corresponde à variância da j-ésima variável canônica; 
 αj = vetor de coeficientes da j-ésima variável canônica, estabelecido com as 
 variáveis transformadas por condensação pivotal. 
 
 Desta forma, observa-se que o processo de estimação torna-se idêntico ao descrito 
para os componentes principais. 
 Uma vez estimados os coeficientes αj, os coeficientes aj, associados às variáveis 
originais, podem ser calculados por meio de: 
 
 [ a1 a2 . . . an ] = [ α1 α2 . . . αn ] V 
 
onde: V = matriz n x n de transformação, obtida pelo processo de condensação pivotal. 
 
 Além disso, segundo CRUZ e REGAZZI (1994) , dada as inferências serem feitas em 
relação às variáveis originais padronizadas, é necessário ainda eliminar os efeitos de escala de 
mensuração. Assim, os coeficientes aj’s são multiplicados pelo desvio padrão do erro 
experimental, de modo que: 
 
 ∂j xj = aj σj [Xj /σj-] 
 
Logo: ∂j = aj σj (σj = desvio padrão residual) 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 25 
3.3. Importância Relativa de uma Variável Canônica 
 A importância relativa de cada variável canônica (IRk), à semelhança de componentes 
principais, é também dada pela razão entre a variância por ela explicada e o total da variância 
disponível, ou seja, a proporção da variação total explicada pela k-ésima variável canônica é 
dada pela expressão: 
 
 λk 
 IRk = 
_______________________ k = 1, 2, ..... , p 
 λ1 + λ2 + . . . + λp 
 
ou ainda, a proporção da variação total explicada pelas primeiras k variáveis canônicas (PVk’s) 
é dada por: 
 
 λ1 + λ2 + . . . + λk 
 PVk’s = 
_______________________ k = 1, 2, ..... , p 
 λ1 + λ2 + . . . + λp 
 
 Assim, verifica-se que a proporção da variação total explicada pelas primeiras 
variáveis canônicas é uma medida da quantidade de informação retida pela redução de p para 
k dimensão. 
 Na maioria dos estudos, é desejável que a variância acumulada nas duas primeiras 
variáveis canônicas exceda 70-80%. Nesta condição, nos casos de estudo por meio das 
distâncias geométricas entre amostras ou populações em gráficos de dispersão, cujascoorde-
nadas são escores relativos às primeiras variáveis canônicas, as interferências são tidas 
satisfatórias. 
 Assim, embora p-variáveis canônicas sejam necessárias para reproduzir a variabilidade 
total do sistema, a viabilidade de utilização da referida técnica reside na possibilidade de 
resumir o conjunto de variáveis originais em poucas variáveis canônicas. Nestas condições, 
esta técnica proporcionará uma simplificação considerável nos cálculos estatísticos e na 
interpretação dos resultados com relação aos demais métodos alternativos, principalmente 
quando o número de variáveis avaliadas foram relativamente grande. 
3.4. Descarte de Variáveis 
 Nos casos em que o número de variáveis é muito grande, procura-se descartar aquelas 
de pouca relevância na discriminação do material avaliado, reduzindo, assim, mão-de-obra, 
tempo e custo despendido na análise e interpretação dos dados experimentais. 
 A semelhança do procedimento descrito em componentes principais sobre descarte de 
variáveis, a identificação de características de menor importância em certos estudos tem sido 
aquelas cujos coeficientes de ponderação, obtidos com a padronização das variáveis, são de 
maior magnitude, em valor absoluto, nas últimas variáveis canônicas. Assim, segundo 
recomendações de diversos autores (JOLLIFE, 1972/1973; MARDIA et al., 1979; CRUZ e 
REGAZZI, 1994), tem sido comum descartar a variável de maior coeficiente de ponderação 
(em valor absoluto) a partir da última variável canônica. Quando em uma variável canônica de 
menor variância o maior coeficiente de ponderação está associado a uma característica já 
previamente descartada, tem-se optado por não fazer nenhum outro descarte com base nos 
coeficientes daquela variável canônica, mas prosseguir a identificação da importância relativa 
das características na outra variável de variância imediatamente superior. 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 26 
 Uma das questões básicas nas diversas áreas da ciência diz respeito ao número e tipo 
de características a serem avaliadas. Não existem bases teóricas para determinar o número de 
características a serem medidas. Assim, tem sido relatado, no melhoramento vegetal, que os 
caracteres importantes para adaptação e seleção natural são mais apropriados e devem ser 
escolhidos para os estudos de divergências e agrupamento (ARUNACHALAM, 1981 e 
CRUZ e REGAZZI, 1994). ADAMS e WIERSMA (1978) acrescenta ainda que as carac-
terísticas a serem preservadas nesta análise deverão ser aquelas que representam a estrutura 
fundamental do sistema biológico que está sendo estudado, devendo ainda serem suficiente-
mente diversos para representar, no mínimo, as dimensões mais importantes do sistema. 
Assim, quando o número de características utilizadas num estudo torna-se elevado, é possível 
que muitas delas pouco contribuam para a discriminação das amostras ou populações avalia-
das, por serem relativamente invariantes entre estas ou por serem redundantes em virtude de 
serem altamente correlacionadas com outras características. Esta situação apresenta como 
conseqüência aumento no trabalho de caracterização, sem melhoria na precisão, além de 
tornar mais complexa a análise e interpretação dos dados. Portanto, a eliminação das caracte-
rísticas redundantes e de difícil mensuração torna-se desejável, afim de facilitar o estudo, 
reduzindo tempo e custo da experiência (Pereira, 1989, citado por Liberato, 1995). Desta for-
ma, a redução do número de características, com eliminação daqueles que menos contribuem 
para o estudo, deve facilitar as interpretações sem causar perda considerável de informações. 
 CRUZ e REGAZZI (1994) comentam que os caracteres dispensáveis em estudo de 
divergência genética são aqueles relativamente invariantes entre os indivíduos estudados, são 
fortemente afetados pelo ambiente, apresentam instabilidade com a mudanças ambiental ou 
são redundantes por estarem correlacionados com outros caracteres. Portanto, as variáveis 
selecionadas e descartadas devem apresentar correlações significativas entre si, ou seja, as 
variáveis descartadas devem ser redundantes (ser responsáveis pelo mesmo tipo de informa-
ções já contidas nas variáveis selecionadas).Por outro lado, as variáveis selecionadas devem 
ter baixas correlações entre si. De forma tal que cada variável preservada na análise será 
responsável por um tipo de informação biológica exclusiva e a ação conjunta das mesmas será 
complementar para a descrição geral dos indivíduos ou populações estudadas. 
 Em resumo ao se realizar o descarte de variáveis através da variável canônicas, 
conforme procedimento descrito, os comentários feitos anteriormente deverão ser conside-
rados, de forma tal que as características descartadas não proporcione perdas significativas 
nas interpretações e conclusões no estudo em questão. 
3.5. Análise de Variáveis Canônica e Análise de Agrupamento 
 Quando as primeiras variáveis canônicas explicam a maior parte da variação do siste-
ma em estudo, estas podem ser representadas graficamente e apresentar uma importante 
aplicação em conexão com a análise de agrupamento. Este procedimento é satisfatório quando 
as duas primeiras varáveis canônicas utilizadas como eixo do sistema cartesiano envolvem 
uma fração considerável da variação total, normalmente citada como acima de 70 a 80%. Nos 
casos em que este limite não é atingido, a análise é completada com a dispersão gráfica em 
relação a terceira e quarta variável canônicas. Com base nos escores das primeiras variáveis 
canônicas, estima-se a Distância Euclidiana Média que expressa uma medida alternativa entre 
aquela população ou amostras. 
 Assim, nos casos em que a dispersão gráfica não provê informações adequadas no 
estudo, CRUZ (1990) comenta que certos autores têm utilizado os escores dos primeiras 
variáveis canônicas para o cálculo da Distância Euclidiana Média, valendo-se, para esse fim, 
da propriedade de independência entre tais variáveis canônicas. Tal procedimento é utilizado 
como complementar as informações da dispersão gráfica. 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 27 
 CRUZ e REGAZZI (1994) comentam que a eficácia de tal procedimento depende do 
grau de distorção provoca nas distâncias entre amostras ou populações quando se passa do 
espaço n-dimensional para o n1-dimensional (n1 < n). Como as distâncias gráficas, em relação 
a eixos que representam as primeiras variáveis canônicas, são influenciadas pelas variações 
entre (variâncias e covariâncias entre as médias das amostras ou populações estudadas) e 
dentro (variâncias e covariâncias residuais), pode-se quantificar o grau de distorção destas 
distâncias comparando o seu total com o total das distâncias generalizadas de Mahalanobis, 
ou seja: 
 Grua de distorção = 1 - α 
 
onde: ∑ ∑ d2vcii’ 
 i < i’ 
 α = ________________ 
 . ∑ ∑ D2ii’ 
 i < i’ 
em que: 
 
d2vcii’ = quadrado da distância Euclidiana estimada a partir dos escores de n variáveis 
canônicas; 
D2ii’ = distância generalizada de Mahalanobis estimada a partir de n variáveis 
originais. 
 
APLICAÇÃO 4 
 Utilizando os mesmos dados da aplicação 3, ou seja, com base em dados de um teste 
de progênies de Eucalytus sp., em que foram avaliadas 10 características (X1, X2, X3, X4, X5, 
X6, X7, X8, X9 e X10) em 10 progênies, num delineamento em bloco ao acaso com quatro 
repetições, e seis plantas por parcela, realizou-se a análise por variáveis canônicas. Dado o 
volume de cálculos, utilizou-se do programa GENES (DBG/UFV) para realizações das 
operações envolvidas, sendo apresentado, portanto, só as tabelas com os resultados finais de 
cada etapa envolvida. 
 Assim, baseado na teoria descrita sobre variáveis canônicas, os autovalores (variân-
cias) e autovetores associados (coeficientes de ponderação) são apresentados no Quadro 9. 
Estes foram obtidos a partir de dados transformadosatravés de condensação pivotal. 
 Os resultados apresentam no Quadro 8 evidenciam que a primeira variável canônica 
(VC1) explica 68,7% da variação total disponível. As duas primeiras variáveis canônicas (VC1 
e VC2) explicam 83,3% e as três primeiras (VC1, VC2, VC3) explicam 92,6% da variância 
total disponível. Portanto, como as duas primeiras variáveis canônicas explicam mais de 80% 
da variação total disponível das variáveis Z’s, sua utilização na sumarização dos dados, em 
vários estudos, é considerada satisfatória. 
 Considerando as média do Quadro 8, estimam os escores associados às duas primeiras 
variáveis canônicas por meio da expressão. 
 
VC1 = 0,0487(5,69) - 0,0865(-0,59) + 0,0988(7,43) + 0,0591(-7,13) + … + 0,3888(6,95) = 23,6365 
 
VC2 = 0,4954(5,69) - 0,1757(-0,59) + … + 0,6877(6,95) = 1,2960 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 28 
Quadro 8 – Médias das Variáveis, Transformadas por Condensação Pivotal, para 10 
Progênies 
Variáveis 
Progênie 
Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 
1 5,69 -0,59 7,43 -7,13 -17,13 1,16 -10,40 2,87 10,29 6,35 
2 5,47 -0,93 8,05 -7,55 -17,12 1,09 -18,66 2,68 8,99 7,05 
3 5,96 -0,84 7,62 -7,40 -17,12 1,59 -18,60 3,99 10,04 8,27 
4 5,48 -0,87 7,81 -7,09 -16,66 1,02 -18,06 3,10 8,66 6,74 
5 5,19 -1,00 7,44 -7,72 -16,66 1,52 -18,25 2,75 8,66 6,41 
6 5,41 -0,19 7,76 -6,93 -17,45 1,07 -18,31 2,94 9,90 6,79 
7 5,08 -0,11 7,37 -7,39 -16,09 1,58 -17,44 3,01 7,35 5,71 
8 5,04 -0,61 7,47 -7,49 -16,69 1,09 -18,08 2,84 8,84 6,33 
9 6,15 -0,47 7,22 -7,42 -15,40 1,53 -17,32 3,21 7,40 6,51 
10 5,52 -0,34 7,02 -7,33 -16,50 1,32 -17,83 3,00 9,51 6,26 
 
 
 
Quadro 9 – Variáveis Canônicas Obtidas da Análise de Dez Variáveis (Z1, Z2, Z3, Z4, Z5, Z6, 
Z7, Z8, Z9 ,Z10) - Originadas da Transformação por Condensação Pivotal, das 
Variáveis Originais (X1, X2, X3, X4, X5, X6, X7, X8, X9 e X10) 
Variância Coeficiente de Ponderação Associado 
Variáveis 
Canônicas auto-
valor 
Acu-
mulada 
(%) 
Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 
VC1 1,7477 68,7 0,0487 -0,0865 0,0988 0,0591 -0,4088 -0,0676 -0,3099 0,0065 0,7069 0,3888 
VC2 0,3697 83,3 0,4954 -0,1757 0,0033 -0,0790 0,3139 0,1874 0,0272 0,2631 -0,2024 0,6877 
VC3 0,2382 92,6 0,2634 0,3811 -0,4890 0,1732 0,2574 0,1726 0,3660 0,1677 0,4776 -0,1727 
VC4 0,1061 96,8 0,1449 0,5081 0,3413 0,5572 -0,2964 -0,2550 0,1570 0,2101 -0,2301 0,1383 
VC5 0,0523 98,4 -0,4761 0,3747 -0,1082 -0,2151 -0,2695 0,6049 -0,0264 0,2489 -0,1220 0,2425 
VC6 0,0196 99,6 0,4639 0,5095 0,1028 -0,3860 -0,0788 0,1113 -0,2357 -0,5337 -0,0644 -0,0487 
VC7 0,0089 99,9 0,1916 -0,2412 0,4762 0,3337 0,0141 0,6793 0,0168 0,0660 1,1021 -0,3003 
VC8 0,0008 99,9 0,1161 0,0578 0,4613 -0,5689 -0,0198 -0,1457 0,2251 0,5295 0,1846 -0,2449 
VC9 0,0001 99,9 -0,1883 -0,0569 0,2067 -01091 -0,0343 -0,0031 0,5773 -0,4718 0,1172 0,3091 
VC10 0,00003 100,0 -0,3665 0,3056 0,3605 0,0869 0,7068 -0,0668 -0,2225 -0,0648 0,2066 0,1414 
 
 
 
Os demais escores são apresentados no Quadro 10. 
 A dispersão dos escores em relação às duas primeiras variáveis canônicas é 
apresentada na Figura 3. 
 
 
 
 
 
 
 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 29 
Quadro 10 – Escores de 10 Progênies, Obtidos a Partir das Duas Primeiras Variáveis 
Canônicas 
Progênies VC1 VC2 
1 23,6365 1,2960 
2 22,8450 1,5319 
3 24,0288 2,6736 
4 22,0968 1,6199 
5 22,1686 1,2667 
6 23,3911 0,9518 
7 20,1167 1,1482 
8 21,7708 1,0663 
9 20,2064 2,5528 
10 22,2647 1,1476 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 3 – Dispersão de 10 Progênies em relação às Duas Primeiras Variações Canônicas 
(VC1 e VC2). 
 
 
 A distância gráfica entre cada par de progênies na Figura 3 é dada pela distância 
Euclidiana: 
 
 dvci i’ = [(vci1-vci’1)
2 + (vci2 - vci’2)
2]½ 
 
cujas estimativas são encontradas no Quadro 11. Como ilustração, obtêm-se dvc1,2 por meio 
de: 
 
 dvc1,2 = [(23,6365 - 22,8450)
2 + (1,2960 - 1,5319)2]½ 
 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 30 
Quadro 11 – Dissimilaridade entre Progênies, Baseada nas Distâncias Euclidianas obtidas a 
Partir dos Escores das Duas Primeiras Variáveis Canônicas 
Progênies 2 3 4 5 6 7 8 9 10 
1 0,8259 1,4323 1,5734 1,4682 0,4227 3,5229 1,8798 3,6531 1,3798 
2 1,6446 0,7533 0,7266 0,7967 2,7551 1,1707 2,8292 0,6960 
3 2,2006 2,3323 1,8361 4,1989 2,7715 3,8243 2,3325 
4 0,3604 1,4566 2,0355 0,6424 2,1081 0,5012 
5 1,2624 2,0552 0,4454 2,3461 0,1530 
6 3,2802 1,6242 3,5645 1,1433 
7 1,6561 1,4074 2,1479 
8 2,1580 0,5005 
9 2,4922 
 
 
 Em estudos que utilizam a técnica de variável canônicas como meio de descartes de 
variáveis com a finalidade de redução de mão-de-obra, tempo e custo despendido na análise e 
interpretação dos dados experimentais, a importância relativa das características pode ser 
avaliada pela magnitude dos coeficientes de ponderação destas. Entretanto, como não existe 
relação direta entre variáveis transformadas Zj’s e as variáveis originais (Xj’s), é necessário, 
para a avaliação da importância relativa dos caracteres, a obtenção do vetor a (vetor de 
coeficiente de ponderação das variáveis transformadas), comforme descrito na teoria 
apresentada. Assim, no Quadro 12 são apresentadas as variáveis canônicas e os respectivos 
coeficientes de ponderação das variáveis originais. 
 
 
Quadro 12 – Variáveis Canônicas Estabelecidas pela Combinação Linear de 10 Variáveis 
Originais (X1, X2 , X3, X4, X5, X6, X7, X8, X9, e X10) 
Coeficiente de Ponderação (aj) associado Variáveis 
Canônicas X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 
VC1 3,63 -6,79 -2,11 3,20 1025,55 -1720,55 -71,60 -200,31 268,43 23,99 
VC2 -0,47 -2,90 0,27 -0,45 -22,75 778,67 -186,68 41,29 -44,44 42,45 
VC3 0,57 4,55 -1,97 1,06 138,56 334,52 532,50 -118,74 156,64 -10,66 
VC4 -0,83 4,09 -0,06 0,38 -293,88 336,65 61,25 58,46 -73,49 8,53 
VC5 -0,33 3,66 0,56 -0,30 -316,05 361,43 -31,80 28,87 -32,93 14,97 
VC6 0,13 3,54 1,01 -0,54 191,88 -155,46 -398,68 13,55 -23,72 -3,01 
VC7 -0,08 1,30 0,08 0,14 -212,60 279,69 126,83 -21,19 24,09 -18,54 
VC8 0,25 1,17 0,33 -0,29 -199,08 123,79 524,99 -38,83 54,18 -15,40 
VC9 -0,78 -0,04 -0,58 0,39 53,84 -111,18 159,82 -39,88 50,99 19,08 
VC10 -0,47 0,86 -0,35 0,21 540,54 -641,57 -162,72 -56,55 74,46 8,73 
 
 
 No entanto, como os coeficientes (elementares de autovetores) são influenciados pela 
escala de avaliação das progênies, tem sido recomendado a avaliação da importância relativa 
dos caracteres, a partir de coeficientes associados às variáveis padronizadas, ou seja: 
 
 ∂j = ajσj (σj= desvio-padrão residual) 
 
Esses coeficientes são apresentados no Quadro 13. 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 31 
Quadro 13 – Variáveis Canônicas Estabelecidas pela Combinação Linear de 10 Variáveis 
Padronizadas (X1, X2, X3, X4, X5, X6, X7, X8, X9 e X10) 
Coeficiente de Ponderação (∂j) Associado Variáveis 
Canônicas X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 
VC1 6,87 -1,22 -3,73 7,29 32,07 -41,76 -0,55 -28,15 30,66 1,57 
VC2 -0,89 -0,52 0,49 -1,04 -0,71 1,91 -1,43 5,80 -5,08 2,77 
VC3 1,08 0,82 -3,47 2,42 4,33 -8,12 4,07 -16,69 17,89 -0,70 
VC4 -1,58 0,74 -0,12 0,88 -9,19 8,90 0,47 8,22 -8,39 0,56 
VC5 -0,63 0,66 0,99 -0,70 -9,88 8,77 -8,24 4,06 -3,76 0,98 
VC6 0,25 0,64 1,78 -1,25 6,00 -3,77 -3,05 1,88 -2,71 -0,19 
VC7 -0,15 0,23 0,15 0,34 -6,65 6,79 0,97 -2,98 2,75 -1,21 
VC8 0,48 0,21 0,59 -0,66 -6,22 3,00 4,15 -5,46 6,19 -0,99 
VC9 -1,49 -0,01 -1,03 0,89 1,68 -2,69 1,22 -5,60 5,82 1,25 
VC10 -0,9 0,16 -0,62 0,48 16,90 -15,57 -1,25 -7,95 8,62 0,57 
 
 
 Pelos resultados apresentados, os caracteres de menor importância foram, em ordem 
de descarte, o X5, com o maior coeficiente de ponderação em VC10 (16,90); o X9, com o maior 
coeficientes de ponderação em VC9 (5,82); o X6, com o maior coeficiente de ponderação em 
VC7 (6,79). A evidência de que estes caracteres são de menor importância, pode ser dada com 
base na matriz de correlação entre variáveis (quadro 4). Assim, o descarte de X5 é 
compensada pela presença deX1, X7 e X10, as quais mantêm alta correlação. Quanto ao 
descarte de X6, este também é compensado pela presença de X1, X7 e X10. O caracter X9 é 
compensado, pelo mesmo motivo (alta correlação), pela presença de X8. Vale salientar que na 
VC8 não houve descarte de variável. Este fato deve-se aos argumentos citados anteriormente 
de que se em uma variável canônica de menor variância o maior coeficiente de ponderação 
está associado a um caracter já previamente descartado, tem-se optado por não fazer nenhum 
outro descarte com base nos coeficientes daquela variável canônica, mas prosseguir a 
identificação da importância relativa dos caracteres na outra variável canônica imediatamente 
superior. 
4. CORRELAÇÕES CANÔNICAS 
4.1. Introdução 
 É comum na pesquisa das várias áreas da ciência ocorrer a necessidade de investigar a 
relação existente entre dois (ou mais) conjuntos de várias distintas, mas associadas. Assim, 
por exemplo, nas situações em que o interesse é em estudar as interelações existentes entre a 
ocorrência de certas comunidades de plantas com relação a composição florística e, por outro 
lado, as características do solo ou outras características ambientais. Ou então, nos casos em 
que se interessa avaliar as relações, entre, por exemplo, caracteres de parte a aérea versus 
sistemas radicular, caracteres agronômicos versus fisiológicos, componentes primários versus 
componentes secundários da produção, caracteres silviculturas versus caracteres tecnológicos 
da madeira etc. 
 Esta técnica foi inicialmente descrita por HOTELLING (1935) . Posteriormente 
consolidada por RAO (1952); MARDIA et al. (1979), ARNOLD (1981), DUNTEMAN 
(1984), MANLY (1986), JOHNSON e WICHERN (1988), CRUZ e REGAZZI (1994), dentre 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 32 
outros. Segundo estes autores a aplicação geral e usual da análise de correlação canônicas 
consiste em identificar e quantificar as associações entre dois grupos de variáveis. 
 Segundo James e McCulloch (1990), citado por LIBERATO (1995), esta técnica é 
uma generalização da correlação e regressão que é aplicável quando os tributos de um único 
grupo de objetivos podem ser divididos naturalmente em dois conjuntos. Do ponto de vista 
geral, a análise de correlação canônica é uma extensão da regressão múltipla. A análise de 
correlações canônicas possui cestas propriedades similares às de análise de componentes 
principais, porém esta última considera as interelações dentro de um grupo de variáveis, 
enquanto aquela considera a relação entre dois grupos de variáveis (LIBERATO, 1995). 
 O método consiste basicamente em encontrar um vetor de coeficiente para cada um 
dos grupos de variáveis, tal que a correlação entre as duas combinação lineares seja máxima. 
Determina-se o primeiro par de combinação lineares que possuam a maior correlação entre 
todos os pares não-correlacionados com o par selecionado inicialmente, e assim sucessiva-
mente. As combinações lineares são denominadas variáveis canônicas e suas correlações, 
correlações canônicas. O número de correlações canônicas é igual à dimensão do menor 
grupo de variáveis. 
 Esta metodologia é usualmente utilizada com variáveis do tipo quantitativa contínua, 
sendo necessário assumir a existência de normalidade multi-variada quando testes de signi-
ficância estatísticos são requeridos. Entretanto, segundo MARDIA et al. (1979), a análise 
também pode ser empregada quando há uma mistura de variáveis quantitativa contínuas e 
qualitativas, ou se todas as variáveis são qualitativas, conforme citado por DUNTEMAN 
(1984). Porém, o procedimento tem sido mais utilizado e recomendado quando os dados são 
originados de variáveis quantitativas. 
4.2. Obtenção das Correlações Canônicas e dos Pares Canônicos 
 Seja o primeiro conjunto de variáveis estabelecidos por p caracteres (X1, X2, …, Xp) e 
as inerentes ao segundo por q caracteres (Y1,Y2, … ,Yq). Vale salientar que a análise de 
correlações canônicas caracteriza-se por avaliar relações entre dois complexos influenciados, 
no mínimo, por dois caracteres. O número de correlações canônicas a serem obtidas é igual ao 
menor número de caracteres que constitui um dos complexos (p ou q), e sua magnitude 
sempre decresce com a ordem em que são estimados, 
 
Seja: 
 
X’ = [X1, X2 … Xp] = vetor das medidas de p caracteres que constituem o grupo I 
 
Y’ = [Y1, Y2 … Yp] = vetor das medidas de q caracteres que constituem o grupo II 
 
 
 Assim, segundo CRUZ e RAGAZZI (1994), o problema estatístico consiste em esti-
mar a máxima correlação entre as combinações lineares de caracteres do grupo I e do grupo 
II, bem como estimar os respectivos coeficientes de ponderação dos caracteres em cada 
combinação linear. Sendo X1 e Y1 uma das combinações lineares dos caracteres dos grupos I 
e II, respectivamente, tem-se; 
 
 X1 = a1X1 + a2X2 + … + apXp 
e 
 Y1 = b1Y1 + b2Y2+ … + bpYp 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 33 
onde: 
 a’ = [a1 a2 … ap] = vetor 1 x p de pesos dos caracteres do grupo I 
e 
 b’= [b1 b2 … bp] = vetor 1 x q de pesos dos caracteres do grupo II 
 
 Por definição, a primeira correlação canônica é aquela que maximiza a relação entre 
X1 e Y1. As funções X1 e Y1 constituem o primeiro par canônico associado àquela correlação 
canônica, que é expressa por: 
 
 Côv (X1,Y1) 
 r1 = _______________________ 
 ∧ ∧ 
 [V(X1).V(Y1)]½ 
 
sendo: 
 
 Côv (X1,Y1) = a’S12 b 
 ∧ 
 V(X1) = a’S11 a 
 ∧ 
 V(Y1) = b’S22 b 
 
em que: 
 
 S11 = matriz p X q de covariâncias entre os caracteres do grupo I 
 S22 = matriz p X q de covariâncias entre os caracteres do grupo II 
 S12 = matriz p X q de covariâncias entre os caracteres dos grupos I e II 
 
 Nos casos em que se utilizam variáveis padronizadas, têm-se S11 = R11, S22= R22 e S12 
= R12, em que R representa uma matriz de correlações. 
 
 Segundo Morrisom (1976), citado por CRUZ e REGAZZI (1994), a estimação dos 
vetores a e b é obtida pela maximização da função r2, sujeita à restrição de que 
a’S11 a = b’S22 b = 1. Estas restrições são necessárias para prover estimadores únicos de a e b, 
e indicam que cada combinação linear tem variância igual a 1. 
 Assim, o problema estatístico passa a ser estimar a e b tal que utilizando-se dos 
multiplicadores de Lagrange (λ e δ) e das restrições descritas, estes são obtidos pela solução 
das seguintes equações: 
 
 (R-122 R’12 R
-1
11R12 - λI) b = Φ 
e 
 (R-111 R12 R
-1
22 R’12 - λI) a = Φ 
 
Assim:, têm-se 
 
a) Primeira correção canônica (r1 ) entre a combinação linear dos caracteres dos 
grupos I e II é dada por: 
 
 r1 = [λ1]½ 
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza 
 
 34 
em que λ1 é o maior autovalor da matriz (R-111 R12 R-122 R’12) 
 
b) O primeiro par canônico é dado por X1= a’X e Y1=b’Y, em que: a = autovetor 
associado ao primeiro autovalor de (R-111 R12 R
-1
22 R’12), ou de maneira equivalente: 
b = (R-122 R’12 a), omitindo-se nesta expressão o escalar (a’R12 b)/δ. 
 
c) As demais correlações canônicas e os pares canônicos são estimados utilizando-se 
os autovalores e os autovetores das expressões descritas, de ordem correspondente à 
p ou q-ésima correlação estimada. 
 
 
 CRUZ e REGAZZI (1994) comentam que muitas vezes a obtenção destes autovalores 
requerem o uso de certas artifícios, pois alguns aplicativos computacionais são específicos 
para o cálculo de autovalores de matrizes simétricas. Assim, neste caso, usam-se os seguintes 
fatos: 
a) Se G é uma matriz real e simétrica, então existe F, tal que G = FF’, em que F é 
obtida por meio do produto: (C’)-1D½. As matrizes C’e D são, por sua vez, obtidas 
por operações de congruência em G e elementares em I justaposta a G. 
 
 Esquematicamente, tem-se: 
 
 [G : I] ~ … ~ [D : C’] 
 
em que: 
 
~ : significa operações de congruência em G e elementares em I; 
I : matriz identidade; 
D : matriz diagonal; 
C : matriz tal que C’G C = D

Continue navegando