A maior rede de estudos do Brasil

Grátis
18 pág.
aula_01

Pré-visualização | Página 3 de 3

A MATRIZ W DE SOMAS DOS DESVIOS QUADRADOS
DA ME´DIA E PRODUTOS CRUZADOS DOS DESVIOS DA ME´DIA
W =
W11 W12 ... W1p... ... ... ...
Wp1 Wp2 ... Wpp
 = (X − x¯1T ) (X − x¯1T )T
EXEMPLO 1: (CONTINUAC¸A˜O) DETERMINE O VETOR DE ME´DIAS E AS
MATRIZES S E R PARA OS DADOS DO EXEMPLO 1 USANDO O R.
Organizac¸a˜o de dados
15
1) Definindo as dimenso˜es:
p=2
n=4
2) Entrando com os valores da matriz X :
X = matrix(0, p, n)
X[1, ] = c(4, 5, 4, 3)
X[2, ] = c(42, 52, 48, 58)
3) Definindo o vetor unita´rio 1:
vet1=matrix(1,n,1)
4) Calculando o vetor de me´dias:
vetmedia = (X% ∗%vet1)/n
5) Calculando da matriz Delta1/2:
deltameio=matrix(0,2,2)
deltameio[1,1]=sqrt(var(X[1,]))
deltameio[2,2]=sqrt(var(X[2,]))
6) Calculando a matriz de dados corrigida pela me´dia (XC)
XC=X-vetmedia%*%t(vet1)
7) Calculando a matriz de somas de quadrados e produtos cruzados corrigida
pela me´dia
W=XC%*%t(XC)
8) Calculando a matriz de Variaˆncia:
S=W/(n-1)
9) Invertendo a matriz deltameio:
Ideltameio-solve(deltameio)
10) Calculando a matriz de correlac¸a˜o:
R=Ideltameio%S%*%Ideltameio
vetmedia: 4 50
S: 0.67 -2.00 -2.00 45.33
R: 1.000 -0.364 -0.364 1.000
Usando as func¸o˜es do R:
mean(X[1,]), mean(X[2,])
var(t(X))
cor(t(X))
Organizac¸a˜o de dados
16
Ana´lise Estat´ıstica Multivariada
REPRESENTAC¸A˜O GRA´FICA
⇒ EMBORA NA˜O SEJA POSS´IVEL REPRESENTAR SIMULTANEAMENTE
MAIS DE TREˆS VARIA´VEIS EM UM GRA´FICO BIDIMENSIONAL, PODEMOS
UTILIZAR GRA´FICOS DE DISPERSA˜O PARA AS VARIA´VEIS INDIVIDUAIS
(DIAGRAMA DE PONTOS) E DUAS A DUAS (DIAGRAMA DE DISPERSO).
TAIS GRA´FICOS PODEM SER BASTANTE INFORMATIVOS.
A MAIOR PARTE DAS TE´CNICAS MULTIVARIADAS BASEIA-SE NO SIM-
PLES CONCEITO DE DISTAˆNCIA.
⇒ ESTAMOS HABITUADOS A DISTAˆNCIA USUAL CHAMADA DISTAˆNCIA
EUCLIDEANA, TAL QUE SE P (x1, x2, ..., xp) e Q(y1, y2, ..., yp) SA˜O DOIS PON-
TOS EM <p, A DISTAˆNCIA ENTRE P E Q E´ DADA POR
d(P,Q) =
√
(x1 − y1)2 + (x2 − y2)2 + ...+ (xp − yp)2
⇒ PORE´M, A DISTAˆNCIA EUCLIDEANA PODE NA˜O SER ADEQUADA EM
MUITOS PROBLEMAS, DEPENDENDO DA NATUREZA DAS VARIA´VEIS EN-
VOLVIDAS.
⇒ ISTO OCORRE DEVIDO AO FATO DE QUE NA DISTAˆNCIA EUCLIDEANA
CADA COORDENADA CONTRIBUI IGUALMENTE PARA O CA´LCULO DA
MESMA. QUANDO AS COORDENADAS REPRESENTAM MEDIC¸O˜ES QUE
SA˜O SUJEITAS A` FLUTUAC¸O˜ES ALEATO´RIAS DE MAGNITUDES DIFEREN-
TES, E´ FREQUENTEMENTE DESEJA´VEL PONDERAR COORDENADAS SU-
JEITAS A` MAIOR VARIABILIDADE COM UM PESO MENOR DO QUE A`QUE-
LAS SUJEITAS A UMA MENOR VARIABILIDADE.
⇒ ISTO SUGERE UMA NOVA MEDIDA DE DISTAˆNCIA.
Distaˆncia
17
Ana´lise Estat´ıstica Multivariada
⇒ DESEJA-SE QUE ESTA NOVA MEDIDA DE DISTAˆNCIA LEVE EM CONTA
AS DIFERENC¸AS EM VARIABILIDADE ENTRE AS DIVERSAS VARIA´VEIS
INCLU´IDAS NA ANA´LISE E, TAMBE´M, A PRESENC¸A DE CORRELAC¸A˜O
ENTRE OS PARES DE VARIA´VEIS. ESTE SERA´ O TIPO DE DISTAˆNCIA
FUNDAMENTAL EM ANA´LISE MULTIVARIADA.
⇒ SUPONHA PRIMEIRO UM CONJUNTO DE p VARIA´VEIS NA˜O CORRELA-
CIONADAS, COM VARIAˆNCIAS DISTINTAS. ASSIM, DE FORMA A EQUI-
LIBRAR A CONTRIBUIC¸A˜O DAS DIVERSAS VARIA´VEIS AO CA´LCULO DA
DISTAˆNCIA PODEMOS PONDERA´-LAS DE FORMA INVERSAMENTE PRO-
PORCIONAL AOS SEUS DESVIOS-PADRA˜O DEFININDO x∗j =
xj√
sjj
E AGORA,
CALCULANDO A DISTAˆNCIA “EUCLIDEANA” ENTRE ESTAS VARIA´VEIS
TRANSFORMADAS.
de(P,Q) =
√
(x− y)′D−1(x− y)
EM QUE D E´ A MATRIZ DIAGONAL CUJOS ELEMENTOS SA˜O s11, ..., spp,
x′ = (x1, ..., xp) E y′ = (y1, ..., yp).
⇒ UMA MEDIDA DE DISTAˆNCIA QUE TAMBE´M LEVA EM CONTA AS CO-
VARIAˆNCIAS ENTRE AS VARIA´VEIS E´ DADA POR
de(P,Q) =
√
(x− y)′S−1(x− y)
EM QUE S E´ MATRIZ DE VARIAˆNCIA-COVARIAˆNCIA.
Exerc´ıcios sugeridos do Cap´ıtulo 1: 1 a 7, 14 a 18.
Distaˆncia
18

Crie agora seu perfil grátis para visualizar sem restrições.