A maior rede de estudos do Brasil

Grátis
18 pág.
aula_01

Pré-visualização | Página 2 de 3

MUL-
TIVARIADO PARA AUXILIAR REGULADORES DE SEGUROS A IDEN-
TIFICAR O RISCO DE SEGURADORAS POTENCIALMENTE INSOL-
VENTES. USANDO O MODELO, UMA COMPANHIA SEGURADORA
PODERIA SER CLASSIFICADA COMO SOLVENTE OU EM RISCO DE
INSOLVEˆNCIA E PASSOS REMEDIADORES PODERIAM ENTA˜O SER
TOMADOS PARA PREVENIR A FALEˆNCIA DA FIRMA EM SITUA-
C¸A˜O DE RISCO.
⇒ AQUI O OBJETIVO FOI OBTER UMA REGRA DE CLASSIFICAC¸A˜O PARA
DISTINGUIR FIRMAS SOLVENTES DE FIRMAS COM RISCO DE INSOLVEˆN-
CIA.
7
Ana´lise Estat´ıstica Multivariada
(N2) EXECUTIVOS DE ALTOS NEGO´CIOS SA˜O TOMADORES DE RISCO
- SEU SUCESSO DEPENDE DE QUA˜O BEM ELES LIDAM COM O
RISCO. MEDIDAS DE PROPENSA˜O AO RISCO FORAM RELACIO-
NADAS A MEDIDAS DE CARACTER´ISTICAS SO´CIO-ECONOMICAS
PARA UMA GRANDE AMOSTRA DE TAIS EXECUTIVOS. TOMADO-
RES DE RISCO PUDERAM SER DIFERENCIADOS DE EXECUTIVOS
AVESSOS AO RISCO:
MAIS BEM SUCEDIDO, MAIS PROPENSO AO RISCO;
MAIS EXPERIENTE, MAIS AVESSO AO RISCO.
OS RESULTADOS FORAM USADOS PARA CONSTRUIR TEORIAS COM-
PORTAMENTAIS SOBRE OS TOMADORES DE RISCO E MELHORAR MO-
DELOS PREDITIVOS DE PERFORMANCE.
⇒ NESSE CASO, O OBJETIVO FOI ANALISAR AS RELAC¸O˜ES ENTRE PRO-
PENSA˜O AO RISCO E CARACTER´ISTICAS SO´CIO-ECONOMICAS USANDO
UM CONJUNTO DE FATORES DE RISCO E UM CONJUNTO, INDEPEN-
DENTE, DE FATORES SO´CIO-ECONOMICOS.
A´REA: EDUCAC¸A˜O
(E1) ESCORES DE TESTES DE APTIDA˜O ESCOLAR E A PERFORMANCE
ACADEˆMICA NO ENSINO ME´DIO SA˜O FREQUENTEMENTE USA-
DOS COMO INDICADORES DA PERFORMANCE ACADEˆMICA NA
UNIVERSIDADE. MEDIDAS SOBRE 5 VARIA´VEIS E APTIDA˜O ESCO-
LAR E PERFORMANCE NO SEGUNDO GRAU (APTIDA˜O VERBAL E
QUANTITATIVA, ME´DIAS AO FINAL DO PRIMEIRO E SEGUNDO
ANOS E NU´MERO DE ATIVIDADES EXTRA-CURRICULARES) E 4
CRITE´RIOS DE PERFORMANCE NA UNIVERSIDADE (GRAUS EM
4 DISCIPLINAS CHAVES) FORAM USADOS PARA DETERMINAR A
ASSOCIAC¸A˜O ENTRE AS VARIA´VEIS EXPLICATIVAS E OS CRITE´-
RIOS DE PERFORMANCE.
⇒ AQUI O OBJETIVO FOI DE PREVISA˜O DA PERFORMANCE NA UNIVER-
SIDADE BASEADO NUM CONJUNTO DE VARIA´VEIS EXPLICATIVAS. ESTE
OBJETIVO PODE SER ESTENDIDO PARA A GERAC¸A˜O DE UMA REGRA DE
CLASSFICAC¸A˜O DOS ESTUDANTES COMO APTOS OU NA˜O AO SUCESSO
NA UNIVERSIDADE.
8
Ana´lise Estat´ıstica Multivariada
A´REA: ESTUDOS AMBIENTAIS
(EA1) AS CONCENTRAC¸O˜ES ATMOSFE´RICAS DE POLUENTES NO AR
EM LOS ANGELES FORAM EXTENSIVAMENTE ESTUDADAS. EM
UM ESTUDO, MEDIDAS DIA´RIAS SOBRE SETE VARIA´VEIS RELA-
CIONADAS A` POLUIC¸A˜O NO AR FORAM REGISTRADAS SOBRE
UM PER´IODO EXTENSO DE TEMPO. UM INTERESSE IMEDIATO
FOI VERIFICAR SE OS N´IVEIS DE POLUIC¸A˜O ERAM GROSSEIRA-
MENTE CONSTANTES POR TODA A SEMANA OU SE HAVIA AL-
GUMA DIFERENC¸A ENTRE DIAS U´TEIS E FINAIS DE SEMANA.
UM OUTRO OBJETIVO FOI VERIFICAR SE A MASSA DE DADOS
DISPON´IVEL PODERIA SER SUMARIZADA DE FORMA A SER FA-
CILMENTE INTERPRETA´VEL.
⇒ AQUI OS OBJETIVOS FORAM TESTAR HIPO´TESES E REDUC¸A˜O DE
DADOS.
⇒ OUTRAS A´REAS POTENCIAIS DE APLICAC¸A˜O DE ME´TODOS MUL-
TIVARIADOS: BIOLOGIA, METEOROLOGIA, GEOLOGIA, PSICOLOGIA, ES-
PORTES, ETC. PARA MAIORES DETALHES VER O CAP´ITULO 1 DE JOHN-
SON E WICHERN (1992).
⇒ OS EXEMPLOS APRESENTADOS FORNECEM VISLUMBRES DO USO DE
ME´TODOS MULTIVARIADOS EM A´REAS BEM DIVERSIFICADAS. APESAR
DE CONFIGURAC¸O˜ES DIFERENTES, MUITOS DOS PROBLEMAS APRE-
SENTADOS SA˜O SIMILARES. A ANA´LISE MULTIVARIADA, COMO QUAL-
QUER COLEC¸A˜O DE TE´CNICAS ESTAT´ISTICAS, NA˜O ESTA´ RESTRITA A
UMA PARTICULAR A´REA DE CONHECIMENTO.
⇒ DESENVOLVIMENTOS RECENTES EM ANA´LISE MULTIVARIADA SA˜O
RELACIONADOS A` MINERAC¸A˜O DE DADOS (DATA MINING) A QUAL ESTA´
VOLTADA PARA A EXTRAC¸A˜O DE INFORMAC¸A˜O DE CONJUNTOS DE DA-
DOS MUITO GRANDES.
9
Ana´lise Estat´ıstica Multivariada
ORGANIZAC¸A˜O DE DADOS
⇒ A MATE´RIA PRIMA A SER TRABALHADA AQUI E´ UM CONJUNTO DE
DADOS MULTIVARIADOS, ISTO E´, VA´RIAS VARIA´VEIS SA˜O OBSERVADAS
SOBRE DIVERSOS INDIV´IDUOS OU OBJETOS. NOSSO OBJETIVO SERA´
APRESENTAR UMA FORMA CONVENIENTE DE ORGANIZAR ESTES DA-
DOS E DE REPRESENTA´-LOS GRAFICAMENTE.
⇒ SUPONHA QUE ESTEJAMOS DIANTE DE UM PROBLEMA EM QUE p VA-
RIA´VEIS FORAM OBSERVADAS PARA UMA AMOSTRA DE n ELEMENTOS.
ASSIM, A OBSERVAC¸A˜O PARA O i-E´SIMO ELEMENTO DA AMOSTRA SERA´
UM VETOR p-VARIADO DENOTADO POR x.i TAL QUE
xT.i = (x1i, x2i, ..., xpi), i = 1, ..., n
EM QUE xji REPRESENTA A j-E´SIMA OBSERVAC¸A˜O DO i-E´SIMO ELE-
MENTO DA AMOSTRA, j = 1, ..., p.
⇒ A COLEC¸A˜O DE DADOS OBSERVADOS PODE SER REPRESENTADA POR
MEIO DE UMA MATRIZ X DE DIMENSA˜O p× n COMO SEGUE
X =

x11 x12 ... x1n
x21 x22 ... x2n
...
...
...
...
xp1 xp2 ... xpn

Organizac¸a˜o de dados
10
Ana´lise Estat´ıstica Multivariada
ASSIM, AS LINHAS DA MATRIZ X REPRESENTAM AS p VARIA´VEIS MEDI-
DAS E, AS COLUNAS, AS n UNIDADES AMOSTRAIS.
PODEMOS REPRESENTAR A MATRIZ X ATRAVE´S DE SUAS LINHAS
X =

xT1.
xT2.
...
xTp.

com xTj. = (xj1, xj2, ...xjn) as n observac¸o˜es da j-e´sima varia´vel, j = 1, ..., p.
TAMBE´M PODEMOS REPRESENTAR A MATRIZ X ATRAVE´S DE SUAS
COLUNAS. ADOTANDO AQUI A NOTAC¸A˜O x.i, i = 1, ..., n PARA DESIGNAR
A i-E´SIMA COLUNA DE X, TEMOS
X = [x.1 ... x.n ]
EM QUE CADA x.i E´ UM VETOR p× 1, i = 1, ..., n.
EXEMPLO 1:
UMA SELEC¸A˜O DE 4 NOTAS FISCAIS DE UMA LIVRARIA UNIVER-
SITA´RIA FOI OBTIDA DE MODO A INVESTIGAR A NATUREZA DAS VEN-
DAS. CADA NOTA FORNECEU O NU´MERO DE LIVROS VENDIDOS E O
VALOR TOTAL DA VENDA (EM DO´LARES). OBTEVE-SE A SEGUINTE MA-
TRIZ DE DADOS, NA QUAL A PRIMEIRA LINHA INDICA O NU´MERO DE
LIVROS VENDIDOS E, A SEGUNDA, O VALOR DA VENDA.
X =
[
4 5 4 3
42 52 48 58
]
⇒ A REPRESENTAC¸A˜O DOS DADOS DESTA FORMA PERMITE O CA´LCULO
DE QUANTIDADES NUME´RICAS DE INTERESSE DE FORMA EFICIENTE E
FA´CIL.
Organizac¸a˜o de dados
11
Ana´lise Estat´ıstica Multivariada
ESTAT´ISTICAS DESCRITIVAS
(1) A ME´DIA AMOSTRAL PARA A j-E´SIMA VARIA´VEL OBSERVADA
PODE SER REPRESENTADA COMO
x¯j. =
1
n
n∑
i=1
xji, j = 1, ..., p
ASSIM, PODEMOS DEFINIR O VETOR DE ME´DIAS AMOSTRAL x¯ COMO x¯1....
x¯p.

⇒ ALGEBRICAMENTE,
x¯ =
1
n
X1
EM QUE 1 REPRESENTA UM VETOR n×1 CUJOS ELEMENTOS SA˜O TODOS
IGUAIS A 1.
(2) UMA MEDIDA DE DISPERSA˜O PARA A j-E´SIMA VARIA´VEL E´ DADA
PELA VARIAˆNCIA AMOSTRAL
sjj =
1
n− 1
n∑
i=1
(xji − x¯j.)2, j = 1, ..., p
Organizac¸a˜o de dados
12
Ana´lise Estat´ıstica Multivariada
⇒ OBSERVE QUE COMO HA´ p VARIA´VEIS TAMBE´M FAZ SENTIDO ES-
TUDAR A VARIABILIDADE ENTRE PARES DE VARIA´VEIS DADA PELA CO-
VARIAˆNCIA AMOSTRAL.
A COVARIAˆNCIA AMOSTRAL ENTRE A j-E´SIMA E A r-E´SIMA VARIA´VEL E´
DADA POR
sjr =
1
n− 1
n∑
i=1
(xji − x¯j.)(xri − x¯r.), j, r = 1, ..., p j 6= r
PODEMOS ENTA˜O REPRESENTAR DE FORMA ORGANIZADA AS INFOR-
MAC¸O˜ES SOBRE VARIABILIDADE ATRAVE´S DE UMA MATRIZ CHAMADA
MATRIZ DE VARIAˆNCIA-COVARIAˆNCIA DADA POR
S =

s11 s12 ... s1p
s21 s22 ... s2p
...
...
...
...
sp1 sp2 ... spp

⇒ OBSERVE QUA A MATRIZ DE VARIAˆNCIA-COVARIAˆNCIA E´ UMA
MATRIZ SIME´TRICA TAL QUE ST = S.
ALGEBRICAMENTE, PODEMOS ESCREVER A MATRIZ DE DADOS COR-
RIGIDA PELA ME´DIA NA FORMA
X − x¯1T
E, A MATRIZ DE VARIAˆNCIA-COVARIAˆNCIA, NA FORMA
S =
1
n− 1
(
X − x¯1T ) (X − x¯1T )T
Organizac¸a˜o de dados
13
⇒ PODEMOS TAMBE´M DEFINIR A MATRIZ DE CORRELAC¸A˜O AMOSTRAL
R CUJOS ELEMENTOS rjk SA˜O DADOS POR rjk =
sjk√
sjjskk
,.
R =

1 r12 ... r1p
r21 1 ... r2p
...
...
...
...
rp1 rp2 ... 1

⇒ OBSERVE QUA A MATRIZ DE CORRELAC¸A˜O E´ TAMBE´M UMA MATRIZ
SIME´TRICA TAL QUE RT = R.
ALGEBRICAMENTE, A MATRIZ DE CORRELAc¸A˜O PODE SER ESCRITA NA
FORMA
R =
1
n− 1
[
∆−1/2
(
X − x¯1T )] [∆−1/2 (X − x¯1T ))]T
COM
∆−1/2 = diag{s−1/211 , s−1/222 , ..., s−1/2pp }
MATRIZ DIAGONAL DE ORDEM p POR p.
OBSERVE QUE PODEMOS RELACIONAR ALGEBRICAMENTE AS MA-
TRIZES S E R TAL QUE
S = ∆1/2R∆1/2 R = ∆−1/2S∆−1/2
COM
∆1/2 = diag{s1/211 , s1/222 , ..., s1/2pp }.
Organizac¸a˜o de dados
14
Ana´lise Estat´ıstica Multivariada
⇒ EM MUITAS APLICAC¸O˜ES AS SOMAS DOS DESVIOS QUADRADOS DA
ME´DIA E DOS PRODUTOS CRUZADOS DE TAIS DESVIOS SA˜O UTILIZA-
DAS. ADOTAREMOS AQUI A NOTAC¸A˜O:
Wjj =
n∑
i=1
(xij − x¯j)2, j = 1, ..., p
Wjr =
n∑
i=1
(xij − x¯j)(xir − x¯r), j, r = 1, ..., p j 6= p
ASSIM DEFINIMOS

Crie agora seu perfil grátis para visualizar sem restrições.