Buscar

Análise multivariada de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

1. 
A análise multivariada de dados pode ser dividida em dois grupos de técnicas, as técnicas de dependência e as de interdependência. 
Considerando esses dois grupos de técnicas, qual das alternativas a seguir conceitua corretamente as técnicas de dependência?
B. 
Quando uma variável ou conjunto de variáveis for identificado como a variável dependente a ser prevista ou explicada por outras variáveis conhecidas como variáveis independentes.
As técnicas de dependência são alimentadas com dados de entrada, especificando quais variáveis são independentes e quais são dependentes. As dependentes são aquelas estudadas a respeito do quanto elas afetam as independentes, e as independentes são as técnicas cujo modelo tentará prever ou explicar. Quando uma ou mais variáveis não podem ser consideradas dependentes ou independentes, são usadas as técnicas de interdependência. Além disso, todas as técnicas são independentes entre si.
2. 
As técnicas de dependência buscam estabelecer um relacionamento de causa e efeito. Entre elas, existem as técnicas de regressão múltiplas e a técnica de correlação canônica.
Qual a principal diferença entre essas duas técnicas?
E. 
A análise de regressão múltipla envolve uma única variável dependente métrica e várias variáveis independentes métricas, enquanto a correlação canônica envolve simultaneamente diversas variáveis dependentes métricas e diversas variáveis independentes métricas.
A análise de correlação canônica pode ser vista como uma extensão lógica da análise de regressão múltipla. A análise de regressão múltipla envolve uma única variável dependente métrica e várias variáveis independentes métricas. Com a análise canônica, o objetivo é correlacionar simultaneamente diversas variáveis dependentes métricas e diversas variáveis independentes métricas, sendo que ambas trabalham apenas com variáveis métricas.
3. 
As técnicas de análise multivariada ganharam muita evidência por permitirem que organizações criem conhecimento, melhorando, com isso, suas tomadas de decisão. 
Qual das seguintes alternativas conceitua corretamente uma análise multivariada de dados?
C. 
É um conjunto de modelos estatísticos que examina padrões em dados multidimensionais, considerando, ao mesmo tempo, diversas variáveis ​​de dados. 
A análise multivariada se refere a todas as técnicas estatísticas que simultaneamente analisam múltiplas medidas sobre indivíduos ou objetos sob investigação. Assim, qualquer análise simultânea de mais de duas variáveis pode ser considerada, a princípio, como multivariada. Além disso, elas trabalham tanto com variáveis métricas quanto com não métricas. Dessa forma, as demais definições estão incorretas.
4. 
Análises multivariadas são conceituadas de modo a efetuar uma aplicação bem-sucedida.
Sobre esses conceitos, marque a resposta correta quanto ao que cada um faz:
C. 
Existem dois conceitos em destaque: o conceito de variável estatística e o de escalas de medidas. Sobre o primeiro, as variáveis estatísticas combinam os dados de maneira linear, enquanto as escalas de medida, outro conceito muito utilizado, são responsáveis por medir as variáveis dependentes e independentes.
Os dois conceitos amplamente utilizados são as variáveis estatísticas e as escalas de medida. Em resumo, variável estatística trata da combinação linear entre as variáveis ou de qual o grau de relação entre elas. Já as escalas de medida cuidam da variação que um determinado dado tem sobre o restante dos dados.
5. 
Sabe-se que a visualização dos dados, dependendo da perspectiva, pode mostrar uma relação mais fiel aos dados lidos. 
Sobre a correlação de todos os atributos de uma base, qual o melhor tipo de representação dessa correlação?
B. 
A forma de representação denominada heatmap apresenta a correlação numérica entre os atributos da base.
Correlação dos atributos significa que os atributos serão confrontados entre si para que sejam dadas as devidas relações a cada variável da base. Logo, a forma de representação denominada heatmap apresenta a correlação entre os atributos da base.