Buscar

3 - Análise multivariada e modelos de regressão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

1) 
 
• As afirmações 1 e 2 estão corretas check CORRETO 
• Apenas a afirmação 1 está correta 
• Apenas a afirmação 3 está correta. 
• Apenas a afirmação 2 está correta 
• Todas as afirmações estão corretas. 
 
Resolução comentada: 
 
 
 
2) Leia e associe as duas colunas conforme os seus respectivos significados. 
 
 
 
• I – A; II – C; III – B. 
• I – A; II – B; III – C. 
• I – B; II – C; III – A. 
• I – C; II – B; III – A. check CORRETO 
• I – B; II – A; III – C. 
 
 
Resolução comentada: 
O R representa o coeficiente de correlação. Esse resultado indicará a força de 
associação entre quaisquer duas variáveis métricas. Já o R² representará o 
coeficiente de determinação. Esse resultado indicará ao pesquisador a 
proporção da variância em torno da média da variável que se deseja prever 
(dependente), que é explicada pelas variáveis preditoras (independentes). O R² 
ajustado, ou coeficiente ajustado de determinação, refere-se ao cálculo de R², 
considerando o número de variáveis independentes e o tamanho da amostra. 
 
3) Quais os dois motivos centrais para que o pesquisador se convença da 
importância de se realizar o processo de exame dos dados com cuidado? 
 
• Capacidade do pesquisador de entender suas variáveis; permitir ao 
pesquisador concluir o modelo matemático, afinal, com um adequado 
exame dos dados, temos todas as variáveis necessárias. 
• Capacidade do pesquisador de entender suas variáveis; garantir que os 
dados são adequados para a sua aplicação. Check CORRETO 
• Garantir que ele não precise aplicar nenhuma técnica multivariada, afinal 
ele consegue entender todas as interrelações pelos exames realizados; 
garantir que os dados são adequados para a sua aplicação. 
• Permitir ao pesquisador concluir o modelo matemático, afinal, com um 
adequado exame dos dados, temos todas as variáveis necessárias; 
garantir que os dados são adequados para a sua aplicação. 
• Capacidade do pesquisador de entender suas variáveis; garantir que ele 
não precise aplicar nenhuma técnica multivariada, afinal ele consegue 
entender todas as interrelações pelos exames realizados. 
 
Resolução comentada: 
O primeiro argumento para se justificar o exame dos dados se encontra na 
capacidade adquirida pelo pesquisador de entender o comportamento de cada 
variável e suas interrelações. Essa compreensão permitirá que o pesquisador 
realize a adequada leitura dos resultados obtidos e possíveis reflexões acerca 
do uso ou ajustes necessários nas variáveis, para que elas expressem de forma 
correta o que se pretendia com ela. O segundo motivo é a garantia de que os 
dados estão adequados para as aplicações. Isso se torna importante para não 
inviabilizar os resultados obtidos. Pense no trabalho realizado e no sofrimento 
de ter que refazer grande parte dele após identificar que sua variável não permite 
a aplicação da técnica multivariada. 
 
4) Entre os tipos de exames gráficos apresentados encontram-se: _________ e 
__________. O primeiro tipo de exame é realizado através de um __________ 
e um __________. Já para o segundo tipo, os gráficos de __________ e de 
__________ fornecem informações sobre a relação entre variáveis e a 
distribuição das variáveis em diferentes categorias, organizando os dados por 
quartis, respectivamente. 
 
Assinale a alternativa que completa adequadamente as lacunas: 
 
• Perfil bivariado; perfil univariado; histograma; gráfico de dispersão; 
diagrama de ramo-e-folha; caixa. 
• Perfil univariado; perfil bivariado; histograma; diagrama de ramo-e-folha; 
dispersão; caixa .check CORRETO 
• Perfil univariado; perfil bivariado; diagrama de ramo-e-folha; gráfico de 
caixa; histograma; dispersão. 
• Perfil univariado; perfil bivariado; histograma; gráfico de dispersão; 
diagrama de ramo-e-folha; caixa. 
• Perfil bivariado; perfil univariado; diagrama de ramo-e-folha; gráfico de 
caixa; histograma; dispersão. 
 
Resolução comentada: 
Entre os tipos de exames gráficos apresentados encontram-se: perfil univariado 
e perfil bivariado. O primeiro tipo de exame é realizado através de um histograma 
e um diagrama de ramo-e-folha. Já para o segundo tipo, os gráficos de dispersão 
e de caixa fornecem informações sobre a relação entre variáveis e a distribuição 
das variáveis em diferentes categorias, organizando os dados por quartis, 
respectivamente. 
 
5) Leia as frases a seguir, identifique se elas são verdadeiras (V) ou falsas (F) e 
assinale a alternativa correspondente: 
 
1. Análise multivariada pode ser definida como o conjunto de técnicas 
estatísticas que analisam de forma simultânea múltiplas medidas sobre 
indivíduos ou objetos de investigação; 
2. O objetivo de uma Análise Multivariada consiste em medir, explicar e prever o 
grau de relação entre variáveis estatísticas; 
3. A aplicação da Análise Multivariada de dados ocorre em muitos campos do 
conhecimento. 
 
• V – F – V. 
• V – F – F. 
• F – V – F. 
• V – V – F. 
• V – V – V. check CORRETO 
 
Resolução comentada: 
Todas as afirmativas estão corretas, desde a definição, objetivo de aplicação e 
múltiplas área de aplicação da Análise Multivariada de Dados. 
 
6) A partir da tabela apresentada a seguir, o que se pode concluir? 
 
Tabela – Resultados da Regressão Linear Múltipla 
 
 
• O nível de erro padrão está elevado em relação aos valores de referência, 
invalidando o modelo. 
• O baixo valor de R indica que a seleção das variáveis necessita de 
reajustes. 
• A obtenção de um valor alto de R² e R² ajustado indica que nenhuma 
variável a mais acrescida ajudaria no modelo, ou seja, o pesquisador 
encontrou seu resultado perfeito. 
• Como a diferença entre R² e R² ajustado é pequena, as variáveis que 
estão no modelo auxiliam a explicação da variável dependente. 
checkCORRETO 
• O valor de R indicará ao pesquisador a proporção da variância em torno 
da média da variável que se deseja prever, ou seja, neste caso, o modelo 
é um excelente previsor. 
 
Resolução comentada: 
O R² ajustado, ou coeficiente ajustado de determinação, refere-se ao cálculo de 
R², considerando o número de variáveis independentes e o tamanho da amostra. 
Esse resultado é muito importante, pois, ao acrescentarmos mais variáveis ao 
modelo, a tendência é que ele encontre cada vez mais valor no R², porém, muitas 
variáveis podem acrescentar esse valor com baixo poder de explicação. No caso 
da tabela apresentada, ambos os valores são similares, apontando que o modelo 
não perdeu poder de explicação com a adição de variáveis. 
 
7) Uma empresa apresenta os seguintes conjuntos de dados: 
 
Faixa salarial da família. 
Presença de filhos na casa. 
Como esses dados são não métricos, a empresa solicitou a você a 
transformação dos dados para dados métricos. Entre as opções a seguir, qual 
seria a alternativa correta de realização desse procedimento? 
 
• Para a faixa salarial, o ideal é atribuir a mesma um conjunto de variáveis 
que correspondam as suas alternativas, fazendo uma variação de 0 ou 1 
em cada uma, a depender da resposta do entrevistado. Para a variável 
“presença de filhos em casa”, recomenda-se uma nova coleta, sendo 
necessário saber a quantidade de filhos para que a variável seja métrica. 
• Para a faixa salarial, o ideal é atribuir a mesma um conjunto de variáveis 
que correspondam as suas alternativas, fazendo uma variação de 0 ou 1 
em cada uma, a depender da resposta do entrevistado. Para a variável 
“presença de filhos em casa”, sua transformação em variáveis 
dicotômicas pode ser apresentada através de para “Sim” e para “Não”. 
Assim, as variáveis podem variar entre 0 e 1. checkCORRETO 
• Para a variável “faixa salarial”, o recomendado seria coletar os dados 
novamente, obtendo o valor preciso dos ganhos familiares. Para a 
variável “presença de filhos em casa”, recomenda-se uma nova coleta, 
sendo necessário saber a quantidade de filhos para que a variável seja 
métrica. 
• Para a faixa salarial, o ideal é reorganizar os dados para apenas duas 
variáveis excludentes entre si (existênciaou não do salário familiar. Para 
a variável “presença de filhos em casa”, sua transformação em variáveis 
dicotômicas pode ser apresentada através de para “Sim” e para “Não”. 
Assim, as variáveis podem variar entre 0 e 1. 
• Para a variável “faixa salarial”, o recomendado seria coletar os dados 
novamente, obtendo o valor preciso dos ganhos familiares. Para a 
variável “presença de filhos em casa”, sua transformação em variáveis 
dicotômicas pode ser apresentada através de para “Sim” e para “Não”. 
Assim, as variáveis podem variar entre 0 e 1. 
 
 
 
Resolução comentada: 
A variável “faixa salarial” pode ser apresentada na seguinte forma: Faixa 1, 
abaixo de R$ 1.000; Faixa 2 entre R$ 1.000 e R$ 2.000; e Faixa 3 acima de R$ 
2.000. Assim, temos três faixas determinadas para a nossa pesquisa. Para 
ajustarmos os dados para variáveis dicotômicas, determinamos as seguintes 
variáveis: 
 
Faixa 1 = . 
Faixa 2 = . 
Faixa 3 = . 
 
Com essa organização, podemos determinar que se o valor corresponder à faixa 
1, o valor de será 1, enquanto os demais terão valores 0. Em caso da faixa 2 ser 
a escolhida, o valor de será 1, enquanto os demais serão 0. Por fim, se a faixa 3 
for selecionada, apresentará valor 1, enquanto os demais valor 0. Para a variável 
“presença de filhos em casa”, a sua transformação em variáveis dicotômicas 
pode ser apresentada através de para “Sim” e para “Não”. Assim, as variáveis 
podem variar entre 0 e 1. 
 
8) Sobre os exames de dados a partir dos gráficos, analise as afirmativas a 
seguir e assinale-as com V (verdadeiro) ou F (falso): 
 
( ) O histograma será uma representação da frequência de ocorrência de um 
valor no conjunto analisado. 
( ) O diagrama de ramo-e-folhas terá a informação da frequência de ocorrências, 
do intervalo estabelecido (ramo), e, em caso de valores contínuos, quais são 
esses valores menores (folha). 
( ) Para a análise de relações entre duas variáveis, recomenda-se a realização 
de um gráfico de dispersão, ou seja, um gráfico de pontos baseados em duas 
variáveis não métricas. 
( ) Gráfico de caixa (boxplot) fornece a distribuição das variáveis em diferentes 
categorias, organizando os dados por quartis. 
 
Assinale a alternativa que contenha a sequência correta de V e F:. 
 
• F – V – F – V. 
• V – V – V – V. 
• V – V – F – V. check CORRETO 
• F – V – F – F. 
• V – F – F – V. 
 
Resolução comentada: 
Apenas a terceira afirmativa está incorreta. Para a análise de relações entre duas 
variáveis, recomenda-se a realização de um gráfico de dispersão, ou seja, um 
gráfico de pontos baseados em duas variáveis métricas. 
 
9) Para a escolha de uma técnica de análise multivariada, temos que responder 
algumas questões. Supondo que a escolha realizada pelo pesquisador foi a 
Regressão Múltipla, como ele respondeu as questões a seguir? 
 
1. Qual tipo de relação está sendo examinada? 
2. Quantas variáveis estão sendo previstas? 
3. Qual a escala de medida da variável dependente? 
 
 
• 1 - Dependência; 2 - Uma única variável; 3 - Não métrica. 
• 1 - Independência; 2 - Uma única variável; 3 - Métrica. 
• 1 - Independência; 2 - Múltiplas variáveis; 3 - Não métrica. 
• 1 - Dependência; 2 - Múltiplas variáveis; 3 - Métrica 
• 1 - Dependência; 2 - Uma única variável; 3 - Métrica. check CORRETO 
 
Resolução comentada: 
Para a escolha adequada da Regressão Múltipla se faz necessário ter uma 
relação de dependência entre as variáveis analisadas. Uma única variável deve 
estar sendo prevista, enquanto essa variável dependente deve ser métrica em 
sua escala de medida 
 
10) Complete o trecho a seguir: 
 
No processo de escolha da técnica de análise multivariada, a primeira pergunta 
é o __________. Após sua resposta, se observarmos relações independentes, 
devemos responder à questão sobre __________. Caso sua resposta acarretar 
uma relação de dependência, você deve responder sobre a __________. Por 
fim, em ambos os casos, você deverá identificar as __________. 
 
• Tipo de relação que está sendo examinado; estrutura de relação; escalas 
de medida; quantidade de variáveis previstas 
• Tipo de relação que está sendo examinado; escalas de medida; estrutura 
de relação; quantidade de variáveis previstas. 
• Tipo de técnica multivariada que desejo; quantidade de variáveis 
previstas; escalas de medida; estrutura de relação. 
• Tipo de relação que está sendo examinado; estrutura de relação; 
quantidade de variáveis previstas; escalas de medida. check CORRETO 
• Tipo de técnica multivariada que desejo; quantidade de variáveis 
previstas; estrutura de relação; escalas de medida. 
 
Resolução comentada: 
As perguntas que se devem realizar ao longo do processo de escolha dizem 
respeito à relação do que se está examinando, aos tipos de estrutura de relação 
(independência) e à quantidade de dados previstos (dependência), além da 
escala de medida das variáveis.

Continue navegando