Baixe o app para aproveitar ainda mais
Prévia do material em texto
1) • As afirmações 1 e 2 estão corretas check CORRETO • Apenas a afirmação 1 está correta • Apenas a afirmação 3 está correta. • Apenas a afirmação 2 está correta • Todas as afirmações estão corretas. Resolução comentada: 2) Leia e associe as duas colunas conforme os seus respectivos significados. • I – A; II – C; III – B. • I – A; II – B; III – C. • I – B; II – C; III – A. • I – C; II – B; III – A. check CORRETO • I – B; II – A; III – C. Resolução comentada: O R representa o coeficiente de correlação. Esse resultado indicará a força de associação entre quaisquer duas variáveis métricas. Já o R² representará o coeficiente de determinação. Esse resultado indicará ao pesquisador a proporção da variância em torno da média da variável que se deseja prever (dependente), que é explicada pelas variáveis preditoras (independentes). O R² ajustado, ou coeficiente ajustado de determinação, refere-se ao cálculo de R², considerando o número de variáveis independentes e o tamanho da amostra. 3) Quais os dois motivos centrais para que o pesquisador se convença da importância de se realizar o processo de exame dos dados com cuidado? • Capacidade do pesquisador de entender suas variáveis; permitir ao pesquisador concluir o modelo matemático, afinal, com um adequado exame dos dados, temos todas as variáveis necessárias. • Capacidade do pesquisador de entender suas variáveis; garantir que os dados são adequados para a sua aplicação. Check CORRETO • Garantir que ele não precise aplicar nenhuma técnica multivariada, afinal ele consegue entender todas as interrelações pelos exames realizados; garantir que os dados são adequados para a sua aplicação. • Permitir ao pesquisador concluir o modelo matemático, afinal, com um adequado exame dos dados, temos todas as variáveis necessárias; garantir que os dados são adequados para a sua aplicação. • Capacidade do pesquisador de entender suas variáveis; garantir que ele não precise aplicar nenhuma técnica multivariada, afinal ele consegue entender todas as interrelações pelos exames realizados. Resolução comentada: O primeiro argumento para se justificar o exame dos dados se encontra na capacidade adquirida pelo pesquisador de entender o comportamento de cada variável e suas interrelações. Essa compreensão permitirá que o pesquisador realize a adequada leitura dos resultados obtidos e possíveis reflexões acerca do uso ou ajustes necessários nas variáveis, para que elas expressem de forma correta o que se pretendia com ela. O segundo motivo é a garantia de que os dados estão adequados para as aplicações. Isso se torna importante para não inviabilizar os resultados obtidos. Pense no trabalho realizado e no sofrimento de ter que refazer grande parte dele após identificar que sua variável não permite a aplicação da técnica multivariada. 4) Entre os tipos de exames gráficos apresentados encontram-se: _________ e __________. O primeiro tipo de exame é realizado através de um __________ e um __________. Já para o segundo tipo, os gráficos de __________ e de __________ fornecem informações sobre a relação entre variáveis e a distribuição das variáveis em diferentes categorias, organizando os dados por quartis, respectivamente. Assinale a alternativa que completa adequadamente as lacunas: • Perfil bivariado; perfil univariado; histograma; gráfico de dispersão; diagrama de ramo-e-folha; caixa. • Perfil univariado; perfil bivariado; histograma; diagrama de ramo-e-folha; dispersão; caixa .check CORRETO • Perfil univariado; perfil bivariado; diagrama de ramo-e-folha; gráfico de caixa; histograma; dispersão. • Perfil univariado; perfil bivariado; histograma; gráfico de dispersão; diagrama de ramo-e-folha; caixa. • Perfil bivariado; perfil univariado; diagrama de ramo-e-folha; gráfico de caixa; histograma; dispersão. Resolução comentada: Entre os tipos de exames gráficos apresentados encontram-se: perfil univariado e perfil bivariado. O primeiro tipo de exame é realizado através de um histograma e um diagrama de ramo-e-folha. Já para o segundo tipo, os gráficos de dispersão e de caixa fornecem informações sobre a relação entre variáveis e a distribuição das variáveis em diferentes categorias, organizando os dados por quartis, respectivamente. 5) Leia as frases a seguir, identifique se elas são verdadeiras (V) ou falsas (F) e assinale a alternativa correspondente: 1. Análise multivariada pode ser definida como o conjunto de técnicas estatísticas que analisam de forma simultânea múltiplas medidas sobre indivíduos ou objetos de investigação; 2. O objetivo de uma Análise Multivariada consiste em medir, explicar e prever o grau de relação entre variáveis estatísticas; 3. A aplicação da Análise Multivariada de dados ocorre em muitos campos do conhecimento. • V – F – V. • V – F – F. • F – V – F. • V – V – F. • V – V – V. check CORRETO Resolução comentada: Todas as afirmativas estão corretas, desde a definição, objetivo de aplicação e múltiplas área de aplicação da Análise Multivariada de Dados. 6) A partir da tabela apresentada a seguir, o que se pode concluir? Tabela – Resultados da Regressão Linear Múltipla • O nível de erro padrão está elevado em relação aos valores de referência, invalidando o modelo. • O baixo valor de R indica que a seleção das variáveis necessita de reajustes. • A obtenção de um valor alto de R² e R² ajustado indica que nenhuma variável a mais acrescida ajudaria no modelo, ou seja, o pesquisador encontrou seu resultado perfeito. • Como a diferença entre R² e R² ajustado é pequena, as variáveis que estão no modelo auxiliam a explicação da variável dependente. checkCORRETO • O valor de R indicará ao pesquisador a proporção da variância em torno da média da variável que se deseja prever, ou seja, neste caso, o modelo é um excelente previsor. Resolução comentada: O R² ajustado, ou coeficiente ajustado de determinação, refere-se ao cálculo de R², considerando o número de variáveis independentes e o tamanho da amostra. Esse resultado é muito importante, pois, ao acrescentarmos mais variáveis ao modelo, a tendência é que ele encontre cada vez mais valor no R², porém, muitas variáveis podem acrescentar esse valor com baixo poder de explicação. No caso da tabela apresentada, ambos os valores são similares, apontando que o modelo não perdeu poder de explicação com a adição de variáveis. 7) Uma empresa apresenta os seguintes conjuntos de dados: Faixa salarial da família. Presença de filhos na casa. Como esses dados são não métricos, a empresa solicitou a você a transformação dos dados para dados métricos. Entre as opções a seguir, qual seria a alternativa correta de realização desse procedimento? • Para a faixa salarial, o ideal é atribuir a mesma um conjunto de variáveis que correspondam as suas alternativas, fazendo uma variação de 0 ou 1 em cada uma, a depender da resposta do entrevistado. Para a variável “presença de filhos em casa”, recomenda-se uma nova coleta, sendo necessário saber a quantidade de filhos para que a variável seja métrica. • Para a faixa salarial, o ideal é atribuir a mesma um conjunto de variáveis que correspondam as suas alternativas, fazendo uma variação de 0 ou 1 em cada uma, a depender da resposta do entrevistado. Para a variável “presença de filhos em casa”, sua transformação em variáveis dicotômicas pode ser apresentada através de para “Sim” e para “Não”. Assim, as variáveis podem variar entre 0 e 1. checkCORRETO • Para a variável “faixa salarial”, o recomendado seria coletar os dados novamente, obtendo o valor preciso dos ganhos familiares. Para a variável “presença de filhos em casa”, recomenda-se uma nova coleta, sendo necessário saber a quantidade de filhos para que a variável seja métrica. • Para a faixa salarial, o ideal é reorganizar os dados para apenas duas variáveis excludentes entre si (existênciaou não do salário familiar. Para a variável “presença de filhos em casa”, sua transformação em variáveis dicotômicas pode ser apresentada através de para “Sim” e para “Não”. Assim, as variáveis podem variar entre 0 e 1. • Para a variável “faixa salarial”, o recomendado seria coletar os dados novamente, obtendo o valor preciso dos ganhos familiares. Para a variável “presença de filhos em casa”, sua transformação em variáveis dicotômicas pode ser apresentada através de para “Sim” e para “Não”. Assim, as variáveis podem variar entre 0 e 1. Resolução comentada: A variável “faixa salarial” pode ser apresentada na seguinte forma: Faixa 1, abaixo de R$ 1.000; Faixa 2 entre R$ 1.000 e R$ 2.000; e Faixa 3 acima de R$ 2.000. Assim, temos três faixas determinadas para a nossa pesquisa. Para ajustarmos os dados para variáveis dicotômicas, determinamos as seguintes variáveis: Faixa 1 = . Faixa 2 = . Faixa 3 = . Com essa organização, podemos determinar que se o valor corresponder à faixa 1, o valor de será 1, enquanto os demais terão valores 0. Em caso da faixa 2 ser a escolhida, o valor de será 1, enquanto os demais serão 0. Por fim, se a faixa 3 for selecionada, apresentará valor 1, enquanto os demais valor 0. Para a variável “presença de filhos em casa”, a sua transformação em variáveis dicotômicas pode ser apresentada através de para “Sim” e para “Não”. Assim, as variáveis podem variar entre 0 e 1. 8) Sobre os exames de dados a partir dos gráficos, analise as afirmativas a seguir e assinale-as com V (verdadeiro) ou F (falso): ( ) O histograma será uma representação da frequência de ocorrência de um valor no conjunto analisado. ( ) O diagrama de ramo-e-folhas terá a informação da frequência de ocorrências, do intervalo estabelecido (ramo), e, em caso de valores contínuos, quais são esses valores menores (folha). ( ) Para a análise de relações entre duas variáveis, recomenda-se a realização de um gráfico de dispersão, ou seja, um gráfico de pontos baseados em duas variáveis não métricas. ( ) Gráfico de caixa (boxplot) fornece a distribuição das variáveis em diferentes categorias, organizando os dados por quartis. Assinale a alternativa que contenha a sequência correta de V e F:. • F – V – F – V. • V – V – V – V. • V – V – F – V. check CORRETO • F – V – F – F. • V – F – F – V. Resolução comentada: Apenas a terceira afirmativa está incorreta. Para a análise de relações entre duas variáveis, recomenda-se a realização de um gráfico de dispersão, ou seja, um gráfico de pontos baseados em duas variáveis métricas. 9) Para a escolha de uma técnica de análise multivariada, temos que responder algumas questões. Supondo que a escolha realizada pelo pesquisador foi a Regressão Múltipla, como ele respondeu as questões a seguir? 1. Qual tipo de relação está sendo examinada? 2. Quantas variáveis estão sendo previstas? 3. Qual a escala de medida da variável dependente? • 1 - Dependência; 2 - Uma única variável; 3 - Não métrica. • 1 - Independência; 2 - Uma única variável; 3 - Métrica. • 1 - Independência; 2 - Múltiplas variáveis; 3 - Não métrica. • 1 - Dependência; 2 - Múltiplas variáveis; 3 - Métrica • 1 - Dependência; 2 - Uma única variável; 3 - Métrica. check CORRETO Resolução comentada: Para a escolha adequada da Regressão Múltipla se faz necessário ter uma relação de dependência entre as variáveis analisadas. Uma única variável deve estar sendo prevista, enquanto essa variável dependente deve ser métrica em sua escala de medida 10) Complete o trecho a seguir: No processo de escolha da técnica de análise multivariada, a primeira pergunta é o __________. Após sua resposta, se observarmos relações independentes, devemos responder à questão sobre __________. Caso sua resposta acarretar uma relação de dependência, você deve responder sobre a __________. Por fim, em ambos os casos, você deverá identificar as __________. • Tipo de relação que está sendo examinado; estrutura de relação; escalas de medida; quantidade de variáveis previstas • Tipo de relação que está sendo examinado; escalas de medida; estrutura de relação; quantidade de variáveis previstas. • Tipo de técnica multivariada que desejo; quantidade de variáveis previstas; escalas de medida; estrutura de relação. • Tipo de relação que está sendo examinado; estrutura de relação; quantidade de variáveis previstas; escalas de medida. check CORRETO • Tipo de técnica multivariada que desejo; quantidade de variáveis previstas; estrutura de relação; escalas de medida. Resolução comentada: As perguntas que se devem realizar ao longo do processo de escolha dizem respeito à relação do que se está examinando, aos tipos de estrutura de relação (independência) e à quantidade de dados previstos (dependência), além da escala de medida das variáveis.
Compartilhar