Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUÇÃO À REGRESSÃO MÚLTIPLA 1. (FGV OS 2012.1) Um proprietário de uma empresa de telefonia fez um estudo estatístico para prever a produtividade de seus funcionários (em número médio de atendimentos telefônicos por dia), em função da quantidade de café ingerida (em número médio de copos de café por dia) e tempo de sono por noite (em horas médias dormidas por noite). Como resultado de seu estudo, chegou à seguinte equação: Com base no estudo descrito e na equação dele resultante, pode-se afirmar que se trata de uma regressão: a) Múltipla, na qual a produtividade dos funcionários é a variável independente, e quantidade de café ingerida e o tempo de sono por noite são as variáveis dependentes. b) Simples, na qual a produtividade dos funcionários é a variável independente, a quantidade de café ingerida é variável dependente, e o tempo de sono por noite é apenas uma variável de controle. c) Simples, na qual a produtividade dos funcionários é variável independente, o tempo de sono por noite é a a variável dependente, e a quantidade de café ingerida é apenas uma variável de controle. d) Simples, na qual a produtividade dos funcionários é a variável dependente, a quantidade de café ingerida é a variável independente, e o tempo de sono por noite é apenas uma variável de controle. e) Múltipla, na qual a produtividade dos funcionários é a variável dependente, e a quantidade de café ingerida e o tempo de sono por noite são as variáveis independentes. Resposta: Os modelos de regressão múltipla utilizam duas ou mais variáveis independentes para prever o valor de uma variável dependente, portanto a a produtividade dos funcionários é a variável dependente, e a quantidade de café ingerida e o tempo de sono por noite são as variáveis independentes. 2. (P2 2012.2) Frederico quer estimar a equação de um modelo que relaciona o número de votos recebidos pelo candidato eleito de alguns municípios (em mil habitantes) com o número de eleitores desses municípios (em mil habitantes) e com os gastos totais dos candidatos em campanha (em mil reais). Para tal, fez uma regressão múltipla, e obteve os resultados a seguir: Modelo Soma dos Quadrados Graus de Liberdad e Média dos Quadrado s F Valor- p Regressão 76633,617 2 38316,809 119,934 0,000 Residual 9903,966 31 319,483 Total 86537,584 33 Modelo Coeficientes não padronizados Coeficientes padronizad os T Valor- p B Erro-padrão Beta (Constante) 10,907 6,401 1,704 0,098 Número de eleitores do município (mil habitantes) 0,70 0,020 0,302 3,466 0,002 Gastos de campanha do candidato (R$ 1000) 0,010 0,001 0,700 8,027 0,000 Variável dependente: Número de votos obtidos pelo candidato (mil habitantes) Com base nas tabelas apresentadas, e a partir do modelo de regressão linear múltipla onde X1 corresponde à variável número de elitores” do município” e X2 corresponde à variável “gastos de camapnha do candidato”, Frederico pode estimar a seguinte equação: a) Y = 10,907 + 0,302X1 + 0,700 X2 b) Y = 119,934 + 0,302X1 + 0,700 X2 c) Y = 10,907 + 0,70X1 + 0,010 X2 d) Y = 0 + 0,7X1 + 0,010 X2 e) Y = 0 + 0,302X1 + 0,700 X2 Resposta: ( ) ( ) O ENUNCUINADO ABAIXO SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES (PS 2016.2) Suponha que a função de regressão apresentada a seguir estabeleça a relação entre a variável VARA (dependente) e VARB, VARC e VARD (independente): 3. É correto afirmas que, para VARB = 5, VARC = 3 e VARD = 6, o valor de VARA é igual a : a) 32,5 b) 62,5 c) 67,5 d) 77,5 e) 60 Resposta: ( ) ( ) ( ) 4. Com relação à função de regressão apresentada, é correto afirmar que, para um acréscimo de uma unidade ao valor de VARB, o valor de VARA: (A) Não sofrerá alteração. (B) Diminuirá 18 unidades. (C) Diminuirá 3 unidades. (D) Aumentará 18 unidades. (E) Aumentará 3 unidades. Resposta: Aumenta três unidades já que a função é 3 x VARB. O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS TRÊS QUESTÕES (P2 2016.1) Um pesquisador estava interessado em verificar se existem diferenças entre os salários de homens e mulheres. Para isso, coletou uma amostra aleatória de 200 pessoas (100 homens e 100 mulheres) e estimou a seguinte equação de regressão múltipla: = 3000 + 800 𝑀 + 300 𝐸 + 500 𝐸 ê Em que: Y = salário mensal em R$; Homem = 1 se indivíduo do sexo masculino e 0 feminino; Escolaridade = anos completos de escolaridade; e Experiência = anos de experiência no mercado de trabalho. 5. Todos os coeficientes estimados foram significantes a 5%, logo pode-se afirmar que os homens ganham: (A) R$4.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência constantes. (B) R$1.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência constantes. (C) R$800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência constantes. (D) R$3.800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência constantes. (E) R$1.100,00 a mais que as mulheres, em média, mantendo escolaridade e experiência constantes. Resposta: Homens ganham a mais que mulheres R$800,00 em média, mantendo escolaridade e experiência constante: Homem 1 = 800 x 1 = 800 Mulher 0 = 800 x 0 = 0 6. Assinale a alternativa que contém a correta interpretação do coeficiente associado à variável experiência. (A) Um ano adicional na experiência reduz, em média, R$1.600,00 no salário mensal, mantendo as outras constantes. (B) Um ano adicional na experiência reduz, em média, R$500,00 no salário mensal, mantendo as outras constantes. (C) Um ano adicional na experiência incrementa, em média, R$1.600,00 no salário mensal, mantendo as outras constantes. (D) Ter experiência incrementa, em média, R$500,00 no salário mensal, mantendo as outras constantes. (E) Um ano adicional na experiência incrementa, em média, R$500,00 no salário mensal, mantendo as outras constantes. Resposta: Experiência = 1 = 500 x 1 = 500 . Um ano de experiência retribui a um aumento de R$500,00 no salário. 7. Assinale a alternativa que contém o valor previsto para o salário de uma mulher com 10 anos de escolaridade e experiência de mercado. (A) R$10.700,00. (B) R$11.000,00. (C) R$11.800,00. (D) R$8.000,00. (E) R$8.800,00. Resposta: ( ) ( ) ( ) O valor previsto para o salário de uma mulher com 10 anos de escolaridade e experiência de mercado é de R$11.00 8. (P2 2012.2) Um estagiário de uma grande livraria, a pedido de seu chefe, realizou uma regressão linear múltipla para analisar o efeito dos anos de estudo e do tempo de experiência (em anos) sobre as vendas médias mensais (em Reais) dos vendedores que trabalham nas filiais dessa grande livraria. Entretanto, ao rodar a regressão, o estagiário percebeu que havia apagado o nome das variáveis e, portanto, não conseguia mais identificar qual das variáveis independentes era significante no modelo. O resultado obtido a partir da regressão pode ser observado na tabela a seguir: Modelo Coeficientes não padronizados Coeficientes padronizados t Valor- p B Erro-padrão Beta (Constante) 1359,1 824,08 1,649 0,102 X1 36,569 1,252 0,948 29,21 0 X2 0,343 20,967 0,001 0,016 0,987 Variável dependente: Y O estagiário lembrou, entretanto, que tinha salvado em seus arquivos alguns gráficos de dispersão em que as variáveis estavam sendo identificadas. Os gráficos salvos pelo estagiário podem ser observados a seguir: Com base nas informações apresentadas, pode-se afirmar que;(A) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável X1 não é significante para o modelo. (B) provavelmente, a variável “Tempo de Experiência” corresponde à variável X1 do modelo, porque o gráfico 2 parece mostrar não haver relação entre “Tempo de Experiência” e “Vendas”, e a variável X1 é não significante para o modelo. (C) provavelmente, a variável “Anos de Estudo” corresponde à variável X2 do modelo, porque o gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável X2 não é significante para o modelo. (D) provavelmente, a variável “Tempo de Experiência” corresponde à variável X2 do modelo, porque o gráfico 2 parece mostrar haver relação entre “Tempo de Experiência” e “Vendas”, e a variável X2 é significante para o modelo. (E) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o gráfico 1 parece mostrar haver relação entre “Anos de Estudo” e “Vendas”, e a variável X1 é significante para o modelo. Resposta: O gráfico 1 não contém relação, logo, anos de estudo é a variável do 2. 9. (P2 2012.2) A decomposição da variabilidade de uma variável em função de outra variável é um recurso importante utilizado pelos modelos estatísticos. Diante disso, em quais dos itens a seguir pode-se encontrar testes que utilizam essa prática? (A) Modelo de regressão linear simples e teste de comparação de médias de amostras independentes. (B) Modelo de regressão linear simples e teste de comparação de médias de amostras relacionadas. (C) Modelo de regressão linear múltipla e teste de comparação de médias de amostras relacionadas. (D) Modelo de regressão linear múltipla e análise da variância (ANOVA). (E) Analise da variância (ANOVA) e teste de comparação de médias de amostras independentes. Resposta: Usamos a análise ANOVA e a regressão múltipla para comparar mais de uma variável. 10. (P2 2016.1) Analise as seguintes afirmações sobre regressão linear múltipla: I) Quanto maior o R2 menor a soma de quadrados devido à regressão. II) O R2 será igual a 50% se a soma de quadrados dos resíduos for igual à soma de quadrados totais. III) O R2 será maior que 50% se a soma de quadrados devido à regressão for maior que a soma de quadrados dos resíduos. Está (ão) correta(s) APENAS a(s) sentença(s): (A) I. (B) I e III. (C) III. (D) II. (E) I e II. Resposta: A alternativa I está incorreta pois quanto maior R² maior a soma de quadrados devido a regressão A alternativa II está incorreta visto que SQRes= SQT pode ser igual A alternativa III está correta pois R² =SQR > R² SQS portanto R² será maior que 50% 11. (P2 2008.1) Com base nos resultados do teste dos coeficientes de um modelo de regressão qualquer, apresentados na tabela a seguir gerada pelo software Excel, pode-se concluir que: Coeficientes Erro- padrão Stat t Valor- P 95% inferiores 95% superiores Interseção - 186,07 63,95 - 2,91 0,10 - 461,23 89,08 Variável X1 0,42 0,06 7,35 0,02 0,17 0,66 (A) o modelo não se ajusta aos dados para α = 0,05. (B) o coeficiente de inclinação não é significativo para α = 0,05. (C) 42% da variação da variável dependente são explicados pela variável independente. (D) o intercepto e o coeficiente angular são significativos para α = 0,05. (E) o intercepto não é significativo para α = 0,05. Resposta: 5% pelo fato de ser 95% superior e 95% inferior. 12. (P2 2014.1) São premissas de um modelo de regressão linear múltipla: (A) Normalidade da variável dependente e heterocedasticidade das variáveis independentes. (B) Variáveis independentes altamente correlacionadas e normalidade dos resíduos. (C) Variável dependente qualitativa e homocedasticidade dos resíduos. (D) Normalidade e homocedasticidade dos resíduos. (E) Correlação e normalidade dos resíduos. Resposta: Normal e homocedásticidade dos resíduos 13. (PS 2016.1) São premissas que precisam ser satisfeitas para que a regressão linear múltipla seja válida: (A) homocedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. (B) homocedasticidade dos resíduos, normalidade da variável dependente e independência dos resíduos. (C) homocedasticidade das variáveis dependentes, normalidade dos resíduos e independência dos resíduos. (D) homocedasticidade das variáveis independentes, normalidade dos resíduos e dependência dos resíduos. (E) homocedasticidade dos resíduos, distribuição-t das variáveis dependentes e independência dos resíduos. Resposta: homocedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. 14. (P2 2012.2) São premissas que precisam ser satisfeitas para que a regressão linear múltipla seja válida: (A) homoscedasticidade dos resíduos, normalidade da variável dependente e independência do resíduo. (B) homoscedasticidade das variáveis independentes, normalidade da variável dependente e independência das variáveis independentes. (C) homoscedasticidade da variável dependente, normalidade dos resíduos e independência das variáveis independentes. (D) homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. (E) homoscedasticidade das variáveis independentes e normalidade da variável dependente. Resposta: homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. 15. (P2 2016.2) Na construção de um modelo de regressão múltipla, as seguintes premissas deverão ser observadas: (A) independência, normalidade dos resíduos e homocedasticidade dos resíduos. (B) somente independência e normalidade dos resíduos. (C) somente normalidade dos resíduos e homocedasticidade dos resíduos. (D) dependência, normalidade dos resíduos e homocedasticidade dos resíduos. (E) independência, normalidade dos resíduos e heterocedasticidade dos resíduos. Resposta: independência, normalidade dos resíduos e homocedasticidade dos resíduos. 16. (P2 2012.1) Podemos usar uma variável em um modelo de regressão quando desejamos incluir certo tipo de variável no modelo. Suponha que desejamos estudar os fatores que podem influenciar as notas dos alunos do ensino fundamental. Qual das variáveis a seguir pode ser representada por uma dummy? (A) Idade do aluno. (B) Anos de estudo dos pais. (C) Média de anos de experiência dos professores. (D) Se o aluno tem computador em casa. (E) Média das notas do aluno nas séries anteriores. Resposta: As demais alternativas estão erradas pois não apresentam uma relação que cause efeito na questão. 17. (P2 2016.1) Analise as seguintes sentenças: I) Em um modelo de regressão linear múltipla, a rejeição da hipótese nula da ANOVA indica que pelo menos uma das médias populacionais é diferente das demais. II) Em um teste t para a inclinação de um modelo de regressão, quanto maior a estatística t maior o valor-p do teste. III) Os betas estimados são obtidos por meio da minimização dos valores previstos do modelo. IV) Se uma variável qualitativa tem três categorias, é necessário criar duas variáveis dummy para incluí-la em um modelo de regressão. Está (ão) INCORRETA(S) APENAS a(s) sentença(s): (A) I e II. (B) I, III e IV. (C) II e IV. (D) I, II e III. (E) I e III. Resposta: As alternativas incorretas são: I – São as variâncias e não a média II – Quanto maior o t, menor será o p III – Está errado IV – Está correto 18. (P2 2016.1) Analise os gráficos de dispersão a seguir: Se um modelo de regressão múltipla for estimado tendo com variável dependente o salário mensal e variáveis independentes como experiência e escolaridade, provavelmente: (A) as variáveis escolaridade e experiência seriam significantesestatisticamente. (B) a variável escolaridade em anos seria significante estatisticamente. (C) as variáveis salário, escolaridade e experiência seriam significantes estatisticamente. (D) a variável experiência seria significante estatisticamente. (E) nenhuma das duas variáveis seria significante estatisticamente. Resposta: a variável escolaridade tem relação em anos seria significante estatisticamente. 19. (PS 2012.1) Um estatístico está realizando um estudo para tentar prever a influência das variáveis X1 – idade (em anos completos) – e X2 − nível de escolaridade (em anos completos), no número médio de livros que um indivíduo lê por ano (Y). Entretanto, antes de estimar o modelo e obter uma equação de previsão, o estatístico gerou alguns gráficos para analisar os dados disponíveis. Os gráficos produzidos são apresentados a seguir: Com base nos gráficos apresentados, pode-se afirmar que: (A) A variável X1 provavelmente ajuda a explicar a variabilidade da variável dependente Y, pois está negativamente relacionada com ela. (B) A variável X2 não ajuda a explicar a variabilidade da variável dependente Y, pois não está relacionada com ela. (C) Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y, pois estão positivamente relacionadas com ela. (D) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base nos gráficos apresentados, pois as variáveis utilizadas se constituem como variáveis Dummy. (E) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base apenas nos gráficos apresentados, sem que outras medidas de estatística descritiva sejam analisadas. Resposta: Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y, pois estão positivamente relacionadas com ela. 20. (FGV PS 2012.2) O proprietário de uma livraria de pequeno porte, diante de um recente aumento na ocorrência de roubos de livros em seu empreendimento, contratou um consultor para realizar uma pesquisa que aponte quais são as principais variáveis que tornam os furtos mais prováveis. A partir do resultado, pretende adotar uma nova maneira de dispor os livros na livraria, de forma a evitar futuros furtos. Para tal, o consutor teve acesso às sequintes informações: 1 (X1)– Preço do livro ( em reis); 2 (X2)– Número de páginas do livro; 3-Área de conhecimento abordado pelo livro (1- Psicologia (X3); 2- Direito (X4); 3- Economia(X5); 4- Literatura (X6); 5- Estatística(X7)). Com os dados disponíveis, o consultor realizou uma regressão e chegou à seguinte equação: Se quisermos representar a variável “área de conhecimento abordada pelo livro” tomando como variável dummy de referência literatura (X6), como ficaria a nova equação: a) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 b) Y= 4 +1,01 X1 + 0,003 X2 – 2 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 c) Y= 3,3 +3,01 X1 + 0,010 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 d) Y= 4 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,5 X4 – 0,9 X5 + 1,0 X7 e) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,3 X3 – 0,38 X4 – 3,0 X5 + 0,7 X7 Resposta: *, ( )- , - , - , ( ) - , ( ) - , ( ) - , ( ) -+ 21. (P2 2014.1) Dois modelos de regressão múltipla foram estimados e representados graficamente a seguir. Sabe-se que uma variável independente quantitativa e outra qualitativa foram consideradas na estimação dos modelos. Além disso, a variável dependente é a mesma nos dois modelos. As equações que melhor representam os modelos apresentados nos gráficos são respectivamente: (A) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 + (B) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 + (C) M1:Y = 1X1 + 2X2 + 3X3 + ; M2:Y = 1X1 + 2X2 + (D) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 + 2X2 + (E) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 + 3X3 + Resposta: 𝑀 O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. (P2 2014.2) O gerente de uma rede de lojas de departamento estava interessado em compreender quais variáveis explicam a variabilidade das vendas de seus vendedores. Para isso, contratou um estatístico que coletou dados de uma amostra de 126 vendedores e estimou o seguinte modelo de regressão múltipla. Em que: Idade = idade do vendedor em anos; Experiência = anos de experiência como vendedor; Capital = assume valor 1 se o vendedor é de uma loja da capital e 0 de uma loja do interior; Eletro = assume valor 1 se o vendedor atua na seção de eletroeletrônicos e 0 caso atue na seção de vestuário ou esportes; Vestuário = assume valor 1 se o vendedor atua na seção de vestuário e 0 caso atue na seção de eletroeletrônicos ou esportes; Esporte = assume valor 1 se o vendedor atua na seção de esportes e 0 caso atue na seção de eletroeletrônicos ou vestuário. 22. As variáveis independentes incluídas no modelo explicam quantos % da variabilidade das vendas? (A) 5,4%. (B) 25,4%. (C) 57,4%. (D) 74,5%. (E) 82,4%. Resposta: 23. Um dos diretores da empresa suspeitava que as vendas médias dos vendedores do interior eram maiores. Há evidências que comprovem essa suspeita? (A) Não, uma vez que o erro-padrão da variável Capital é muito elevado, o que torna a variável não significante estatisticamente. (B) Não, uma vez que o coeficiente da variável Capital é negativo. (C) Não, embora a variável apresente significância estatística, o R2 desse modelo é praticamente nulo. (D) Sim, uma vez que a variável Capital apresenta significância estatística e, em média, um vendedor da capital vende R$7.571,00 a menos que os vendedores do interior. (E) Sim, uma vez que, em média, um vendedor da capital vende R$1.275,00 a menos que os vendedores do interior. Resposta: O vendedor da capital vende 7571 a menos do que o vendedor do interior. O valor de p < 0,05 24. Existe diferença nas vendas médias entre os departamentos de eletroeletrônicos, vestuário e esportes? (A) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$368,00 a menos que os vendedores do departamento de esportes (valor-p < 5%). (B) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$864,00 a mais que os vendedores do departamento de esportes (valor-p > 5%). (C) Sim, os vendedores do departamento de vestuário vendem, em média, R$864,00 a menos que os vendedores do departamento de esportes (valor-p < 5%). (D) Não, as variáveis Eletro e Vestuário não são significantes (valores-p > 5%), ou seja, não existem diferenças nas médias de vendas entre departamentos. (E) Não, a variável Eletro não é significante (valor-p > 5%), ou seja, não existem diferenças na média de vendas entre departamentos. Resposta: Não, pois os valores de p são > 0,05. 25. Tendo em vista a interpretação dos coeficientes das variáveis Idade e Experiência dos vendedores, é correto afirmar que o aumento de um ano de idade implica: (A) um aumento médio de R$491mil nas vendas, mantendo as outras variáveis constantes. Um ano a mais de experiência incrementa, em média, R$961 mil nas vendas, mantendo as outras variáveis constantes. (B) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes. Um ano a mais de experiência incrementa, em média, R$961 nas vendas, mantendo as outras variáveis constantes. (C) um aumento médio de 49,1% nas vendas, mantendo as outras variáveis constantes. Um ano a mais de experiência incrementa, em média, 96,1% nas vendas, mantendo as outras variáveis constantes. (D) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes.Um ano a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras variáveis constantes. (E) uma redução média de R$491 nas vendas, mantendo as outras variáveis constantes. Um ano a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras variáveis constantes. Resposta: 1 ano de idade aumenta R$491,00 na venda e 1 de experiência aumenta R$961,00. O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES. (P2 2014.1) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em mil R$) dos agricultores familiares. Nas regiões Sul e Sudeste do Brasil, a pesquisa entrevistou um grupo de agricultores que utilizou e outro que não utilizou ATER no ano de 2013. A consultoria contratada pelo governo apresentou o seguinte modelo de regressão em seu relatório: Modelo gl SQ MQ F F de significação Regressão 2 6777 3389 5,52 0,01 Residual 47 28834 613 Total 49 35611 Coeficientes Erro padrã o Stat t Valor- P 95% inferior es 95% superior es Interseção 211 6,53 32,40 0,000 198,3 224,6 ATER 22 7,08 3,09 0,003 7,7 36,1 SUL - 6 7,06 - 0,83 0,408 - 20,1 8,3 Variável dependente: Receita total com a produção agropecuária (em mil R$) no ano de 2013. F = 5,52, valor-p = 0,01. Obs: todas as premissas do modelo foram respeitadas. Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na produção e 0 caso contrário; SUL assume valor 1 para propriedades do Sul e 0 se localizada na região Sudeste. 26. Com base no modelo estimado e considerando um nível de significância de 5%, pode-se concluir que: (A) O governo federal não deveria financiar um programa de ATER, uma vez que não é significante estatisticamente para explicar receita total do agricultor. (B) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a variável explica apenas 1% da variância da receita total do agricultor. (C) O governo federal deveria financiar um programa de ATER. Além de ser significante estatisticamente, a ATER incrementa a receita total do agricultor em R$22 mil, em média. (D) A receita total do grupo de agricultores que utilizaram assistência técnica é de R$22 mil. (E) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a variável SUL tem um efeito maior na explicação da receita total dos agricultores. Resposta: P < 0,05 e 22 x 1000 = R$22.000 27. Qual o valor e a interpretação do R2 deste modelo? (A) R2 = 39%. A variável ATER explica 39% da variância da receita total com a produção agropecuária (em mil R$) no ano de 2013. (B) R2 = 30%. As variáveis ATER e SUL explicam 30% da média da receita total com a produção agropecuária (em mil R$) no ano de 2013. (C) R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com a produção agropecuária (em mil R$) no ano de 2013. (D) R2 = 81%. As variáveis ATER e SUL explicam 81% da mediana da receita total com a produção agropecuária (em mil R$) no ano de 2013. (E) R2 = 19%. As variáveis dependentes incluídas no modelo explicam 19% da variância da receita total com a produção agropecuária (em mil R$) no ano de 2013. Resposta: R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com a produção agropecuária (em mil R$) no ano de 2013. 28. Com base na equação estimada, qual é a receita total com a produção agropecuária de um agricultor sem ATER que reside na região Sudeste? (A) R$205 mil (B) R$211 mil (C) R$227 mil (D) R$252 mil (E) R$276 mil Resposta: ( ) ( ) 29. (P2 2014.2) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em mil R$) dos agricultores familiares. A pesquisa entrevistou um grupo de agricultores que utilizou e outro que não utilizou ATER no ano de 2013. A consultoria contratada pelo governo apresentou o seguinte modelo de regressão em seu relatório: Coeficientes Erro padrão Stat t Valor- P 95% inferiores 95% superiores Interseção 211 6,53 32,40 0,000 198,3 224,6 ATER 22 7,08 3,09 0,003 7,7 36,1 Variável dependente: Receita Total com a produção agropecuária (em mil R$) no ano de 2013.Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na produção e 0 caso contrário. O governo federal irá incrementar os recursos para o financiamento de ATER se a receita total dos agricultores que utilizaram ATER for pelo menos 5% maior na receita total dos agricultores que não utilizaram ATER. Com base nas informações disponíveis, é correto afirmar que o governo: (A) não deve incrementar os recursos, uma vez que a variável ATER não é significante estatisticamente. (B) não deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total com a produção agropecuária 3,09% maior, em média. (C) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total com a produção agropecuária 10,4% maior, em média. (D) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total com a produção agropecuária 22%% maior, em média. (E) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total com a produção agropecuária 36,1% maior, em média. Resposta: deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total com a produção agropecuária 10,4% maior, em média. 30. (P2 2018.2) Um analista precisa incorporar, a um modelo de regressão, uma variável qualitativa para representar o estado civil da pessoa. A variável poderá assumir os seguintes valores: casado, solteiro, viúvo, separado e outros. Nesse caso, é correto afirmar que o número de variáveis “dummy” a serem utilizadas é igual a: (A) 5. (B) 4. (C) 8. (D) 3. (E) 10. Resposta: 5 – 1 = 4 O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. (P2 2018.2) Com o auxílio do Excel, uma empresa de telefonia criou um modelo de regressão múltipla relacionando as variáveis FATURAMENTO (em milhões de R$) e seus INVESTIMENTOS em Propaganda (PROP) e em Tecnologia (TEC) (ambos em milhares de R$). O relatório gerado pelo aplicativo de planilhas eletrônicas foi o seguinte: 31. Com vista nesses dados, a porcentagem de explicação da variabilidade do faturamento da empresa pelos investimentos em propaganda e tecnologia é, aproximadamente, de: (A) 7,5% (B) 3,7%. (C) 86%. (D) 48%. (E) 29%. Resposta: 32. Caso decida fazer um investimento adicional de R$1 mil em propaganda, mantendo constante o investimento em tecnologia, a empresa verá seu faturamento: (A) aumentar em cerca de R$3,7 milhões. (B) diminuir em cerca de R$465 milhões. (C) cair em cerca de R$5,3 milhões. (D) diminuir em cerca de R$3,7 milhões. (E) aumentar em cerca de R$5,3 milhões. Resposta: aumentar em cerca de R$3,7 milhões. 33. Caso a empresa decida não investir nada em propaganda e em tecnologia, o faturamento deverá ser, em média, de aproximadamente: (A) R$370 milhões. (B) R$465 milhões. (C) R$570 milhões. (D) R$163 milhões. (E) R$533 milhões. Resposta: ( ) ( ) 34. Caso a direção da empresa decida investir R$85 mil em propaganda e R$90 mil em tecnologia, o valor esperado para o faturamento da empresa será de, aproximadamente: (A) R$665 milhões. (B) R$927 milhões. (C) R$465 milhões. (D) R$147 milhões. (E) R$314 milhões. Resposta: O valor esperado parao faturamento da empresa será de, aproximadamente: ( ) ( ) 35. (PS 2018.2) Ao construir um modelo de regressão, um analista adicionou uma variável qualitativa que possuía 3 categorias. É correto dizer que, para representar essa variável qualitativa, o número de variáveis “dummy” necessárias é igual a: (A) 3. (B) 1. (C) 4. (D) 5. (E) 2. Resposta: O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. (PS 2018.2) A direção de uma corretora de valores pediu que seu analista desenvolvesse uma regressão que explicasse o valor total das aplicações financeiras de seus clientes (em milhares de R$) em função da sua renda mensal declarada (em milhares de R$) e de uma variável qualitativa que representasse seu estado civil (solteiro = 1; outros = 0). O modelo de regressão foi calculado por uma planilha Excel, e um extrato do relatório emitido pela planilha consta a seguir: 36. Com base nesses dados, é correto afirmar que, em média, o valor das aplicações de um cliente solteiro é aproximadamente: (A) R$3.700,00 maior do que o de um cliente que não seja solteiro. (B) R$31.700,00 maior do que o de um cliente que não seja solteiro. (C) R$10.900,00 maior do que o de um cliente que não seja solteiro. (D) R$3.700,00 menor do que o de um cliente que não seja solteiro. (E) R$16.100,00 maior do que o de um cliente que não seja solteiro. Resposta: R$3.657 a mais que o não solteiro ⩭ 3.700, maior do que o de um cliente que não seja solteiro. 37. Com base nesses dados, um acréscimo de R$1.000,00 na renda mensal declarada de um cliente, mantidas constantes as demais variáveis, ocasionará nas suas aplicações, em média: (A) um aumento de R$16.500,00. (B) uma diminuição de R$27.400,00. (C) um aumento de R$3.700,00. (D) uma diminuição de R$20.100,00. (E) uma diminuição de R$16.500,00. Resposta: 38. É correto afirmar que a variabilidade do valor das aplicações realizadas por um cliente nessa corretora é explicado pela renda mensal declarada e pelo estado civil em, aproximadamente: (A) 11%. (B) 74%. (C) 10%. (D) 92%. (E) 96%. Resposta: 39. Considere α = 0,05 para o teste de significância utilizado para se verificar a significância da relação entre o valor da aplicação e a renda mensal declarada. Em face dos dados apresentados no relatório emitido pela planilha Excel, é correto afirmar que: (A) a relação entre o valor da aplicação e a renda declarada não é significante, pois o coeficiente da variável RENDA, igual a 16,51376, é maior do que α = 0,05. (B) a relação entre o valor da aplicação e a renda declarada não é significante, pois o erro padrão da variável RENDA, igual a 2,16828, é maior do que α = 0,05. (C) a relação entre o valor da aplicação e a renda declarada é significante, pois o valor p da variável RENDA, igual a 0,000267, é menor do que α = 0,05. (D) a relação entre o valor da aplicação e a renda declarada não é significante, pois o valor p da variável RENDA, igual a 0,000267, é menor do que α = 0,05. (E) a relação entre o valor da aplicação e a renda declarada não é significante, pois o stat t da variável RENDA, igual a 7,616063, é maior do que α = 0,05. Resposta: Valor -p = 0,0002 < 0,05, a relação entre o valor da aplicação e a renda declarada é significante, pois o valor p da variável RENDA, igual a 0,000267, é menor do que α = 0,05. 40. (ENADE 2018) Com o objetivo de entender o impacto das internações causadas pela falta de saneamento básico, um pesquisador estimou o modelo apresentado na tabela a seguir, usando a quantidade de dias de internação de uma amostra de 7 260 pacientes do Sistema Único de Saúde como variável explicada. As variáveis explicativas são: (i) gênero do paciente, binária em que é 1 é utilizado para identificar as mulheres e 0 para identificar os homens; (ii) idade do paciente em anos de vida; e (iii) motivo da internação, também binária, em que recebe o valor 1 para identificar internações que são causadas por problemas de saneamento básico e o valor 0 para as demais internações. Considerando as informações apresentadas, assinale a opção correta. (A) O coeficiente R-quadrado encontra-se abaixo de 30%, o que significa que o modelo deve ser descartado. (B) As internações causadas pela deficiência de saneamento básico tendem a gerar um aumento de 1,96% nos gastos de saúde. (C) A média de dias de internação para mulheres é estatisticamente maior que a de internação para homens. (D) A variável idade não é estatisticamente significativa para explicar o número de dias de internação. (E) O teste F mostra que as variáveis explicativas conjuntamente são estatisticamente significativas para explicar o número de dias de internação. Resposta: Valor -p < 0,05
Compartilhar