Estatística II - Lista 9 INTRODUÇÃO À REGRESSÃO MÚLTIPLA

•

ESAGS

MELISSA RUBIO ORTIZ FERREIRA

23/11/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística II

3.262 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

INTRODUÇÃO À REGRESSÃO MÚLTIPLA 
1. (FGV OS 2012.1) Um proprietário de uma empresa de telefonia fez um estudo estatístico 
para prever a produtividade de seus funcionários (em número médio de atendimentos 
telefônicos por dia), em função da quantidade de café ingerida (em número médio de copos 
de café por dia) e tempo de sono por noite (em horas médias dormidas por noite). Como 
resultado de seu estudo, chegou à seguinte equação: 
 
Com base no estudo descrito e na equação dele resultante, pode-se afirmar que se trata de uma 
regressão: 
a) Múltipla, na qual a produtividade dos funcionários é a variável independente, e quantidade de 
café ingerida e o tempo de sono por noite são as variáveis dependentes. 
b) Simples, na qual a produtividade dos funcionários é a variável independente, a quantidade de 
café ingerida é variável dependente, e o tempo de sono por noite é apenas uma variável de 
controle. 
c) Simples, na qual a produtividade dos funcionários é variável independente, o tempo de sono 
por noite é a a variável dependente, e a quantidade de café ingerida é apenas uma variável 
de controle. 
d) Simples, na qual a produtividade dos funcionários é a variável dependente, a quantidade de 
café ingerida é a variável independente, e o tempo de sono por noite é apenas uma variável 
de controle. 
e) Múltipla, na qual a produtividade dos funcionários é a variável dependente, e a quantidade de 
café ingerida e o tempo de sono por noite são as variáveis independentes. 
 
Resposta: Os modelos de regressão múltipla utilizam duas ou mais variáveis independentes 
para prever o valor de uma variável dependente, portanto a a produtividade dos funcionários é a 
variável dependente, e a quantidade de café ingerida e o tempo de sono por noite são as 
variáveis independentes. 
 
 
 
2. (P2 2012.2) Frederico quer estimar a equação de um modelo que relaciona o número de 
votos recebidos pelo candidato eleito de alguns municípios (em mil habitantes) com o número 
de eleitores desses municípios (em mil habitantes) e com os gastos totais dos candidatos em 
campanha (em mil reais). Para tal, fez uma regressão múltipla, e obteve os resultados a 
seguir: 
Modelo 
Soma dos 
Quadrados 
Graus de 
Liberdad
e 
Média dos 
Quadrado
s 
F 
Valor-
p 
Regressão 76633,617 2 38316,809 119,934 0,000 
Residual 9903,966 31 319,483 
 
Total 86537,584 33 
 
Modelo 
Coeficientes não 
padronizados 
Coeficientes 
padronizad
os T 
Valor-
p 
B Erro-padrão Beta 
(Constante) 10,907 6,401 
 
1,704 0,098 
Número de eleitores do 
município (mil habitantes) 
0,70 0,020 0,302 3,466 0,002 
Gastos de campanha do 
candidato (R$ 1000) 
0,010 0,001 0,700 8,027 0,000 
Variável dependente: Número de votos obtidos pelo candidato (mil habitantes) 
Com base nas tabelas apresentadas, e a partir do modelo de regressão linear múltipla 
 
onde X1 corresponde à variável número de elitores” do município” e X2 corresponde à variável 
“gastos de camapnha do candidato”, Frederico pode estimar a seguinte equação: 
a) Y = 10,907 + 0,302X1 + 0,700 X2 
b) Y = 119,934 + 0,302X1 + 0,700 X2 
c) Y = 10,907 + 0,70X1 + 0,010 X2 
d) Y = 0 + 0,7X1 + 0,010 X2 
e) Y = 0 + 0,302X1 + 0,700 X2 
Resposta: 
 
 ( )
 ( ) 
 
O ENUNCUINADO ABAIXO SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 
(PS 2016.2) Suponha que a função de regressão apresentada a seguir estabeleça a relação 
entre a variável VARA (dependente) e VARB, VARC e VARD (independente): 
 
3. É correto afirmas que, para VARB = 5, VARC = 3 e VARD = 6, o valor de VARA é igual a : 
a) 32,5 
b) 62,5 
c) 67,5 
d) 77,5 
e) 60 
Resposta: 
 ( ) ( ) ( ) 
 
4. Com relação à função de regressão apresentada, é correto afirmar que, para um acréscimo 
de uma unidade ao valor de VARB, o valor de VARA: 
(A) Não sofrerá alteração. 
(B) Diminuirá 18 unidades. 
(C) Diminuirá 3 unidades. 
(D) Aumentará 18 unidades. 
(E) Aumentará 3 unidades. 
 
Resposta: Aumenta três unidades já que a função é 3 x VARB. 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS TRÊS QUESTÕES 
(P2 2016.1) Um pesquisador estava interessado em verificar se existem diferenças entre os 
salários de homens e mulheres. Para isso, coletou uma amostra aleatória de 200 pessoas (100 
homens e 100 mulheres) e estimou a seguinte equação de regressão múltipla: 
 = 3000 + 800 𝑀 + 300 𝐸 + 500 𝐸 ê 
Em que: Y = salário mensal em R$; Homem = 1 se indivíduo do sexo masculino e 0 feminino; 
Escolaridade = anos completos de escolaridade; e Experiência = anos de experiência no 
mercado de trabalho. 
5. Todos os coeficientes estimados foram significantes a 5%, logo pode-se afirmar que os 
homens ganham: 
(A) R$4.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(B) R$1.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(C) R$800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(D) R$3.800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(E) R$1.100,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
 
Resposta: Homens ganham a mais que mulheres R$800,00 em média, mantendo escolaridade 
e experiência constante: 
 Homem 1 = 800 x 1 = 800 
 Mulher 0 = 800 x 0 = 0 
 
 
6. Assinale a alternativa que contém a correta interpretação do coeficiente associado à variável 
experiência. 
(A) Um ano adicional na experiência reduz, em média, R$1.600,00 no salário mensal, mantendo 
as outras constantes. 
(B) Um ano adicional na experiência reduz, em média, R$500,00 no salário mensal, mantendo as 
outras constantes. 
(C) Um ano adicional na experiência incrementa, em média, R$1.600,00 no salário mensal, 
mantendo as outras constantes. 
(D) Ter experiência incrementa, em média, R$500,00 no salário mensal, mantendo as outras 
constantes. 
(E) Um ano adicional na experiência incrementa, em média, R$500,00 no salário mensal, 
mantendo as outras constantes. 
 
Resposta: Experiência = 1 = 500 x 1 = 500 . Um ano de experiência retribui a um aumento de 
R$500,00 no salário. 
 
 
7. Assinale a alternativa que contém o valor previsto para o salário de uma mulher com 10 anos 
de escolaridade e experiência de mercado. 
(A) R$10.700,00. 
(B) R$11.000,00. 
(C) R$11.800,00. 
(D) R$8.000,00. 
(E) R$8.800,00. 
 
Resposta: 
 ( ) ( ) ( ) 
 
O valor previsto para o salário de uma mulher com 10 anos de escolaridade e experiência de 
mercado é de R$11.00 
 
 
8. (P2 2012.2) Um estagiário de uma grande livraria, a pedido de seu chefe, realizou uma 
regressão linear múltipla para analisar o efeito dos anos de estudo e do tempo de experiência 
(em anos) sobre as vendas médias mensais (em Reais) dos vendedores que trabalham nas 
filiais dessa grande livraria. Entretanto, ao rodar a regressão, o estagiário percebeu que havia 
apagado o nome das variáveis e, portanto, não conseguia mais identificar qual das variáveis 
independentes era significante no modelo. O resultado obtido a partir da regressão pode ser 
observado na tabela a seguir: 
Modelo 
Coeficientes não 
padronizados 
Coeficientes 
padronizados t 
Valor-
p 
B Erro-padrão Beta 
(Constante) 1359,1 824,08 
 
1,649 0,102 
X1 36,569 1,252 0,948 29,21 0 
X2 0,343 20,967 0,001 0,016 0,987 
Variável dependente: Y 
O estagiário lembrou, entretanto, que tinha salvado em seus arquivos alguns gráficos de 
dispersão em que as variáveis estavam sendo identificadas. Os gráficos salvos pelo estagiário 
podem ser observados a seguir: 
 
Com base nas informações apresentadas, pode-se afirmar que;(A) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o 
gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável 
X1 não é significante para o modelo. 
(B) provavelmente, a variável “Tempo de Experiência” corresponde à variável X1 do modelo, 
porque o gráfico 2 parece mostrar não haver relação entre “Tempo de Experiência” e 
“Vendas”, e a variável X1 é não significante para o modelo. 
(C) provavelmente, a variável “Anos de Estudo” corresponde à variável X2 do modelo, porque o 
gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável 
X2 não é significante para o modelo. 
(D) provavelmente, a variável “Tempo de Experiência” corresponde à variável X2 do modelo, 
porque o gráfico 2 parece mostrar haver relação entre “Tempo de Experiência” e “Vendas”, e 
a variável X2 é significante para o modelo. 
(E) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o 
gráfico 1 parece mostrar haver relação entre “Anos de Estudo” e “Vendas”, e a variável X1 é 
significante para o modelo. 
 
Resposta: O gráfico 1 não contém relação, logo, anos de estudo é a variável do 2. 
9. (P2 2012.2) A decomposição da variabilidade de uma variável em função de outra variável é 
um recurso importante utilizado pelos modelos estatísticos. Diante disso, em quais dos itens a 
seguir pode-se encontrar testes que utilizam essa prática? 
(A) Modelo de regressão linear simples e teste de comparação de médias de amostras 
independentes. 
(B) Modelo de regressão linear simples e teste de comparação de médias de amostras 
relacionadas. 
(C) Modelo de regressão linear múltipla e teste de comparação de médias de amostras 
relacionadas. 
(D) Modelo de regressão linear múltipla e análise da variância (ANOVA). 
(E) Analise da variância (ANOVA) e teste de comparação de médias de amostras 
independentes. 
 
Resposta: Usamos a análise ANOVA e a regressão múltipla para comparar mais de uma 
variável. 
 
 
10. (P2 2016.1) Analise as seguintes afirmações sobre regressão linear múltipla: 
I) Quanto maior o R2 menor a soma de quadrados devido à regressão. 
II) O R2 será igual a 50% se a soma de quadrados dos resíduos for igual à soma de quadrados 
totais. 
III) O R2 será maior que 50% se a soma de quadrados devido à regressão for maior que a soma 
de quadrados dos resíduos. 
Está (ão) correta(s) APENAS a(s) sentença(s): 
(A) I. 
(B) I e III. 
(C) III. 
(D) II. 
(E) I e II. 
 
Resposta: 
 A alternativa I está incorreta pois quanto maior R² maior a soma de quadrados devido a 
regressão 
 A alternativa II está incorreta visto que SQRes= SQT pode ser igual 
 A alternativa III está correta pois R² =SQR > R² SQS portanto R² será maior que 50% 
 
 
11. (P2 2008.1) Com base nos resultados do teste dos coeficientes de um modelo de regressão 
qualquer, apresentados na tabela a seguir gerada pelo software Excel, pode-se concluir que: 
 
Coeficientes 
Erro-
padrão 
Stat t 
Valor-
P 
95% 
inferiores 
95% 
superiores 
Interseção - 186,07 63,95 - 2,91 0,10 - 461,23 89,08 
Variável X1 0,42 0,06 7,35 0,02 0,17 0,66 
 
(A) o modelo não se ajusta aos dados para α = 0,05. 
(B) o coeficiente de inclinação não é significativo para α = 0,05. 
(C) 42% da variação da variável dependente são explicados pela variável independente. 
(D) o intercepto e o coeficiente angular são significativos para α = 0,05. 
(E) o intercepto não é significativo para α = 0,05. 
 
Resposta: 5% pelo fato de ser 95% superior e 95% inferior. 
12. (P2 2014.1) São premissas de um modelo de regressão linear múltipla: 
(A) Normalidade da variável dependente e heterocedasticidade das variáveis independentes. 
(B) Variáveis independentes altamente correlacionadas e normalidade dos resíduos. 
(C) Variável dependente qualitativa e homocedasticidade dos resíduos. 
(D) Normalidade e homocedasticidade dos resíduos. 
(E) Correlação e normalidade dos resíduos. 
 
Resposta: Normal e homocedásticidade dos resíduos 
 
 
13. (PS 2016.1) São premissas que precisam ser satisfeitas para que a regressão linear múltipla 
seja válida: 
(A) homocedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. 
(B) homocedasticidade dos resíduos, normalidade da variável dependente e independência dos 
resíduos. 
(C) homocedasticidade das variáveis dependentes, normalidade dos resíduos e independência 
dos resíduos. 
(D) homocedasticidade das variáveis independentes, normalidade dos resíduos e dependência 
dos resíduos. 
(E) homocedasticidade dos resíduos, distribuição-t das variáveis dependentes e independência 
dos resíduos. 
 
Resposta: homocedasticidade dos resíduos, normalidade dos resíduos e independência dos 
resíduos. 
 
14. (P2 2012.2) São premissas que precisam ser satisfeitas para que a regressão linear múltipla 
seja válida: 
(A) homoscedasticidade dos resíduos, normalidade da variável dependente e independência do 
resíduo. 
(B) homoscedasticidade das variáveis independentes, normalidade da variável dependente e 
independência das variáveis independentes. 
(C) homoscedasticidade da variável dependente, normalidade dos resíduos e independência das 
variáveis independentes. 
(D) homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. 
(E) homoscedasticidade das variáveis independentes e normalidade da variável dependente. 
 
Resposta: homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos 
resíduos. 
 
 
15. (P2 2016.2) Na construção de um modelo de regressão múltipla, as seguintes premissas 
deverão ser observadas: 
(A) independência, normalidade dos resíduos e homocedasticidade dos resíduos. 
(B) somente independência e normalidade dos resíduos. 
(C) somente normalidade dos resíduos e homocedasticidade dos resíduos. 
(D) dependência, normalidade dos resíduos e homocedasticidade dos resíduos. 
(E) independência, normalidade dos resíduos e heterocedasticidade dos resíduos. 
 
Resposta: independência, normalidade dos resíduos e homocedasticidade dos resíduos. 
16. (P2 2012.1) Podemos usar uma variável em um modelo de regressão quando desejamos 
incluir certo tipo de variável no modelo. Suponha que desejamos estudar os fatores que 
podem influenciar as notas dos alunos do ensino fundamental. Qual das variáveis a seguir 
pode ser representada por uma dummy? 
(A) Idade do aluno. 
(B) Anos de estudo dos pais. 
(C) Média de anos de experiência dos professores. 
(D) Se o aluno tem computador em casa. 
(E) Média das notas do aluno nas séries anteriores. 
 
Resposta: As demais alternativas estão erradas pois não apresentam uma relação que cause 
efeito na questão. 
 
17. (P2 2016.1) Analise as seguintes sentenças: 
I) Em um modelo de regressão linear múltipla, a rejeição da hipótese nula da ANOVA indica que 
pelo menos uma das médias populacionais é diferente das demais. 
II) Em um teste t para a inclinação de um modelo de regressão, quanto maior a estatística t 
maior o valor-p do teste. 
III) Os betas estimados são obtidos por meio da minimização dos valores previstos do modelo. 
IV) Se uma variável qualitativa tem três categorias, é necessário criar duas variáveis dummy 
para incluí-la em um modelo de regressão. 
Está (ão) INCORRETA(S) APENAS a(s) sentença(s): 
(A) I e II. 
(B) I, III e IV. 
(C) II e IV. 
(D) I, II e III. 
(E) I e III. 
 
Resposta: As alternativas incorretas são: 
 I – São as variâncias e não a média 
 II – Quanto maior o t, menor será o p 
 III – Está errado 
 IV – Está correto 
18. (P2 2016.1) Analise os gráficos de dispersão a seguir: 
 
Se um modelo de regressão múltipla for estimado tendo com variável dependente o salário 
mensal e variáveis independentes como experiência e escolaridade, provavelmente: 
(A) as variáveis escolaridade e experiência seriam significantesestatisticamente. 
(B) a variável escolaridade em anos seria significante estatisticamente. 
(C) as variáveis salário, escolaridade e experiência seriam significantes estatisticamente. 
(D) a variável experiência seria significante estatisticamente. 
(E) nenhuma das duas variáveis seria significante estatisticamente. 
 
Resposta: a variável escolaridade tem relação em anos seria significante estatisticamente. 
 
19. (PS 2012.1) Um estatístico está realizando um estudo para tentar prever a influência das 
variáveis X1 – idade (em anos completos) – e X2 − nível de escolaridade (em anos 
completos), no número médio de livros que um indivíduo lê por ano (Y). Entretanto, antes de 
estimar o modelo e obter uma equação de previsão, o estatístico gerou alguns gráficos para 
analisar os dados disponíveis. Os gráficos produzidos são apresentados a seguir: 
 
Com base nos gráficos apresentados, pode-se afirmar que: 
(A) A variável X1 provavelmente ajuda a explicar a variabilidade da variável dependente Y, pois 
está negativamente relacionada com ela. 
(B) A variável X2 não ajuda a explicar a variabilidade da variável dependente Y, pois não está 
relacionada com ela. 
(C) Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y, pois 
estão positivamente relacionadas com ela. 
(D) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base 
nos gráficos apresentados, pois as variáveis utilizadas se constituem como variáveis Dummy. 
(E) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base 
apenas nos gráficos apresentados, sem que outras medidas de estatística descritiva sejam 
analisadas. 
 
Resposta: Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y, 
pois estão positivamente relacionadas com ela. 
 
 
20. (FGV PS 2012.2) O proprietário de uma livraria de pequeno porte, diante de um recente 
aumento na ocorrência de roubos de livros em seu empreendimento, contratou um consultor 
para realizar uma pesquisa que aponte quais são as principais variáveis que tornam os furtos 
mais prováveis. A partir do resultado, pretende adotar uma nova maneira de dispor os livros 
na livraria, de forma a evitar futuros furtos. Para tal, o consutor teve acesso às sequintes 
informações: 
1 (X1)– Preço do livro ( em reis); 
2 (X2)– Número de páginas do livro; 
3-Área de conhecimento abordado pelo livro (1- Psicologia (X3); 2- Direito (X4); 3- Economia(X5); 
4- Literatura (X6); 5- Estatística(X7)). Com os dados disponíveis, o consultor realizou uma 
regressão e chegou à seguinte equação: 
 
Se quisermos representar a variável “área de conhecimento abordada pelo livro” tomando como 
variável dummy de referência literatura (X6), como ficaria a nova equação: 
a) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 
b) Y= 4 +1,01 X1 + 0,003 X2 – 2 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 
c) Y= 3,3 +3,01 X1 + 0,010 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 
d) Y= 4 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,5 X4 – 0,9 X5 + 1,0 X7 
e) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,3 X3 – 0,38 X4 – 3,0 X5 + 0,7 X7 
Resposta: 
 *, ( )- , - , - , ( ) - , ( ) -
 , ( ) - , ( ) -+ 
 
 
21. (P2 2014.1) Dois modelos de regressão múltipla foram estimados e representados 
graficamente a seguir. Sabe-se que uma variável independente quantitativa e outra qualitativa 
foram consideradas na estimação dos modelos. Além disso, a variável dependente é a 
mesma nos dois modelos. 
 
As equações que melhor representam os modelos apresentados nos gráficos são 
respectivamente: 
(A) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 +  
(B) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 +  
(C) M1:Y = 1X1 + 2X2 + 3X3 + ; M2:Y = 1X1 + 2X2 +  
(D) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 + 2X2 +  
(E) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 + 3X3 +  
 
Resposta: 
 𝑀 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. 
(P2 2014.2) O gerente de uma rede de lojas de departamento estava interessado em 
compreender quais variáveis explicam a variabilidade das vendas de seus vendedores. Para 
isso, contratou um estatístico que coletou dados de uma amostra de 126 vendedores e estimou o 
seguinte modelo de regressão múltipla. 
 
Em que: 
 Idade = idade do vendedor em anos; Experiência = anos de experiência como vendedor; 
 Capital = assume valor 1 se o vendedor é de uma loja da capital e 0 de uma loja do interior; 
 Eletro = assume valor 1 se o vendedor atua na seção de eletroeletrônicos e 0 caso atue na 
seção de vestuário ou esportes; 
 Vestuário = assume valor 1 se o vendedor atua na seção de vestuário e 0 caso atue na seção 
de eletroeletrônicos ou esportes; 
 Esporte = assume valor 1 se o vendedor atua na seção de esportes e 0 caso atue na seção 
de eletroeletrônicos ou vestuário. 
 
22. As variáveis independentes incluídas no modelo explicam quantos % da variabilidade das 
vendas? 
(A) 5,4%. 
(B) 25,4%. 
(C) 57,4%. 
(D) 74,5%. 
(E) 82,4%. 
 
Resposta: 
 
 
 
 
23. Um dos diretores da empresa suspeitava que as vendas médias dos vendedores do interior 
eram maiores. Há evidências que comprovem essa suspeita? 
(A) Não, uma vez que o erro-padrão da variável Capital é muito elevado, o que torna a variável 
não significante estatisticamente. 
(B) Não, uma vez que o coeficiente da variável Capital é negativo. 
(C) Não, embora a variável apresente significância estatística, o R2 desse modelo é praticamente 
nulo. 
(D) Sim, uma vez que a variável Capital apresenta significância estatística e, em média, um 
vendedor da capital vende R$7.571,00 a menos que os vendedores do interior. 
(E) Sim, uma vez que, em média, um vendedor da capital vende R$1.275,00 a menos que os 
vendedores do interior. 
 
Resposta: O vendedor da capital vende 7571 a menos do que o vendedor do interior. O valor de 
p < 0,05 
 
24. Existe diferença nas vendas médias entre os departamentos de eletroeletrônicos, vestuário e 
esportes? 
(A) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$368,00 a 
menos que os vendedores do departamento de esportes (valor-p < 5%). 
(B) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$864,00 a 
mais que os vendedores do departamento de esportes (valor-p > 5%). 
(C) Sim, os vendedores do departamento de vestuário vendem, em média, R$864,00 a menos 
que os vendedores do departamento de esportes (valor-p < 5%). 
(D) Não, as variáveis Eletro e Vestuário não são significantes (valores-p > 5%), ou seja, não 
existem diferenças nas médias de vendas entre departamentos. 
(E) Não, a variável Eletro não é significante (valor-p > 5%), ou seja, não existem diferenças na 
média de vendas entre departamentos. 
 
Resposta: Não, pois os valores de p são > 0,05. 
 
25. Tendo em vista a interpretação dos coeficientes das variáveis Idade e Experiência dos 
vendedores, é correto afirmar que o aumento de um ano de idade implica: 
(A) um aumento médio de R$491mil nas vendas, mantendo as outras variáveis constantes. Um 
ano a mais de experiência incrementa, em média, R$961 mil nas vendas, mantendo as outras 
variáveis constantes. 
(B) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes. Um ano 
a mais de experiência incrementa, em média, R$961 nas vendas, mantendo as outras 
variáveis constantes. 
(C) um aumento médio de 49,1% nas vendas, mantendo as outras variáveis constantes. Um ano 
a mais de experiência incrementa, em média, 96,1% nas vendas, mantendo as outras 
variáveis constantes. 
(D) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes.Um ano 
a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras variáveis 
constantes. 
(E) uma redução média de R$491 nas vendas, mantendo as outras variáveis constantes. Um 
ano a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras 
variáveis constantes. 
 
Resposta: 1 ano de idade aumenta R$491,00 na venda e 1 de experiência aumenta R$961,00. 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES. 
(P2 2014.1) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os 
efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em mil 
R$) dos agricultores familiares. Nas regiões Sul e Sudeste do Brasil, a pesquisa entrevistou um 
grupo de agricultores que utilizou e outro que não utilizou ATER no ano de 2013. A consultoria 
contratada pelo governo apresentou o seguinte modelo de regressão em seu relatório: 
Modelo gl SQ MQ F 
F de 
significação 
Regressão 2 6777 3389 5,52 0,01 
Residual 47 28834 613 
 
Total 49 35611 
 
 
Coeficientes 
Erro 
padrã
o 
Stat t 
Valor-
P 
95% 
inferior
es 
95% 
superior
es 
Interseção 211 6,53 32,40 0,000 198,3 224,6 
ATER 22 7,08 3,09 0,003 7,7 36,1 
SUL - 6 7,06 - 0,83 0,408 - 20,1 8,3 
Variável dependente: Receita total com a produção agropecuária (em mil R$) no ano de 2013. F 
= 5,52, valor-p = 0,01. Obs: todas as premissas do modelo foram respeitadas. 
Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na produção e 
0 caso contrário; SUL assume valor 1 para propriedades do Sul e 0 se localizada na região 
Sudeste. 
26. Com base no modelo estimado e considerando um nível de significância de 5%, pode-se 
concluir que: 
(A) O governo federal não deveria financiar um programa de ATER, uma vez que não é 
significante estatisticamente para explicar receita total do agricultor. 
(B) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a 
variável explica apenas 1% da variância da receita total do agricultor. 
(C) O governo federal deveria financiar um programa de ATER. Além de ser significante 
estatisticamente, a ATER incrementa a receita total do agricultor em R$22 mil, em média. 
(D) A receita total do grupo de agricultores que utilizaram assistência técnica é de R$22 mil. 
(E) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a 
variável SUL tem um efeito maior na explicação da receita total dos agricultores. 
 
Resposta: P < 0,05 e 22 x 1000 = R$22.000 
 
27. Qual o valor e a interpretação do R2 deste modelo? 
(A) R2 = 39%. A variável ATER explica 39% da variância da receita total com a produção 
agropecuária (em mil R$) no ano de 2013. 
(B) R2 = 30%. As variáveis ATER e SUL explicam 30% da média da receita total com a produção 
agropecuária (em mil R$) no ano de 2013. 
(C) R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com a 
produção agropecuária (em mil R$) no ano de 2013. 
(D) R2 = 81%. As variáveis ATER e SUL explicam 81% da mediana da receita total com a 
produção agropecuária (em mil R$) no ano de 2013. 
(E) R2 = 19%. As variáveis dependentes incluídas no modelo explicam 19% da variância da 
receita total com a produção agropecuária (em mil R$) no ano de 2013. 
 
Resposta: R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com 
a produção agropecuária (em mil R$) no ano de 2013. 
 
 
 
 
 
 
 
28. Com base na equação estimada, qual é a receita total com a produção agropecuária de um 
agricultor sem ATER que reside na região Sudeste? 
(A) R$205 mil 
(B) R$211 mil 
(C) R$227 mil 
(D) R$252 mil 
(E) R$276 mil 
 
Resposta: 
 ( ) ( ) 
 
 
29. (P2 2014.2) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os 
efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em 
mil R$) dos agricultores familiares. A pesquisa entrevistou um grupo de agricultores que 
utilizou e outro que não utilizou ATER no ano de 2013. A consultoria contratada pelo governo 
apresentou o seguinte modelo de regressão em seu relatório: 
 
Coeficientes 
Erro 
padrão 
Stat t 
Valor-
P 
95% 
inferiores 
95% 
superiores 
Interseção 211 6,53 32,40 0,000 198,3 224,6 
ATER 22 7,08 3,09 0,003 7,7 36,1 
 
Variável dependente: Receita Total com a produção agropecuária (em mil R$) no ano de 
2013.Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na 
produção e 0 caso contrário. O governo federal irá incrementar os recursos para o financiamento 
de ATER se a receita total dos agricultores que utilizaram ATER for pelo menos 5% maior na 
receita total dos agricultores que não utilizaram ATER. Com base nas informações disponíveis, é 
correto afirmar que o governo: 
(A) não deve incrementar os recursos, uma vez que a variável ATER não é significante 
estatisticamente. 
(B) não deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita 
total com a produção agropecuária 3,09% maior, em média. 
(C) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total 
com a produção agropecuária 10,4% maior, em média. 
(D) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total 
com a produção agropecuária 22%% maior, em média. 
(E) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total 
com a produção agropecuária 36,1% maior, em média. 
 
Resposta: deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma 
receita total com a produção agropecuária 10,4% maior, em média. 
 
 
30. (P2 2018.2) Um analista precisa incorporar, a um modelo de regressão, uma variável 
qualitativa para representar o estado civil da pessoa. A variável poderá assumir os seguintes 
valores: casado, solteiro, viúvo, separado e outros. Nesse caso, é correto afirmar que o 
número de variáveis “dummy” a serem utilizadas é igual a: 
(A) 5. 
(B) 4. 
(C) 8. 
(D) 3. 
(E) 10. 
 
Resposta: 5 – 1 = 4 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. 
(P2 2018.2) Com o auxílio do Excel, uma empresa de telefonia criou um modelo de regressão 
múltipla relacionando as variáveis FATURAMENTO (em milhões de R$) e seus 
INVESTIMENTOS em Propaganda (PROP) e em Tecnologia (TEC) (ambos em milhares de R$). 
O relatório gerado pelo aplicativo de planilhas eletrônicas foi o seguinte: 
 
31. Com vista nesses dados, a porcentagem de explicação da variabilidade do faturamento da 
empresa pelos investimentos em propaganda e tecnologia é, aproximadamente, de: 
(A) 7,5% 
(B) 3,7%. 
(C) 86%. 
(D) 48%. 
(E) 29%. 
 
Resposta: 
 
 
 
32. Caso decida fazer um investimento adicional de R$1 mil em propaganda, mantendo 
constante o investimento em tecnologia, a empresa verá seu faturamento: 
(A) aumentar em cerca de R$3,7 milhões. 
(B) diminuir em cerca de R$465 milhões. 
(C) cair em cerca de R$5,3 milhões. 
(D) diminuir em cerca de R$3,7 milhões. 
(E) aumentar em cerca de R$5,3 milhões. 
 
Resposta: aumentar em cerca de R$3,7 milhões. 
 
 
 
 
33. Caso a empresa decida não investir nada em propaganda e em tecnologia, o faturamento 
deverá ser, em média, de aproximadamente: 
(A) R$370 milhões. 
(B) R$465 milhões. 
(C) R$570 milhões. 
(D) R$163 milhões. 
(E) R$533 milhões. 
 
Resposta: 
 ( ) ( ) 
 
 
34. Caso a direção da empresa decida investir R$85 mil em propaganda e R$90 mil em 
tecnologia, o valor esperado para o faturamento da empresa será de, aproximadamente: 
(A) R$665 milhões. 
(B) R$927 milhões. 
(C) R$465 milhões. 
(D) R$147 milhões. 
(E) R$314 milhões. 
 
Resposta: O valor esperado parao faturamento da empresa será de, aproximadamente: 
 ( ) ( ) 
 
 
35. (PS 2018.2) Ao construir um modelo de regressão, um analista adicionou uma variável 
qualitativa que possuía 3 categorias. É correto dizer que, para representar essa variável 
qualitativa, o número de variáveis “dummy” necessárias é igual a: 
(A) 3. 
(B) 1. 
(C) 4. 
(D) 5. 
(E) 2. 
 
Resposta: 
 
 
 
 
 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. 
(PS 2018.2) A direção de uma corretora de valores pediu que seu analista desenvolvesse uma 
regressão que explicasse o valor total das aplicações financeiras de seus clientes (em milhares 
de R$) em função da sua renda mensal declarada (em milhares de R$) e de uma variável 
qualitativa que representasse seu estado civil (solteiro = 1; outros = 0). O modelo de regressão 
foi calculado por uma planilha Excel, e um extrato do relatório emitido pela planilha consta a 
seguir: 
 
36. Com base nesses dados, é correto afirmar que, em média, o valor das aplicações de um 
cliente solteiro é aproximadamente: 
(A) R$3.700,00 maior do que o de um cliente que não seja solteiro. 
(B) R$31.700,00 maior do que o de um cliente que não seja solteiro. 
(C) R$10.900,00 maior do que o de um cliente que não seja solteiro. 
(D) R$3.700,00 menor do que o de um cliente que não seja solteiro. 
(E) R$16.100,00 maior do que o de um cliente que não seja solteiro. 
 
Resposta: R$3.657 a mais que o não solteiro ⩭ 3.700, maior do que o de um cliente que não 
seja solteiro. 
 
 
37. Com base nesses dados, um acréscimo de R$1.000,00 na renda mensal declarada de um 
cliente, mantidas constantes as demais variáveis, ocasionará nas suas aplicações, em média: 
(A) um aumento de R$16.500,00. 
(B) uma diminuição de R$27.400,00. 
(C) um aumento de R$3.700,00. 
(D) uma diminuição de R$20.100,00. 
(E) uma diminuição de R$16.500,00. 
 
Resposta: 
 
 
 
38. É correto afirmar que a variabilidade do valor das aplicações realizadas por um cliente nessa 
corretora é explicado pela renda mensal declarada e pelo estado civil em, aproximadamente: 
(A) 11%. 
(B) 74%. 
(C) 10%. 
(D) 92%. 
(E) 96%. 
 
Resposta: 
 
 
 
 
 
 
39. Considere α = 0,05 para o teste de significância utilizado para se verificar a significância da 
relação entre o valor da aplicação e a renda mensal declarada. Em face dos dados 
apresentados no relatório emitido pela planilha Excel, é correto afirmar que: 
(A) a relação entre o valor da aplicação e a renda declarada não é significante, pois o coeficiente 
da variável RENDA, igual a 16,51376, é maior do que α = 0,05. 
(B) a relação entre o valor da aplicação e a renda declarada não é significante, pois o erro 
padrão da variável RENDA, igual a 2,16828, é maior do que α = 0,05. 
(C) a relação entre o valor da aplicação e a renda declarada é significante, pois o valor p da 
variável RENDA, igual a 0,000267, é menor do que α = 0,05. 
(D) a relação entre o valor da aplicação e a renda declarada não é significante, pois o valor p da 
variável RENDA, igual a 0,000267, é menor do que α = 0,05. 
(E) a relação entre o valor da aplicação e a renda declarada não é significante, pois o stat t da 
variável RENDA, igual a 7,616063, é maior do que α = 0,05. 
 
Resposta: Valor -p = 0,0002 < 0,05, a relação entre o valor da aplicação e a renda declarada é 
significante, pois o valor p da variável RENDA, igual a 0,000267, é menor do que α = 0,05. 
 
 
40. (ENADE 2018) Com o objetivo de entender o impacto das internações causadas pela falta de 
saneamento básico, um pesquisador estimou o modelo apresentado na tabela a seguir, 
usando a quantidade de dias de internação de uma amostra de 7 260 pacientes do Sistema 
Único de Saúde como variável explicada. As variáveis explicativas são: (i) gênero do 
paciente, binária em que é 1 é utilizado para identificar as mulheres e 0 para identificar os 
homens; (ii) idade do paciente em anos de vida; e (iii) motivo da internação, também binária, 
em que recebe o valor 1 para identificar internações que são causadas por problemas de 
saneamento básico e o valor 0 para as demais internações. 
 
Considerando as informações apresentadas, assinale a opção correta. 
(A) O coeficiente R-quadrado encontra-se abaixo de 30%, o que significa que o modelo deve ser 
descartado. 
(B) As internações causadas pela deficiência de saneamento básico tendem a gerar um aumento 
de 1,96% nos gastos de saúde. 
(C) A média de dias de internação para mulheres é estatisticamente maior que a de internação 
para homens. 
(D) A variável idade não é estatisticamente significativa para explicar o número de dias de 
internação. 
(E) O teste F mostra que as variáveis explicativas conjuntamente são estatisticamente 
significativas para explicar o número de dias de internação. 
 
Resposta: Valor -p < 0,05