Buscar

Estatística II - Lista 8 MODELO REGRESSÃO LINEAR

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

MODELO REGRESSÃO LINEAR 
 
1. (PS 2014.1) Qual das informações a seguir corresponde à equação de uma reta de regressão 
simples e qual (is) é(são) o(s) coeficiente(s) necessário(s) para gerar tal equação, 
respectivamente? 
(A) y = Log(2x – 1). São necessários os coeficientes de inclinação e de intercepto. 
(B) y = 3x – e2x. São necessários os coeficientes de intercepto e de inclinação. 
(C) y = 32,4 + 2,15x. São necessários os coeficientes de inclinação e de intercepto. 
(D) y = 5x – 1. É apenas necessário o coeficiente de intercepto, pois o coeficiente de inclinação é 
optativo. 
(E) y = 32,4. É apenas necessário o coeficiente de inclinação, pois o coeficiente de intercepto é 
optativo. 
 
Resposta: 
Inclinação: y = 32,4 + 2,15x e Intercepto: 32,4. Portanto os dois são apresentados. 
 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 
 
2. (PS 2016.2) A função de regressão linear simples permite se estimar o custo mensal (em 
reais) com transporte dos funcionários de uma indústria em função de distância ( em 
quilômetros) existe entre a residência e a fábrica é assim expressa Y= 28,71 + 1,51 X . O custo 
mensal estimado com transporte de um funcionário que reside a 20km da fábrica é de 
aproximadamente: 
 
(A) R$69,00 
(B) R$30,00 
(C) R$32,00 
(D) R$59,00 
(E) R$29,00 
 
Cálculo: 
 ( ) 
Resposta: portanto o custo mensal estimado com transporte de um funcionário que reside a 
20km da fábrica é de R$59,00. 
 
3. Para cada km a mais na distância entre a residência do funcionário e a fábrica, é correto 
afirmar que o custo mensal estimado com o transporte desse funcionário: 
(A) não ocasiona alteração no custo mensal. 
(B) aumenta R$28,71. 
(C) aumenta R$1,51. 
(D) diminui R$1,51. 
(E) diminui R$28,71. 
Resposta: 1.51 multiplica a variável x, logo, a cada km a mais irá aumentar 1,51 
 
4. O custo mensal estimado com o transporte de um funcionário que resida a 0 km da fábrica é 
de: 
(A) R$0,00. 
(B) R$27,20. 
(C) R$30,22. 
(D) R$28,71. 
(E) R$1,51. 
 
Cálculo: 
 ( ) 
Resposta: O custo mensal estimado com o transporte de um funcionário que resida a 0 km da 
fábrica é de R$28,71 
 
 
5. (P2 2010.2) A função que melhor representa o comportamento do lucro de uma empresa 
relativo ao quantitativo de colaboradores é: Y = 60 - 1,5x. A quantidade limite de colaboradores 
que a empresa deve possuir para não ter lucro é de: 
(A) 60 
(B) 61,5 
(C) 15 
(D) 40 
(E) 58,5 
 
 
Cálculo: 
 
 
 
 
 
 
 
Resposta: A quantidade limite de colaboradores que a empresa deve possuir para não ter lucro 
é de 40. 
 
 
6. (FGV PS 2014.1) Um professor de estatística deseja utilizar o número de horas que um aluno 
estuda para uma prova final de estatística (x1) para prever a nota da prova final numa escala de 
0 a 100 (Y).Foi ajustado um modelo de regressão com base nos dados coletados 
(aleatoriamente) de uma classe durante o semestre anterior. O modelo ajustado foi: Y= 35 + 
3X1. Qual é a interpretação, respectivamente, do intercepto (b0) e para a inclinação (b1) da 
equação estimada ¿ 
 
(A) Alunos que estudam para a prova obtêm, em média, uma nota 38 na prova final. É previsto 
que o resultado para a prova final cresça, em média, 3 pontos para cada hora de aumento no 
tempo de estudo. 
(B) Alunos que não estudam para a prova obtêm, em média, uma nota 35 na prova final. É 
previsto que o resultado para a prova final cresça, em média, 3 pontos para cada hora de 
aumento no tempo de estudo. 
(C) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto 
que o resultado para a prova final cresça 35 pontos, em média, para cada hora de aumento 
no tempo de estudo. 
(D) Alunos que não estudam para a prova obtêm, em média, uma nota 3 na prova final. É 
previsto que o resultado para a prova final cresça 35 pontos, em média, para cada hora de 
aumento no tempo de estudo. 
(E) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto 
que o resultado para a prova final cresça , em média, 38 pontos,para cada hora de aumento 
no tempo de estudo. 
 
Cálculo: 
 ( ) 
 
Resposta: Portanto 35 sendo a constante e 3 a variável do X (prova final) Alunos que não 
estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto que o resultado 
para a prova final cresça, em média, 3 pontos para cada hora de aumento no tempo de estudo. 
 
 
 
7. (FGV PS 2010.1) Foi realizado um estudo para estimar a relação linear entre as variáveis 
Preço (Y), em reais, e demanda por um produto (X), em unidades. O modelo de regressão linear 
ajustado aos dados Y = 31,31 + 1,65X. Esse modelo passou no teste ANOVA, suas premissas 
foram observadas e nenhum valor extremo ou influente foi observado. Nessas circunstâncias, é 
possível afirmas que: 
 
(A) O aumento de uma unidade demanda desse produto faz com que seu preço aumente 
R$31,31 
(B) O aumento de uma unidade demanda desse produto faz com que seu preço aumente R$1,65 
(C) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$1,65 
(D) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$31,31 
(E) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$32,96 
 
Resposta: a inclinação é R$1,65, logo a cada aumento de X em unidade o preço subirá R$1,65. 
 
8. (FGV OS 2014.2) Um modelo de regressão linear simples teve como variável dependente as 
vendas em um ano de uma amostra de 1.000 vendedores, mensurada em R$, e como variável 
independente, a variável X1 , que assume valor 1 quando o vendedor é o sexo masculino e zero 
quando contrário. A equação estimada foi: Y=15.000 – 2.500 X1 
Com base na equação estimada, é correto concluir que um vendedor o sexo: 
(A) Masculino vendeu, em média, R$2.500,00 a menos que um vendedor do sexo feminino. 
(B) Masculino vendeu, em média, R$17.2500,00 a menos que um vendedor do sexo feminino. 
(C) Feminino vendeu, em média, R$12.250,00 a mais que um vendedor do sexo masculino. 
(D) Feminino vendeu, em média, R$15.000,00 a menos que um vendedor do sexo masculino. 
(E) Feminino vendeu, em média, R$17.250,00 a menos que um vendedor do sexo masculino. 
 
Cálculo: 
 
 ( ) 
Resposta: Masculino (1), em média, R$2.500,00 a menos que um vendedor do sexo feminino. 
 
 
9. (P2 2012.1) A tabela a seguir indica as quantidades produzidas de um certo insumo agrícola e 
seus respectivos custos de produção. 
Quantidade (kg) 10 25 50 80 90 
Custo total (US$) 150 290 540 840 900 
 
Se a reta de mínimos quadrados que se ajusta aos dados é representada pela equação Y= 
55,29 + 9,58x, então podemos dizer que o valor mais provável para o custo fixo é: 
(A) 9,58. 
(B) 64,87. 
(C) 45,71. 
(D) 32,44. 
(E) 55,29. 
 
Resposta: Custo fixo = intercepto= 55,29. 
 
10. (PS 2016.1) A fábrica Porto Print analisou os custos totais de produção de determinadas 
quantidades de seu principal produto, que é o cartucho de impressora jato de tinta na cor preta, 
considerando cinco observações independentes, conforme a tabela a seguir: 
Quantidades Custos totais (R$) 
10 100 
20 230 
30 270 
40 410 
50 490 
 
Com base nas informações acima, o valor do custo variável e do custo fixo, em reais, é 
respectivamente: 
(A) 9,60 e 12,00. 
(B) 9,50 e 13,00. 
(C) 9,00 e 15,00. 
(D) 10,00 e 14,00. 
(E) 8,00 e 11,00. 
 
Memória de Cálculo: 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 
]
 (
 
 
)
 
 
 
 
 
∑ 
 
 (
∑ 
 
) ( ) 
Resposta: O valor do custo variável é $ 9,6 e do custo fixo $12 
 
11. (PS 2014.1) As informações contidas na tabela a seguir foram cedidas pelo gerente de uma 
rede de lojasque atua no mercado automotivo com a comercialização de peças para reparos. O 
gerente deseja determinar a relação entre o número de comerciais de rádio divulgados nos fins 
de semana e as vendas nas lojas durante a semana seguinte. Os dados foram coletados durante 
dez finais de semanas e os valores das vendas estão expressos em um (1) por dez mil R$ 
(10.000,00). 
Semana 
Número de comerciais 
(X) 
Volume de vendas 
(Y) 
1ª 2,0 5,00 
2ª 5,0 5,70 
3ª 1,0 4,10 
4ª 3,0 5,40 
5ª 4,0 5,40 
6ª 1,0 3,80 
7ª 5,0 6,30 
8ª 3,0 4,80 
9ª 4,0 5,90 
10ª 2,0 4,60 
Os valores a seguir foram obtidos a partir da tabela acima: n = 10; Σx = 30; Σy = 51; Σxy = 162,9; 
Σx2 = 110; Σy2 = 265,76; (Σx)2 = 900 e (Σy)2 = 2601. Nesse contexto e com base nas informações 
disponíveis, pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação: 
(A) 0,495x + 3,615 
(B) 0,490x + 3,615 
(C) 0,495x + 3,610 
(D) 0,495x + 3,625 
(E) 0,485x + 3,635 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 ]
 
 
 
 
 
 
 
 
 
 
 (
∑ 
 
) 
 
 
 ( 
 
 
) 
Resposta: pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação 
0,495.x + 3,615 
12. (P2 2010.2) Um aluno de uma Faculdade de Administração precisa fazer um controle do 
número de cachorros-quentes vendidos na lanchonete de sua faculdade em função do número 
de refrigerantes vendidos. Para isso, levantou informações sobre o número de vendas/semana 
de refrigerantes e a quantidade vendida de cachorros-quentes. Após coleta das informações, 
durante o período de cinco semanas, obteve os resultados apresentados na tabela abaixo: 
Número de refrigerantes vendido/semana Número de cachorros-quentes vendidos/semana 
30 20 
45 30 
50 40 
42 29 
60 40 
 
Considere que: Σx = 227; Σy = 159; Σxy = 7568 e Σx2 = 10789 A equação linear que 
representa esse conjunto de dados, tal que y = a + bx, é: 
(A) y = -1,03 + 0,72x 
(B) y = -1,03 - 0,72x 
(C) y = 1,80 - 1,82x 
(D) y = -1,80 - 1,82x 
(E) y = 1,93 - 0, 22x 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 
]
 
 
 
 
 
 
 
 
∑ 
 
 (
∑ 
 
) 
 
 
 ( 
 
 
) 
 
Resposta: A equação linear que representa esse conjunto de dados, tal que y = a + bx, é – 1,03 
+ 0,72x 
 
 
 
13. (P2 2012.1) Os dados a seguir correspondem à renda familiar e ao custo com alimentação 
de uma pesquisa realizada com seis famílias de uma cidade do interior do estado de São Paulo. 
Renda familiar (X) Custo com alimentação (Y) 
R$ 1.920,00 R$ 1.080,00 
R$ 2.670,00 R$ 1.830,00 
R$ 1.840,00 R$ 1.190,00 
R$ 2.580,00 R$ 1.536,00 
R$ 3.200,00 R$ 1.960,00 
R$ 2.500,00 R$ 1.696,00 
 
A equação da reta de regressão estimada do custo com alimentação (Y) em função da renda 
familiar (X) é mais próxima de: 
(A) Y = 0,6571.X – 62,3235. 
(B) Y = 0,6571.X + 62,3235. 
(C) Y = – 0,6571.X – 62,3235. 
(D) Y = 1,6571.X + 62,3235. 
(E) Y = 1,6571.X – 62,3235. 
 
Memória de Cálculo: 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 ]
 
 
 
 
 
 
 
 
∑ 
 
 (
∑ 
 
) 
 
 
 ( 
 
 
) 
Resposta: A equação linear que representa esse conjunto de dados, tal que y = bx +a, é 
0,6571X – 62,41 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 
14. (FGV OS 2014.1) A função de regressão linear simples permite estimarmos o custo com 
saúde (em R$) (Y) como função da renda per capita familiar (em R$)(X). A equação de 
regressão pode ser expressa da seguinte maneira: Y= 28,8 + 0,07X 
Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita familiar fará 
com que a família tenha seu gasto com saúde: 
 
(A) Aumentado, em média, R$28,8 
(B) Diminuindo, em média, R$28,8 
(C) Aumentado, em média, R$0,07 
(D) Diminuindo, em média, R$0,70 
(E) Aumentando, em média, R$0,70 
 
Cálculo: 
 
 
Resposta: Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita 
familiar fará com que a família tenha seu gasto com saúde aumentando, em média R$0,70 
 
15. O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será: 
(A) R$ 320,25 
(B) R$ 196,80 
(C) R$ 258,00 
(D) R$ 297,50 
(E) R$ 160,00 
 
Cálculo: 
 
 
Resposta: O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será 
R$196,8. 
 
 
16. (PS 2010.2) Um extrato do estudo sobre o gasto mensal com educação realizado em famílias 
da classe “A”, em função do número de filhos, é apresentado a seguir: 
Número de filhos Gasto mensal (em reais) 
2 3.500,00 
3 4.000,00 
1 1.500,00 
6 8.000,00 
8 10.000,00 
 
Considerando: Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114 
então, se um casal está planejando ter outro filho, o valor estimado do acréscimo de gasto 
mensal com educação dos filhos é de: 
(A) R$ 2.000,00 
(B) R$ 1.190,00 
(C) R$ 635,00 
(D) R$ 2.500,00 
(E) R$ 800,00 
 
Memória de Cálculo: 
Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114 n = 5 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 
]
 
 
 
 
 
 
 
Resposta: O valor estimado do acréscimo de gasto mensal com educação dos filhos é de 
R$1.190,00 
 
 
17. (P2 2010.1) Ao examinar as estatísticas de um modelo de regressão linear simples, entre as 
variáveis venda de um produto (Y) e a renda dos consumidores (X), a variação total é igual a 2,5 
e a variação devida a outros fatores é igual a 0,1. Assim, é possível concluir que: 
(A) O coeficiente de correlação linear entre as variáveis é igual a 0,04. 
(B) O coeficiente de correlação linear entre as variáveis é igual a 0,96. 
(C) 98% da variação total da renda dos consumidores podem ser explicados pela variável 
volume de vendas. 
(D) 96% da variação total do volume de vendas podem ser explicados pela variável renda dos 
consumidores. 
(E) Esse modelo tem baixa capacidade preditiva. 
 
Cálculo: 
 
 
 
 
 
 
 
Resposta: o complementar do r² é igual a 96%96% da variação total do volume de vendas 
podem ser explicados pela variável renda dos consumidores. 
 
18. (PS 2016.1) Um modelo de regressão linear simples foi estimado com o seguinte conjunto de 
dados, em que Y é a variável dependente e X a variável independente: 
Loja Espaço de prateleira (X) (m) Vendas semanais (Y) 
1 2 160 
2 2 220 
3 2 140 
4 5 190 
5 5 240 
6 5 260 
7 8 230 
8 8 270 
9 8 280 
10 10 260 
 
Com base nos dados apresentados, o r2 obtido é de: 
(A) r2 = 0,35. 
(B) r2 = 0,68. 
(C) r2 = 0,58. 
(D) r2 = 0,48. 
(E) r2 = 0,25. 
 
Cálculo: 
 
Reposta: resolvendo no excel a função = RQUAD encontra-se o valor de 0,58. 
19. (PS 2010.1) Um estudo sobre a relação entre as variáveis Renda e Gasto com alimentação, 
com 7 famílias, apresentou Soma de quadrados total, SQT = 60,8591, e Soma dos quadrados 
dos resíduos, SQR = 4,9283. A média amostral da variável Y foi 9,1429, com b0 = 1,1414 e b1 = 
0,2642. O coeficiente de determinação obtido e a respectiva interpretação são: 
(A) r2 = 0,87; 87% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
(B) r2 = 0,92; 92% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
(C) r2 = 0,81; 81% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
(D) r2 = 0,96; 4% da variaçãototal nos gastos com alimentação não foi explicada pelo modelo. 
Assim, para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
(E) r2 = 0,08; 8% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
 
Memória de Cálculo: 
 SQT= 60,8591 
 SQR = 4,9283 
 Y = 9,1429 
 B0= 1,1414 
 B1= 0,2642 
Cálculo: 
 
 
 
 
 
 
 
 
 
 
Resposta: O coeficiente de determinação obtido e a respectiva interpretação são r2 = 0,92; 92% 
da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é 
melhor utilizar o modelo linear obtido e não a média amostral. 
 
 
 
20. (P2 2014.2) Um modelo de regressão linear simples foi estimado e os valores observados e 
previstos pela reta de regressão para variável dependente estão na tabela a seguir: 
 
Y observado Y previsto 
36 11 
27 16 
23 33 
11 40 
28 11 
45 10 
 
Dado que a soma de quadrados total foi de 3500, o valor aproximado para o R2 desse modelo é: 
(A) 2,5%. 
(B) 4,5%. 
(C) 6,5%. 
(D) 8,5%. 
(E) 10,5%. 
 
Cálculo: 
 
Resposta: usando o Excel o valor aproximado para o R2 desse modelo é 8,5%. 
21. (P2 2012.1) Foi realizado um levantamento de informações que buscava estabelecer uma 
relação linear entre o rendimento anual (R$) de profissionais com cursos de doutorado e o tempo 
decorrido de sua titulação. Os dados coletados são apresentados na tabela a seguir. 
 
Anos após doutoramento R$ anual 
2 60.000 
4 66.000 
5 66.000 
7 72.000 
8 74.400 
9 75.600 
10 84.000 
12 90.000 
 
Após estabelecida a equação de regressão linear que representa este conjunto de dados, 
obteve-se o valor de 0,95 para o coeficiente de determinação (r2). Baseando-se nessa 
informação, é correto dizer que: 
(A) 95% da variabilidade do rendimento anual é explicada pelo número de anos decorridos após 
titulação. 
(B) 0,95 é a probabilidade de um doutor ganhar R$66.000,00 a cada 5 anos de trabalho. 
(C) 95% da variabilidade da remuneração anual estão em função do título recebido. 
(D) em média, a cada ano que passa, o rendimento aumenta 9,5%. 
(E) não existe correlação entre as duas variáveis em questão. 
 
Resposta: A pesquisa é feita com a população de pessoas que recebem aumento após a 
titulação do doutorado e o aumento da renda anual, portanto o valor de 0,95 (95%) para r² é o 
valor da da variabilidade do rendimento anual do número de anos decorridos após titulação. 
 
22. (P2 2012.1) Os dados da tabela a seguir relacionam a quantidade em kg/m2 de Nitrogênio 
(fertilizante) aplicado ao solo e o rendimento obtido (kg/m2) de um cultivo de milho. A equação de 
regressão linear que representa esse conjunto de dados é: y = 2,4476x + 31,41 com r2 de 0,89. 
Nitrogênio (kg/m2) (x) Rendimento (kg/m2) (y) 
0,4 32 
0,5 32 
1,1 35 
1,8 37 
2,5 37 
2,5 37 
 
A partir do exposto, é correto afirmar que: 
(A) o rendimento esperado do feijão é de 31,41 em kg/m2 quando não é aplicado nitrogênio na 
lavoura. 
(B) a aplicação de nitrogênio na lavoura não altera o rendimento do feijão. 
(C) a variável Nitrogênio (kg/m2), nesse exemplo de dados, é a variável dependente. 
(D) a variação de nitrogênio aplicado explica somente 2,44% da variação da produtividade do 
feijão. 
(E) se forem aplicados 1,5 kg/m2 de nitrogênio na lavoura, será obtida uma produtividade de 30 
kg/m2. 
 
Cálculo: 
 ( ) 
Resposta: O valor de 31,41 em kg/m2 é constante, portanto não há a necessidade de colocar a 
variável nitrogênio (x). 
 
23. (P2 2016.1) Se a soma de quadrados devido à regressão for zero, em um modelo de 
regressão linear simples que relaciona Y (variável dependente) e X (variável independente), a 
reta estimada para esse modelo será: 
(A) uma reta negativamente inclinada. 
(B) uma parábola (ou função do segundo grau). 
(C) uma reta vertical. 
(D) uma reta horizontal. 
(E) uma reta positivamente inclinada. 
 
Resposta: Já que a soma de quadrados da regressão é zero com as duas variáveis Y 
(dependente) e X (independente), portanto multiplicando as variáveis de Y com 0 terá uma reta 
na horizontal. 
 
24. (P2 2016.1) Foi estimado um modelo de regressão linear simples em que a variável 
dependente é vendas (em R$) e a independente é experiência (em anos). O resultado indicou 
um intervalo de confiança de 95% para o beta estimado relacionado a variável experiência de 
[−30; 30]. Com base nesse resultado e considerando um nível de significância de 5%, pode-se 
concluir que: 
(A) rejeita-se a hipótese nula do teste F. 
(B) a variável experiência não foi significante a 5%. 
(C) estatisticamente um aumento na experiência reduz as vendas. 
(D) rejeita-se a hipótese nula do teste t. 
(E) o valor-p foi menor do que 5%. 
 
Cálculo: 
 
 
Resposta: valor crítico < alfa, portanto a variável experiência não foi significante a 5%. 
 
 
25. (P2 2012.2) Rafael realizou uma regressão para testar a influência do tempo de experiência 
de seus vendedores (em anos) sobre suas vendas anuais (em Reais). Para testar a premissa de 
homoscedasticidade desse teste, qual dos gráficos a seguir é mais indicado? 
 
 
 
 
Resposta: A resposta correta é a alternativa C, as demais são respectivamente: A = Princípio da 
normalidade; B = Tem um padrão; D = Tem um padrão; e E = Princípio da normalidade. 
 
26. (P2 2014.2) O diagrama de dispersão a seguir mostra a relação entre a variável dependente 
Y e independente X. 
 
Se um modelo de regressão linear simples for estimado com esses dados coletados 
aleatoriamente, qual premissa do modelo seria violada? 
(A) Independência da variável dependente. 
(B) Homocedasticidade dos resíduos. 
(C) Linearidade dos coeficientes estimados. 
(D) Alta correlação entre as variáveis dependente e independente do modelo. 
(E) Normalidade da variável independente. 
 
Resposta: o princípio da Homocedasticidade dos resíduos é serem igual e/ou parecidos. 
27. (P2 2012.1) Observe, atentamente, os três gráficos dos resíduos de um certo modelo 
ajustado. 
 
As suposições invalidadas do modelo de regressão em cada um dos gráficos acima são 
respectivamente: 
(A) normalidade, independência e homocedasticidade. 
(B) independência, normalidade e homocedasticidade. 
(C) independência, homocedasticidade e normalidade. 
(D) homocedasticidade, independência e normalidade. 
(E) homocedasticidade, normalidade e independência. 
 
Resposta: No primeiro gráfico as variáveis são dependentes, no segundo são diferentes 
(heterocedástico) e o terceiro a variável não é normal, portanto as suposições que contrariam 
essas afirmações são as da alternativa C independência, homocedasticidade e normalidade. 
28. (P2 2012.2) Um pesquisador estimou um modelo de ANOVA para cada uma das situações 
apresentadas nos gráficos 1 e 2. 
 
Com base nos gráficos, assinale quais as possíveis conclusões dos testes. 
(A) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa 
de homoscedasticidade seria violada e no segundo a premissa de normalidade seria violada. 
(B) No primeiro teste, provavelmente a hipótese nula do teste seria rejeitada, uma vez que a 
média das notas dos alunos que frequentaram o cursinho A é inferior à média dos que 
frequentaram o cursinho C. Já no segundo teste, provavelmente a hipótese nula não seria 
rejeitada, pois as médias das notas são iguais. 
(C) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa 
de normalidade seria violada e no segundo teste a premissa de homoscedasticidade seria 
violada. 
(D) As conclusões dos modelos seriam válidas, uma vez que em ambos as premissas foram 
respeitadas. 
(E) As conclusões dos modelos não seriam válidas, uma vez que no primeiromodelo a premissa 
de normalidade seria violada e no segundo as premissas de normalidade e homoscedasticidade 
seriam violadas. 
 
Resposta: No Gráfico 1 não segue o princípio da normalidade já no Gráfico 2 não segue um 
padrão. 
 
29. (PS 2010.2) O modelo de regressão linear para os rendimentos médios mensais de dois 
ativos financeiros nos últimos 10 meses produziram, respectivamente, as tabelas ANOVA 
abaixo: 
Tabela ANOVA para Ativo Financeiro “A” 
 
gl SQ MQ F F de significância 
Regressão 1 35,34701 35,3470088 15,07898 0,004653917 
Resíduo 8 18,75299 2,3441239 
 
Total 9 54,1 
 
 
Tabela ANOVA para Ativo Financeiro “B” 
 
gl SQ MQ F F de significância 
Regressão 1 36,81799 36,81799 1,505217 0,25479609 
Resíduo 8 195,682 24,46025 
 
Total 9 232,5 
 
 
Considerando o nível de significância de 5%, pode-se afirmar que: 
(A) o modelo linear para o ativo A adere aos dados tão bem quanto o modelo linear para o ativo 
B. 
(B) o modelo linear para o ativo B adere aos dados melhor do que o modelo linear para o ativo A. 
(C) a variação não explicada de ambos os modelos tem valores muito próximos. 
(D) a variação não explicada do modelo A é bem menor que a do modelo B, portanto o primeiro 
adere melhor aos dados que o segundo. 
(E) a variação não explicada para o modelo B é bem maior que a do modelo A, portanto o 
primeiro adere melhor aos dados que o segundo. 
 
Resposta: F de significância de A (0,004653917) < F de significância de B (0,25479609), 
considerando o nível de significância 5% portanto o primeiro adere melhor aos dados que o 
segundo. 
 
30. (P2 2012.2) Felipe quer investigar se o número de exercícios de estatística que os alunos 
fazem na véspera da prova afeta a nota dos alunos. Para isso, primeiro realizou um teste de 
ANOVA e, em seguida, realizou uma regressão linear simples, em que a nota do aluno na prova 
de estatística era sua variável dependente, e o número de exercícios realizados na véspera da 
prova era a sua variável independente. Após comparar os resultados dos testes, Felipe ficou 
intrigado: percebeu que o teste ANOVA deu significante e que o teste de regressão simples não 
deu significante para a variável “número de exercícios realizados na véspera da prova”. Com 
base nesses resultados, o que Felipe pode concluir? 
(A) O resultado da regressão simples está errado, já que o teste mais adequado nesse caso 
seria uma regressão múltipla. 
(B) O resultado do teste ANOVA está errado, já que a regressão simples apresenta um resultado 
com um grau de significância maior. 
(C) O resultado da regressão simples está errado, já que o teste ANOVA apresenta um resultado 
com um grau de significância maior. 
(D) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes 
nesse caso, tendo em vista que a regressão simples só identifica relações lineares entre 
variáveis, enquanto o teste ANOVA compara médias de grupos diferentes. 
(E) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes 
nesse caso, tendo em vista que o teste ANOVA só identifica relações lineares entre variáveis, 
enquanto a regressão simples compara médias de grupos. 
 
Resposta: A regressão pode mostrar uma relação linear entre as variáveis, já o teste ANOVA 
pode mostrar uma média diferente. 
 
 
31. (P2 2014.1) Analise as seguintes sentenças: 
I. Em um teste de comparação de variâncias, se o valor da estatística do teste t superar o valor t 
crítico, pode-se concluir que as variâncias são diferentes. 
II. Em teste de hipótese para comparação de médias para amostras independentes, assume-se 
que os resíduos são independentes. 
III. A estatística do teste t em um modelo de regressão linear simples é obtida por meio da razão 
entre o beta estimado e seu erro-padrão. 
Está (ão) INCORRETA(S) APENAS a(s) sentença(s): 
(A) I. 
(B) II. 
(C) I e II. 
(D) I e III. 
(E) II e III. 
 
Resposta: 
 Alternativa 1 (errada) = Teste F que compara as variâncias. 
 Alternativa 2 (errada) = A variável que deve ser independente. 
 
32. (P2 2012.2) Em um modelo de regressão linear simples que tem como variável dependente o 
gasto anual em atividades culturais (em Reais) e como variável independente a idade (em anos), 
o R2 encontrado foi igual a zero. Com base nessas informações e com nível de significância de 
0,05, pode-se afirmar que a variável: 
(A) independente “idade” apresentou um valor-p inferior a 5%, indicando que ela é significante 
para o modelo. 
(B) independente “idade” apresentou um valor-p superior a 5%, indicando que ela não é 
significante para o modelo. 
(C) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%, 
indicando que ela não é significante para o modelo. 
(D) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%, 
indicando que ela é significante para o modelo. 
(E) dependente “gasto anual em atividades culturais” apresentou um valor-p inferior a 5%, 
indicando que ela é significante para o modelo. 
 
Resposta: Pelo coeficiente de determinação (R²) ser 0 não existe nenhuma relação significativa 
entre as variáveis, como a variável “idade” é independente apresenta um valor-p > que 5%. 
 
 
33. (PS 2008.1) Com base na tabela abaixo, obtida a partir do ajuste de um modelo de regressão 
linear, é correto afirmar que: 
ANOVA 
 
Gl SQ MQ F F de significação 
Regressão 1 247114,29 247114,29 53,95 0,01804 
Resíduo 2 9160,71 4580,36 
 
Total 3 256275,00 
 
 
(A) o coeficiente de inclinação não é significativo. 
(B) o modelo se ajusta aos dados para α = 0,05. 
(C) a relação entre as variáveis é não-linear. 
(D) o modelo não se ajusta aos dados para α = 0,05. 
(E) o intercepto não é significativo. 
 
Memória de Cálculo: 
 
 
 
 
 
 
 
=0,05 
Resposta: o modelo se ajusta aos dados para alfa = 0,05 
 
 
34. (P2 2016.2) Em uma Análise de Regressão, ao se realizar um teste t para a inclinação, se for 
encontrado, para um dos regressores, um valor-p menor do que o risco, é correto afirmar que: 
(A) a hipótese nula de β > 0 é rejeitada. 
(B) a hipótese nula de β = 0 é rejeitada. 
(C) a hipótese nula de β ≥ 0 é rejeitada. 
(D) a hipótese nula de β ≤ 0 não é rejeitada. 
(E) a hipótese nula de β = 0 não é rejeitada. 
 
Resposta: valor p < que alfa, maior a evidência contra a hipótese nula, portanto a H1 B=0 é 
rejeitada e H1 B> 0 aceita 
 
35. (ENADE 2012) As tabelas a seguir apresentam estimativas de regressão entre os retornos 
da empresa Alfa, que atua na produção e comercialização de piscinas e implementos para 
piscinas nas cidades de São Paulo, Rio de Janeiro, Belo Horizonte e Vitória, e retornos do 
Ibovespa (Índice da Bolsa de Valores de São Paulo) 
 
Considerando que o modelo estimado é robusto à presença de auto correlação e 
heterocedasticidade nos resíduos, avalie as asserções a seguir e a relação proposta entre elas. 
I. O risco de mercado da empresa Alfa é menor do que o do Ibovespa (carteira de mercado), o 
que significa que os retornos esperados para a Alfa serão menores do que os retornos 
esperados para o índice Bovespa. PORQUE 
II. O modelo é estatisticamente não significante tendo em vista que não se pode rejeitar a 
hipótese de que os coeficientes da regressão sejam estatisticamente diferentes de zero. 
A respeito dessas asserções, assinale a opção correta. 
(A) As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. 
(B) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. 
(C) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. 
(D) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
(E) As asserções I e II são proposições falsas. 
 
Resposta: A alternativa I está correta pois quando menos o valor –p menor os valores 
esperados de retorno,ou seja Rico Alfa < do Ibovespa. A alternativa II está correta pois Ho 
diferente de 0, rejeita. 
36. (P2 2018.2) Vânia é analista de sistemas e recebeu a tarefa de determinar as relações 
existentes entre as variáveis Y e X. Através de uma reta de regressão linear Y = a + bX, obteve 
COV (Y, X) = 280 e VAR (X) = 5,30. Com base nesses dados, o valor de b na equação de 
regressão é, aproximadamente, de: 
(A) 87,40. 
(B) 52,83. 
(C) 13,42. 
(D) 0,02. 
(E) 9,97. 
 
Cálculo: 
 
 
 
 
 
 
 
Resposta: O valor de b na equação de regressão é, aproximadamente, de 52,83. 
 
37. (PS 2018.2) Utilizando o método dos mínimos quadrados, um estatístico está desenvolvendo 
um modelo de regressão para determinar a relação entre a quantidade de quilômetros 
percorridos pelos veículos de uma transportadora e o gasto de combustível. Dessa forma, os 
testes de hipóteses aplicados a esse modelo somente serão válidos se os resíduos forem: 
(A) única e exclusivamente normais. 
(B) obrigatoriamente nulos. 
(C) normais, dependentes entre si e homocedásticos. 
(D) todos, obrigatoriamente, positivos. 
(E) normais, independentes entre si e homocedásticos. 
 
Resposta: Pressupostos da regressão são os resíduos serem Independênctes de erros(requer 
que os erros sejam independentes entre si); Normalidade de erros(requer que os erros sejam 
normalmente distribuídos para cada um dos valores de X); e Igualdade de variâncias ou 
Homoscedasticidade (requer que a variância dos erros seja constante em relação a todos os 
valores de X). 
. 
 
 
38. (ENADE 2018) Um estudo desenvolvido para avaliar a relação entre a cobertura por serviços 
de saneamento e indicadores epidemiológicos nos países da América Latina, analisou a taxa de 
mortalidade infantil, processando-se a análise por meio de regressão linear múltipla, conforme 
mostrado na tabela a seguir. Encontrou-se um coeficiente R2 ajustado de 0,782, tendo 
permanecido, no modelo final, as variáveis Esperança de vida ao nascer e Cobertura por 
sistemas de esgotamento sanitário. 
 
A partir das informações apresentadas, avalie as afirmações a seguir. 
I. Os indicadores de Esperança de vida ao nascer e Cobertura por sistemas de esgotamento 
sanitário apresentaram coeficiente β negativo, mostrando uma relação inversamente 
proporcional à taxa de mortalidade infantil. 
II. Na análise dos dados estatísticos, fica evidenciado que o aumento da Cobertura por sistemas 
de esgotamento sanitário determina uma queda na taxa de mortalidade infantil. 
III. O aumento na variável Esperança de vida ao nascer aumentará a taxa de mortalidade infantil. 
É correto o que se afirma em 
(A) I, apenas. 
(B) III, apenas. 
(C) I e II, apenas. 
(D) II e III, apenas. 
(E) I, II e III. 
 
Resposta: A alternativa I está correta pois se a esperança de vida ao nascer é negativa portanto 
é inversamente proporcional a taxa de mortalidade (menos esperança de vida = maior taxa de 
mortalidade). Já a alternativa II evidencia uma queda da taxa de mortalidade em relação a 
cobertura por sistemas de esgotamento sanitário. 
 
39. (ENADE 2018) Uma empresa criou um produto para ser lançado no mercado e, para tanto, 
foi realizado um estudo de mercado que indicou a demanda estimada entre 100 e 600 unidades 
de produto por mês. De posse dessas informações, o pessoal do departamento de custos da 
empresa calculou a lucratividade esperada da venda do produto, conforme volume de vendas, 
traçou a linha de tendência a partir da equação de regressão e calculou o R-quadrado, obtendo 
os dados e o gráfico a seguir 
 
O departamento de marketing da empresa avaliou que a demanda pelo produto é sazonal, 
estando a expectativa de vendas, nos meses de baixa demanda, próxima de 150 unidades e, 
nos meses de alta demanda, em aproximadamente 550 unidades. O preço de venda operado 
pela empresa em qualquer dos cenários será de R$ 6,00. 
A respeito dessa situação hipotética, avalie as afirmações a seguir. 
I. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa, 
espera-se uma lucratividade de 80%. 
II. Nos meses de baixa demanda, segundo a previsão do departamento de marketing da 
empresa, espera-se uma lucratividade de 40%. 
III. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa, 
o lucro líquido da empresa será de R$ 3 300,00. 
IV. O R-quadrado indica que a correlação entre as variáveis é significativa. 
É correto apenas o que se afirma em 
(A) I e III. 
(B) I e IV. 
(C) II e III. 
(D) I, II e IV. 
(E) II, III e IV. 
 
Resposta: A alternativa B está correta porque as sentenças I e IV estão certas: 
I - no pico da demanda (600) a lucratividade é 0,8 que multiplicando por 100 é igual a 80%. 
IV - Utiliza-se o teste F geral para determinar se existe uma relação significativa entre a variável 
dependente e o conjunto de variáveis independentes, portanto o R² (SQReg/SQT)

Outros materiais