Baixe o app para aproveitar ainda mais
Prévia do material em texto
MODELO REGRESSÃO LINEAR 1. (PS 2014.1) Qual das informações a seguir corresponde à equação de uma reta de regressão simples e qual (is) é(são) o(s) coeficiente(s) necessário(s) para gerar tal equação, respectivamente? (A) y = Log(2x – 1). São necessários os coeficientes de inclinação e de intercepto. (B) y = 3x – e2x. São necessários os coeficientes de intercepto e de inclinação. (C) y = 32,4 + 2,15x. São necessários os coeficientes de inclinação e de intercepto. (D) y = 5x – 1. É apenas necessário o coeficiente de intercepto, pois o coeficiente de inclinação é optativo. (E) y = 32,4. É apenas necessário o coeficiente de inclinação, pois o coeficiente de intercepto é optativo. Resposta: Inclinação: y = 32,4 + 2,15x e Intercepto: 32,4. Portanto os dois são apresentados. O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 2. (PS 2016.2) A função de regressão linear simples permite se estimar o custo mensal (em reais) com transporte dos funcionários de uma indústria em função de distância ( em quilômetros) existe entre a residência e a fábrica é assim expressa Y= 28,71 + 1,51 X . O custo mensal estimado com transporte de um funcionário que reside a 20km da fábrica é de aproximadamente: (A) R$69,00 (B) R$30,00 (C) R$32,00 (D) R$59,00 (E) R$29,00 Cálculo: ( ) Resposta: portanto o custo mensal estimado com transporte de um funcionário que reside a 20km da fábrica é de R$59,00. 3. Para cada km a mais na distância entre a residência do funcionário e a fábrica, é correto afirmar que o custo mensal estimado com o transporte desse funcionário: (A) não ocasiona alteração no custo mensal. (B) aumenta R$28,71. (C) aumenta R$1,51. (D) diminui R$1,51. (E) diminui R$28,71. Resposta: 1.51 multiplica a variável x, logo, a cada km a mais irá aumentar 1,51 4. O custo mensal estimado com o transporte de um funcionário que resida a 0 km da fábrica é de: (A) R$0,00. (B) R$27,20. (C) R$30,22. (D) R$28,71. (E) R$1,51. Cálculo: ( ) Resposta: O custo mensal estimado com o transporte de um funcionário que resida a 0 km da fábrica é de R$28,71 5. (P2 2010.2) A função que melhor representa o comportamento do lucro de uma empresa relativo ao quantitativo de colaboradores é: Y = 60 - 1,5x. A quantidade limite de colaboradores que a empresa deve possuir para não ter lucro é de: (A) 60 (B) 61,5 (C) 15 (D) 40 (E) 58,5 Cálculo: Resposta: A quantidade limite de colaboradores que a empresa deve possuir para não ter lucro é de 40. 6. (FGV PS 2014.1) Um professor de estatística deseja utilizar o número de horas que um aluno estuda para uma prova final de estatística (x1) para prever a nota da prova final numa escala de 0 a 100 (Y).Foi ajustado um modelo de regressão com base nos dados coletados (aleatoriamente) de uma classe durante o semestre anterior. O modelo ajustado foi: Y= 35 + 3X1. Qual é a interpretação, respectivamente, do intercepto (b0) e para a inclinação (b1) da equação estimada ¿ (A) Alunos que estudam para a prova obtêm, em média, uma nota 38 na prova final. É previsto que o resultado para a prova final cresça, em média, 3 pontos para cada hora de aumento no tempo de estudo. (B) Alunos que não estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto que o resultado para a prova final cresça, em média, 3 pontos para cada hora de aumento no tempo de estudo. (C) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto que o resultado para a prova final cresça 35 pontos, em média, para cada hora de aumento no tempo de estudo. (D) Alunos que não estudam para a prova obtêm, em média, uma nota 3 na prova final. É previsto que o resultado para a prova final cresça 35 pontos, em média, para cada hora de aumento no tempo de estudo. (E) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto que o resultado para a prova final cresça , em média, 38 pontos,para cada hora de aumento no tempo de estudo. Cálculo: ( ) Resposta: Portanto 35 sendo a constante e 3 a variável do X (prova final) Alunos que não estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto que o resultado para a prova final cresça, em média, 3 pontos para cada hora de aumento no tempo de estudo. 7. (FGV PS 2010.1) Foi realizado um estudo para estimar a relação linear entre as variáveis Preço (Y), em reais, e demanda por um produto (X), em unidades. O modelo de regressão linear ajustado aos dados Y = 31,31 + 1,65X. Esse modelo passou no teste ANOVA, suas premissas foram observadas e nenhum valor extremo ou influente foi observado. Nessas circunstâncias, é possível afirmas que: (A) O aumento de uma unidade demanda desse produto faz com que seu preço aumente R$31,31 (B) O aumento de uma unidade demanda desse produto faz com que seu preço aumente R$1,65 (C) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$1,65 (D) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$31,31 (E) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$32,96 Resposta: a inclinação é R$1,65, logo a cada aumento de X em unidade o preço subirá R$1,65. 8. (FGV OS 2014.2) Um modelo de regressão linear simples teve como variável dependente as vendas em um ano de uma amostra de 1.000 vendedores, mensurada em R$, e como variável independente, a variável X1 , que assume valor 1 quando o vendedor é o sexo masculino e zero quando contrário. A equação estimada foi: Y=15.000 – 2.500 X1 Com base na equação estimada, é correto concluir que um vendedor o sexo: (A) Masculino vendeu, em média, R$2.500,00 a menos que um vendedor do sexo feminino. (B) Masculino vendeu, em média, R$17.2500,00 a menos que um vendedor do sexo feminino. (C) Feminino vendeu, em média, R$12.250,00 a mais que um vendedor do sexo masculino. (D) Feminino vendeu, em média, R$15.000,00 a menos que um vendedor do sexo masculino. (E) Feminino vendeu, em média, R$17.250,00 a menos que um vendedor do sexo masculino. Cálculo: ( ) Resposta: Masculino (1), em média, R$2.500,00 a menos que um vendedor do sexo feminino. 9. (P2 2012.1) A tabela a seguir indica as quantidades produzidas de um certo insumo agrícola e seus respectivos custos de produção. Quantidade (kg) 10 25 50 80 90 Custo total (US$) 150 290 540 840 900 Se a reta de mínimos quadrados que se ajusta aos dados é representada pela equação Y= 55,29 + 9,58x, então podemos dizer que o valor mais provável para o custo fixo é: (A) 9,58. (B) 64,87. (C) 45,71. (D) 32,44. (E) 55,29. Resposta: Custo fixo = intercepto= 55,29. 10. (PS 2016.1) A fábrica Porto Print analisou os custos totais de produção de determinadas quantidades de seu principal produto, que é o cartucho de impressora jato de tinta na cor preta, considerando cinco observações independentes, conforme a tabela a seguir: Quantidades Custos totais (R$) 10 100 20 230 30 270 40 410 50 490 Com base nas informações acima, o valor do custo variável e do custo fixo, em reais, é respectivamente: (A) 9,60 e 12,00. (B) 9,50 e 13,00. (C) 9,00 e 15,00. (D) 10,00 e 14,00. (E) 8,00 e 11,00. Memória de Cálculo: Cálculo: ∑ ∑ ∑ ( ) ∑ ( ) [ ( ) ] ( ) ∑ ( ∑ ) ( ) Resposta: O valor do custo variável é $ 9,6 e do custo fixo $12 11. (PS 2014.1) As informações contidas na tabela a seguir foram cedidas pelo gerente de uma rede de lojasque atua no mercado automotivo com a comercialização de peças para reparos. O gerente deseja determinar a relação entre o número de comerciais de rádio divulgados nos fins de semana e as vendas nas lojas durante a semana seguinte. Os dados foram coletados durante dez finais de semanas e os valores das vendas estão expressos em um (1) por dez mil R$ (10.000,00). Semana Número de comerciais (X) Volume de vendas (Y) 1ª 2,0 5,00 2ª 5,0 5,70 3ª 1,0 4,10 4ª 3,0 5,40 5ª 4,0 5,40 6ª 1,0 3,80 7ª 5,0 6,30 8ª 3,0 4,80 9ª 4,0 5,90 10ª 2,0 4,60 Os valores a seguir foram obtidos a partir da tabela acima: n = 10; Σx = 30; Σy = 51; Σxy = 162,9; Σx2 = 110; Σy2 = 265,76; (Σx)2 = 900 e (Σy)2 = 2601. Nesse contexto e com base nas informações disponíveis, pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação: (A) 0,495x + 3,615 (B) 0,490x + 3,615 (C) 0,495x + 3,610 (D) 0,495x + 3,625 (E) 0,485x + 3,635 Cálculo: ∑ ∑ ∑ ( ) ∑ ( ) [ ( ) ] ( ∑ ) ( ) Resposta: pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação 0,495.x + 3,615 12. (P2 2010.2) Um aluno de uma Faculdade de Administração precisa fazer um controle do número de cachorros-quentes vendidos na lanchonete de sua faculdade em função do número de refrigerantes vendidos. Para isso, levantou informações sobre o número de vendas/semana de refrigerantes e a quantidade vendida de cachorros-quentes. Após coleta das informações, durante o período de cinco semanas, obteve os resultados apresentados na tabela abaixo: Número de refrigerantes vendido/semana Número de cachorros-quentes vendidos/semana 30 20 45 30 50 40 42 29 60 40 Considere que: Σx = 227; Σy = 159; Σxy = 7568 e Σx2 = 10789 A equação linear que representa esse conjunto de dados, tal que y = a + bx, é: (A) y = -1,03 + 0,72x (B) y = -1,03 - 0,72x (C) y = 1,80 - 1,82x (D) y = -1,80 - 1,82x (E) y = 1,93 - 0, 22x Cálculo: ∑ ∑ ∑ ( ) ∑ ( ) [ ( ) ] ∑ ( ∑ ) ( ) Resposta: A equação linear que representa esse conjunto de dados, tal que y = a + bx, é – 1,03 + 0,72x 13. (P2 2012.1) Os dados a seguir correspondem à renda familiar e ao custo com alimentação de uma pesquisa realizada com seis famílias de uma cidade do interior do estado de São Paulo. Renda familiar (X) Custo com alimentação (Y) R$ 1.920,00 R$ 1.080,00 R$ 2.670,00 R$ 1.830,00 R$ 1.840,00 R$ 1.190,00 R$ 2.580,00 R$ 1.536,00 R$ 3.200,00 R$ 1.960,00 R$ 2.500,00 R$ 1.696,00 A equação da reta de regressão estimada do custo com alimentação (Y) em função da renda familiar (X) é mais próxima de: (A) Y = 0,6571.X – 62,3235. (B) Y = 0,6571.X + 62,3235. (C) Y = – 0,6571.X – 62,3235. (D) Y = 1,6571.X + 62,3235. (E) Y = 1,6571.X – 62,3235. Memória de Cálculo: Cálculo: ∑ ∑ ∑ ( ) ∑ ( ) [ ( ) ] ∑ ( ∑ ) ( ) Resposta: A equação linear que representa esse conjunto de dados, tal que y = bx +a, é 0,6571X – 62,41 O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 14. (FGV OS 2014.1) A função de regressão linear simples permite estimarmos o custo com saúde (em R$) (Y) como função da renda per capita familiar (em R$)(X). A equação de regressão pode ser expressa da seguinte maneira: Y= 28,8 + 0,07X Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita familiar fará com que a família tenha seu gasto com saúde: (A) Aumentado, em média, R$28,8 (B) Diminuindo, em média, R$28,8 (C) Aumentado, em média, R$0,07 (D) Diminuindo, em média, R$0,70 (E) Aumentando, em média, R$0,70 Cálculo: Resposta: Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita familiar fará com que a família tenha seu gasto com saúde aumentando, em média R$0,70 15. O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será: (A) R$ 320,25 (B) R$ 196,80 (C) R$ 258,00 (D) R$ 297,50 (E) R$ 160,00 Cálculo: Resposta: O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será R$196,8. 16. (PS 2010.2) Um extrato do estudo sobre o gasto mensal com educação realizado em famílias da classe “A”, em função do número de filhos, é apresentado a seguir: Número de filhos Gasto mensal (em reais) 2 3.500,00 3 4.000,00 1 1.500,00 6 8.000,00 8 10.000,00 Considerando: Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114 então, se um casal está planejando ter outro filho, o valor estimado do acréscimo de gasto mensal com educação dos filhos é de: (A) R$ 2.000,00 (B) R$ 1.190,00 (C) R$ 635,00 (D) R$ 2.500,00 (E) R$ 800,00 Memória de Cálculo: Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114 n = 5 Cálculo: ∑ ∑ ∑ ( ) ∑ ( ) [ ( ) ] Resposta: O valor estimado do acréscimo de gasto mensal com educação dos filhos é de R$1.190,00 17. (P2 2010.1) Ao examinar as estatísticas de um modelo de regressão linear simples, entre as variáveis venda de um produto (Y) e a renda dos consumidores (X), a variação total é igual a 2,5 e a variação devida a outros fatores é igual a 0,1. Assim, é possível concluir que: (A) O coeficiente de correlação linear entre as variáveis é igual a 0,04. (B) O coeficiente de correlação linear entre as variáveis é igual a 0,96. (C) 98% da variação total da renda dos consumidores podem ser explicados pela variável volume de vendas. (D) 96% da variação total do volume de vendas podem ser explicados pela variável renda dos consumidores. (E) Esse modelo tem baixa capacidade preditiva. Cálculo: Resposta: o complementar do r² é igual a 96%96% da variação total do volume de vendas podem ser explicados pela variável renda dos consumidores. 18. (PS 2016.1) Um modelo de regressão linear simples foi estimado com o seguinte conjunto de dados, em que Y é a variável dependente e X a variável independente: Loja Espaço de prateleira (X) (m) Vendas semanais (Y) 1 2 160 2 2 220 3 2 140 4 5 190 5 5 240 6 5 260 7 8 230 8 8 270 9 8 280 10 10 260 Com base nos dados apresentados, o r2 obtido é de: (A) r2 = 0,35. (B) r2 = 0,68. (C) r2 = 0,58. (D) r2 = 0,48. (E) r2 = 0,25. Cálculo: Reposta: resolvendo no excel a função = RQUAD encontra-se o valor de 0,58. 19. (PS 2010.1) Um estudo sobre a relação entre as variáveis Renda e Gasto com alimentação, com 7 famílias, apresentou Soma de quadrados total, SQT = 60,8591, e Soma dos quadrados dos resíduos, SQR = 4,9283. A média amostral da variável Y foi 9,1429, com b0 = 1,1414 e b1 = 0,2642. O coeficiente de determinação obtido e a respectiva interpretação são: (A) r2 = 0,87; 87% da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. (B) r2 = 0,92; 92% da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. (C) r2 = 0,81; 81% da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. (D) r2 = 0,96; 4% da variaçãototal nos gastos com alimentação não foi explicada pelo modelo. Assim, para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. (E) r2 = 0,08; 8% da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. Memória de Cálculo: SQT= 60,8591 SQR = 4,9283 Y = 9,1429 B0= 1,1414 B1= 0,2642 Cálculo: Resposta: O coeficiente de determinação obtido e a respectiva interpretação são r2 = 0,92; 92% da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 20. (P2 2014.2) Um modelo de regressão linear simples foi estimado e os valores observados e previstos pela reta de regressão para variável dependente estão na tabela a seguir: Y observado Y previsto 36 11 27 16 23 33 11 40 28 11 45 10 Dado que a soma de quadrados total foi de 3500, o valor aproximado para o R2 desse modelo é: (A) 2,5%. (B) 4,5%. (C) 6,5%. (D) 8,5%. (E) 10,5%. Cálculo: Resposta: usando o Excel o valor aproximado para o R2 desse modelo é 8,5%. 21. (P2 2012.1) Foi realizado um levantamento de informações que buscava estabelecer uma relação linear entre o rendimento anual (R$) de profissionais com cursos de doutorado e o tempo decorrido de sua titulação. Os dados coletados são apresentados na tabela a seguir. Anos após doutoramento R$ anual 2 60.000 4 66.000 5 66.000 7 72.000 8 74.400 9 75.600 10 84.000 12 90.000 Após estabelecida a equação de regressão linear que representa este conjunto de dados, obteve-se o valor de 0,95 para o coeficiente de determinação (r2). Baseando-se nessa informação, é correto dizer que: (A) 95% da variabilidade do rendimento anual é explicada pelo número de anos decorridos após titulação. (B) 0,95 é a probabilidade de um doutor ganhar R$66.000,00 a cada 5 anos de trabalho. (C) 95% da variabilidade da remuneração anual estão em função do título recebido. (D) em média, a cada ano que passa, o rendimento aumenta 9,5%. (E) não existe correlação entre as duas variáveis em questão. Resposta: A pesquisa é feita com a população de pessoas que recebem aumento após a titulação do doutorado e o aumento da renda anual, portanto o valor de 0,95 (95%) para r² é o valor da da variabilidade do rendimento anual do número de anos decorridos após titulação. 22. (P2 2012.1) Os dados da tabela a seguir relacionam a quantidade em kg/m2 de Nitrogênio (fertilizante) aplicado ao solo e o rendimento obtido (kg/m2) de um cultivo de milho. A equação de regressão linear que representa esse conjunto de dados é: y = 2,4476x + 31,41 com r2 de 0,89. Nitrogênio (kg/m2) (x) Rendimento (kg/m2) (y) 0,4 32 0,5 32 1,1 35 1,8 37 2,5 37 2,5 37 A partir do exposto, é correto afirmar que: (A) o rendimento esperado do feijão é de 31,41 em kg/m2 quando não é aplicado nitrogênio na lavoura. (B) a aplicação de nitrogênio na lavoura não altera o rendimento do feijão. (C) a variável Nitrogênio (kg/m2), nesse exemplo de dados, é a variável dependente. (D) a variação de nitrogênio aplicado explica somente 2,44% da variação da produtividade do feijão. (E) se forem aplicados 1,5 kg/m2 de nitrogênio na lavoura, será obtida uma produtividade de 30 kg/m2. Cálculo: ( ) Resposta: O valor de 31,41 em kg/m2 é constante, portanto não há a necessidade de colocar a variável nitrogênio (x). 23. (P2 2016.1) Se a soma de quadrados devido à regressão for zero, em um modelo de regressão linear simples que relaciona Y (variável dependente) e X (variável independente), a reta estimada para esse modelo será: (A) uma reta negativamente inclinada. (B) uma parábola (ou função do segundo grau). (C) uma reta vertical. (D) uma reta horizontal. (E) uma reta positivamente inclinada. Resposta: Já que a soma de quadrados da regressão é zero com as duas variáveis Y (dependente) e X (independente), portanto multiplicando as variáveis de Y com 0 terá uma reta na horizontal. 24. (P2 2016.1) Foi estimado um modelo de regressão linear simples em que a variável dependente é vendas (em R$) e a independente é experiência (em anos). O resultado indicou um intervalo de confiança de 95% para o beta estimado relacionado a variável experiência de [−30; 30]. Com base nesse resultado e considerando um nível de significância de 5%, pode-se concluir que: (A) rejeita-se a hipótese nula do teste F. (B) a variável experiência não foi significante a 5%. (C) estatisticamente um aumento na experiência reduz as vendas. (D) rejeita-se a hipótese nula do teste t. (E) o valor-p foi menor do que 5%. Cálculo: Resposta: valor crítico < alfa, portanto a variável experiência não foi significante a 5%. 25. (P2 2012.2) Rafael realizou uma regressão para testar a influência do tempo de experiência de seus vendedores (em anos) sobre suas vendas anuais (em Reais). Para testar a premissa de homoscedasticidade desse teste, qual dos gráficos a seguir é mais indicado? Resposta: A resposta correta é a alternativa C, as demais são respectivamente: A = Princípio da normalidade; B = Tem um padrão; D = Tem um padrão; e E = Princípio da normalidade. 26. (P2 2014.2) O diagrama de dispersão a seguir mostra a relação entre a variável dependente Y e independente X. Se um modelo de regressão linear simples for estimado com esses dados coletados aleatoriamente, qual premissa do modelo seria violada? (A) Independência da variável dependente. (B) Homocedasticidade dos resíduos. (C) Linearidade dos coeficientes estimados. (D) Alta correlação entre as variáveis dependente e independente do modelo. (E) Normalidade da variável independente. Resposta: o princípio da Homocedasticidade dos resíduos é serem igual e/ou parecidos. 27. (P2 2012.1) Observe, atentamente, os três gráficos dos resíduos de um certo modelo ajustado. As suposições invalidadas do modelo de regressão em cada um dos gráficos acima são respectivamente: (A) normalidade, independência e homocedasticidade. (B) independência, normalidade e homocedasticidade. (C) independência, homocedasticidade e normalidade. (D) homocedasticidade, independência e normalidade. (E) homocedasticidade, normalidade e independência. Resposta: No primeiro gráfico as variáveis são dependentes, no segundo são diferentes (heterocedástico) e o terceiro a variável não é normal, portanto as suposições que contrariam essas afirmações são as da alternativa C independência, homocedasticidade e normalidade. 28. (P2 2012.2) Um pesquisador estimou um modelo de ANOVA para cada uma das situações apresentadas nos gráficos 1 e 2. Com base nos gráficos, assinale quais as possíveis conclusões dos testes. (A) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa de homoscedasticidade seria violada e no segundo a premissa de normalidade seria violada. (B) No primeiro teste, provavelmente a hipótese nula do teste seria rejeitada, uma vez que a média das notas dos alunos que frequentaram o cursinho A é inferior à média dos que frequentaram o cursinho C. Já no segundo teste, provavelmente a hipótese nula não seria rejeitada, pois as médias das notas são iguais. (C) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa de normalidade seria violada e no segundo teste a premissa de homoscedasticidade seria violada. (D) As conclusões dos modelos seriam válidas, uma vez que em ambos as premissas foram respeitadas. (E) As conclusões dos modelos não seriam válidas, uma vez que no primeiromodelo a premissa de normalidade seria violada e no segundo as premissas de normalidade e homoscedasticidade seriam violadas. Resposta: No Gráfico 1 não segue o princípio da normalidade já no Gráfico 2 não segue um padrão. 29. (PS 2010.2) O modelo de regressão linear para os rendimentos médios mensais de dois ativos financeiros nos últimos 10 meses produziram, respectivamente, as tabelas ANOVA abaixo: Tabela ANOVA para Ativo Financeiro “A” gl SQ MQ F F de significância Regressão 1 35,34701 35,3470088 15,07898 0,004653917 Resíduo 8 18,75299 2,3441239 Total 9 54,1 Tabela ANOVA para Ativo Financeiro “B” gl SQ MQ F F de significância Regressão 1 36,81799 36,81799 1,505217 0,25479609 Resíduo 8 195,682 24,46025 Total 9 232,5 Considerando o nível de significância de 5%, pode-se afirmar que: (A) o modelo linear para o ativo A adere aos dados tão bem quanto o modelo linear para o ativo B. (B) o modelo linear para o ativo B adere aos dados melhor do que o modelo linear para o ativo A. (C) a variação não explicada de ambos os modelos tem valores muito próximos. (D) a variação não explicada do modelo A é bem menor que a do modelo B, portanto o primeiro adere melhor aos dados que o segundo. (E) a variação não explicada para o modelo B é bem maior que a do modelo A, portanto o primeiro adere melhor aos dados que o segundo. Resposta: F de significância de A (0,004653917) < F de significância de B (0,25479609), considerando o nível de significância 5% portanto o primeiro adere melhor aos dados que o segundo. 30. (P2 2012.2) Felipe quer investigar se o número de exercícios de estatística que os alunos fazem na véspera da prova afeta a nota dos alunos. Para isso, primeiro realizou um teste de ANOVA e, em seguida, realizou uma regressão linear simples, em que a nota do aluno na prova de estatística era sua variável dependente, e o número de exercícios realizados na véspera da prova era a sua variável independente. Após comparar os resultados dos testes, Felipe ficou intrigado: percebeu que o teste ANOVA deu significante e que o teste de regressão simples não deu significante para a variável “número de exercícios realizados na véspera da prova”. Com base nesses resultados, o que Felipe pode concluir? (A) O resultado da regressão simples está errado, já que o teste mais adequado nesse caso seria uma regressão múltipla. (B) O resultado do teste ANOVA está errado, já que a regressão simples apresenta um resultado com um grau de significância maior. (C) O resultado da regressão simples está errado, já que o teste ANOVA apresenta um resultado com um grau de significância maior. (D) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes nesse caso, tendo em vista que a regressão simples só identifica relações lineares entre variáveis, enquanto o teste ANOVA compara médias de grupos diferentes. (E) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes nesse caso, tendo em vista que o teste ANOVA só identifica relações lineares entre variáveis, enquanto a regressão simples compara médias de grupos. Resposta: A regressão pode mostrar uma relação linear entre as variáveis, já o teste ANOVA pode mostrar uma média diferente. 31. (P2 2014.1) Analise as seguintes sentenças: I. Em um teste de comparação de variâncias, se o valor da estatística do teste t superar o valor t crítico, pode-se concluir que as variâncias são diferentes. II. Em teste de hipótese para comparação de médias para amostras independentes, assume-se que os resíduos são independentes. III. A estatística do teste t em um modelo de regressão linear simples é obtida por meio da razão entre o beta estimado e seu erro-padrão. Está (ão) INCORRETA(S) APENAS a(s) sentença(s): (A) I. (B) II. (C) I e II. (D) I e III. (E) II e III. Resposta: Alternativa 1 (errada) = Teste F que compara as variâncias. Alternativa 2 (errada) = A variável que deve ser independente. 32. (P2 2012.2) Em um modelo de regressão linear simples que tem como variável dependente o gasto anual em atividades culturais (em Reais) e como variável independente a idade (em anos), o R2 encontrado foi igual a zero. Com base nessas informações e com nível de significância de 0,05, pode-se afirmar que a variável: (A) independente “idade” apresentou um valor-p inferior a 5%, indicando que ela é significante para o modelo. (B) independente “idade” apresentou um valor-p superior a 5%, indicando que ela não é significante para o modelo. (C) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%, indicando que ela não é significante para o modelo. (D) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%, indicando que ela é significante para o modelo. (E) dependente “gasto anual em atividades culturais” apresentou um valor-p inferior a 5%, indicando que ela é significante para o modelo. Resposta: Pelo coeficiente de determinação (R²) ser 0 não existe nenhuma relação significativa entre as variáveis, como a variável “idade” é independente apresenta um valor-p > que 5%. 33. (PS 2008.1) Com base na tabela abaixo, obtida a partir do ajuste de um modelo de regressão linear, é correto afirmar que: ANOVA Gl SQ MQ F F de significação Regressão 1 247114,29 247114,29 53,95 0,01804 Resíduo 2 9160,71 4580,36 Total 3 256275,00 (A) o coeficiente de inclinação não é significativo. (B) o modelo se ajusta aos dados para α = 0,05. (C) a relação entre as variáveis é não-linear. (D) o modelo não se ajusta aos dados para α = 0,05. (E) o intercepto não é significativo. Memória de Cálculo: =0,05 Resposta: o modelo se ajusta aos dados para alfa = 0,05 34. (P2 2016.2) Em uma Análise de Regressão, ao se realizar um teste t para a inclinação, se for encontrado, para um dos regressores, um valor-p menor do que o risco, é correto afirmar que: (A) a hipótese nula de β > 0 é rejeitada. (B) a hipótese nula de β = 0 é rejeitada. (C) a hipótese nula de β ≥ 0 é rejeitada. (D) a hipótese nula de β ≤ 0 não é rejeitada. (E) a hipótese nula de β = 0 não é rejeitada. Resposta: valor p < que alfa, maior a evidência contra a hipótese nula, portanto a H1 B=0 é rejeitada e H1 B> 0 aceita 35. (ENADE 2012) As tabelas a seguir apresentam estimativas de regressão entre os retornos da empresa Alfa, que atua na produção e comercialização de piscinas e implementos para piscinas nas cidades de São Paulo, Rio de Janeiro, Belo Horizonte e Vitória, e retornos do Ibovespa (Índice da Bolsa de Valores de São Paulo) Considerando que o modelo estimado é robusto à presença de auto correlação e heterocedasticidade nos resíduos, avalie as asserções a seguir e a relação proposta entre elas. I. O risco de mercado da empresa Alfa é menor do que o do Ibovespa (carteira de mercado), o que significa que os retornos esperados para a Alfa serão menores do que os retornos esperados para o índice Bovespa. PORQUE II. O modelo é estatisticamente não significante tendo em vista que não se pode rejeitar a hipótese de que os coeficientes da regressão sejam estatisticamente diferentes de zero. A respeito dessas asserções, assinale a opção correta. (A) As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. (B) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. (C) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. (D) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. (E) As asserções I e II são proposições falsas. Resposta: A alternativa I está correta pois quando menos o valor –p menor os valores esperados de retorno,ou seja Rico Alfa < do Ibovespa. A alternativa II está correta pois Ho diferente de 0, rejeita. 36. (P2 2018.2) Vânia é analista de sistemas e recebeu a tarefa de determinar as relações existentes entre as variáveis Y e X. Através de uma reta de regressão linear Y = a + bX, obteve COV (Y, X) = 280 e VAR (X) = 5,30. Com base nesses dados, o valor de b na equação de regressão é, aproximadamente, de: (A) 87,40. (B) 52,83. (C) 13,42. (D) 0,02. (E) 9,97. Cálculo: Resposta: O valor de b na equação de regressão é, aproximadamente, de 52,83. 37. (PS 2018.2) Utilizando o método dos mínimos quadrados, um estatístico está desenvolvendo um modelo de regressão para determinar a relação entre a quantidade de quilômetros percorridos pelos veículos de uma transportadora e o gasto de combustível. Dessa forma, os testes de hipóteses aplicados a esse modelo somente serão válidos se os resíduos forem: (A) única e exclusivamente normais. (B) obrigatoriamente nulos. (C) normais, dependentes entre si e homocedásticos. (D) todos, obrigatoriamente, positivos. (E) normais, independentes entre si e homocedásticos. Resposta: Pressupostos da regressão são os resíduos serem Independênctes de erros(requer que os erros sejam independentes entre si); Normalidade de erros(requer que os erros sejam normalmente distribuídos para cada um dos valores de X); e Igualdade de variâncias ou Homoscedasticidade (requer que a variância dos erros seja constante em relação a todos os valores de X). . 38. (ENADE 2018) Um estudo desenvolvido para avaliar a relação entre a cobertura por serviços de saneamento e indicadores epidemiológicos nos países da América Latina, analisou a taxa de mortalidade infantil, processando-se a análise por meio de regressão linear múltipla, conforme mostrado na tabela a seguir. Encontrou-se um coeficiente R2 ajustado de 0,782, tendo permanecido, no modelo final, as variáveis Esperança de vida ao nascer e Cobertura por sistemas de esgotamento sanitário. A partir das informações apresentadas, avalie as afirmações a seguir. I. Os indicadores de Esperança de vida ao nascer e Cobertura por sistemas de esgotamento sanitário apresentaram coeficiente β negativo, mostrando uma relação inversamente proporcional à taxa de mortalidade infantil. II. Na análise dos dados estatísticos, fica evidenciado que o aumento da Cobertura por sistemas de esgotamento sanitário determina uma queda na taxa de mortalidade infantil. III. O aumento na variável Esperança de vida ao nascer aumentará a taxa de mortalidade infantil. É correto o que se afirma em (A) I, apenas. (B) III, apenas. (C) I e II, apenas. (D) II e III, apenas. (E) I, II e III. Resposta: A alternativa I está correta pois se a esperança de vida ao nascer é negativa portanto é inversamente proporcional a taxa de mortalidade (menos esperança de vida = maior taxa de mortalidade). Já a alternativa II evidencia uma queda da taxa de mortalidade em relação a cobertura por sistemas de esgotamento sanitário. 39. (ENADE 2018) Uma empresa criou um produto para ser lançado no mercado e, para tanto, foi realizado um estudo de mercado que indicou a demanda estimada entre 100 e 600 unidades de produto por mês. De posse dessas informações, o pessoal do departamento de custos da empresa calculou a lucratividade esperada da venda do produto, conforme volume de vendas, traçou a linha de tendência a partir da equação de regressão e calculou o R-quadrado, obtendo os dados e o gráfico a seguir O departamento de marketing da empresa avaliou que a demanda pelo produto é sazonal, estando a expectativa de vendas, nos meses de baixa demanda, próxima de 150 unidades e, nos meses de alta demanda, em aproximadamente 550 unidades. O preço de venda operado pela empresa em qualquer dos cenários será de R$ 6,00. A respeito dessa situação hipotética, avalie as afirmações a seguir. I. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa, espera-se uma lucratividade de 80%. II. Nos meses de baixa demanda, segundo a previsão do departamento de marketing da empresa, espera-se uma lucratividade de 40%. III. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa, o lucro líquido da empresa será de R$ 3 300,00. IV. O R-quadrado indica que a correlação entre as variáveis é significativa. É correto apenas o que se afirma em (A) I e III. (B) I e IV. (C) II e III. (D) I, II e IV. (E) II, III e IV. Resposta: A alternativa B está correta porque as sentenças I e IV estão certas: I - no pico da demanda (600) a lucratividade é 0,8 que multiplicando por 100 é igual a 80%. IV - Utiliza-se o teste F geral para determinar se existe uma relação significativa entre a variável dependente e o conjunto de variáveis independentes, portanto o R² (SQReg/SQT)
Compartilhar