Buscar

Correlacao e Regressao Linear Simples - exercicios de fixacao(

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Análise Quantitativa de Dados
Correlação e Regressão Linear
Exercícios de fixação
Prof. Dr. Vilmar Rodrigues Moreira
EXERCÍCIOS DE FIXAÇÃO
1. O salário inicial é considerado um indicador importante do sucesso no mercado de trabalho por vários programas de pós-graduação stricto sensu (mestrado e doutorado). Um dos fatores que influenciam o salário inicial de um profissional egresso de uma pós-graduação tem sido a pontuação no exame de seleção de alunos. No caso da Administração, o GMAT desempenha esse papel. O salário inicial (em R$ 1.000,00) e a pontuação de 10 alunos recém graduados por uma conceituada Escola de Administração no Rio de Janeiro, forneceu os seguintes dados: (planilha 03)
	Salário
	GMAT
	40
	600
	33
	510
	40
	550
	35
	500
	28
	480
	28
	500
	34
	520
	30
	500
	32
	530
	31
	490
 									Planilha 03
a) Identifique qual é a variável explicativa (independente) e a variável resposta (dependente).
A variável explicativa é a GMAT e a variável resposta é o salário
b) Faça um gráfico de dispersão para representar os dados.
c) 
Verifique se o salário possui uma relação linear com a pontuação obtida no GMAT (calcule o coeficiente de correlação). 
d) Proceda uma regressão linear e descreva a equação da reta.
Y=5,5556x+329,26
e) Interprete os coeficientes da reta de regressão e informe em que unidade de medida cada coeficiente está expresso.
f) Quanto deverá receber um recém-formado que tenha obtido 500 pontos no GMAT, segundo a previsão da equação de regressão? R: 31,24.
g) Na amostra, dois recém formados obtiveram 500 pontos no GMAT. Um deles apresentou salário inicial de R$ 35.000 enquanto o outro ganhava R$ 30.000. Qual deles foi melhor previsto pelo modelo?
h) Calcule e interprete o coeficiente de determinação do modelo.
2. A indústria farmacêutica MIMI vende um remédio para combater resfriado. Após dois anos de operação, ela coletou as seguintes informações trimestrais:
	Trimestre
	Vendas (y)
(10.000)
	Despesas c/ 
Propaganda (x1)
	Temperatura Média
 do Trimestre (x2)
	1
	25
	11
	2
	2
	13
	5
	13
	3
	8
	3
	16
	4
	20
	9
	7
	5
	25
	12
	4
	6
	12
	6
	10
	7
	10
	5
	13
	8
	15
	9
	4
Planilha 04
a) Faça um gráfico de dispersão (x1, y) e (x2, y).
b) Calcule os coeficientes de correlação entre vendas e despesas com propaganda e entre vendas e temperatura média do trimestre. Interprete. R: 0,9531 e -0,8755
 
c) Encontre as retas de regressão para vendas (y) com despesas com propaganda (x1) e com as temperaturas médias (x2). R: y-est = 1,3125 + 1,9583x1 ; y-est = 25,7097 – 1,1258x2
d) Qual das duas retas você acha estatisticamente mais adequada para prever as vendas? Por quê? (analise o coeficiente de determinação – R2)
A segunda reta pois o valor está mais perto do 1, logo tem o melhor ajuste.
e) Qual a previsão de vendas para um trimestre em que a despesa de propaganda será de 8? E qual a previsão de vendas se a temperatura prevista for 10? R: 16,98 ; 14,45
3. Decisões sobre investimentos em ações são às vezes tomadas baseadas em estimativas da medida “beta” que avalia o risco sistemático associado a um dado portfolio. Esta medida reflete a relação entre a taxa de retorno de um certo portfolio, ou ação, e a taxa média de retorno do mercado como um todo. Sua denominação, “beta”, deriva do coeficiente angular de um modelo da regressão, na qual a variável dependente é a taxa de retorno do portfolio e a variável independente é a taxa de retorno do mercado. Ações, ou portfolios, com inclinação maior do que 1 são consideradas agressivas, na medida em que suas taxas de retorno apresentam variações maiores do que as das taxas do mercado. Por outro lado, inclinações inferiores a 1 representam ações, ou portfolios, defensivos, ou conservadores, por apresentarem alterações nas taxas de retorno. Ações ou portfolios com inclinações próximas a 1 indicam investimentos neutros. Durante sete meses foram coletados dados sobre as taxas de retorno de uma ação e do mercado. Os dados encontram-se no quadro a seguir. 
	
Meses
	Retorno da Ação
	Retorno do Mercado
	1
	12,0
	7,2
	2
	-1,3
	0,0
	3
	2,5
	2,1
	4
	18,6
	11,9
	5
	9,0
	5,3
	6
	-3,8
	-1,2
	7
	-10,0
	-4,7
Planilha 18
a) 
Determine a equação da reta = 0 + 1.X e interprete o significado do coeficiente angular.
= -1,32859 + 1,762141.X
b) O coeficiente de determinação do modelo (R-quadrado) é igual a 0,995. Interprete esse valor
O valor está perto de 1,logo o y tem grandes proporções em relação a linear x..
4. Fadiga emocional (burnout) é um sério problema que envolve pessoas que trabalham sob constante estado de pressão. Análise de regressão foi utilizada para investigar a relação entre este problema e alguns aspectos extraídos da realidade organizacional do profissional (para detalhes ver Journal of Applied Behavioral Science, v. 22, 1986). A fadiga emocional foi medida por meio de um índice (pontos) construído a partir de questões extraídas do inventário de Maslach. Uma das variáveis explicativas consideradas foi Contatos, definida como o número de contatos semanais mantidos com pessoas pertencentes ao grupo de trabalho do respondente. A tabela abaixo fornece os coeficientes da regressão, tais como obtidos pelo Excel, da série de 25 observações que compunham a amostra. 
Resultados extraídos do Excel
	 
	Coeficientes
	Interseção
	-29,497
	Variável X
	8,865
Com base nas informações acima:
a) Identifique as variáveis explicativa e a variável resposta.
A variável explicativa é o resultado 8,865 e a resposta é o -29,497
b) Monte a equação de regressão, interprete cada um dos coeficientes e diga em que medida cada um está expresso. Y=8,865+-29,497x
c) Qual deverá ser o índice de fadiga emocional para uma pessoa que estabeleça 100 contatos semanais com pessoas do grupo de trabalho? 
d) Na amostra observou-se uma pessoa estabelecendo 20 contatos semanais com pessoas do mesmo grupo de trabalho e o seu nível de fadiga emocional bateu 162,5 pontos. Calcule a diferença entre os valores estimados pelo modelo e o observado na amostra. Como se define esta diferença? O modelo está sub ou super estimando a observação?
e) O que se pode dizer a respeito da associação entre as variáveis considerando o sinal da inclinação da reta de regressão e sabendo-se que o coeficiente de correlação é igual a 0,78?
5. A fim de se avaliar a variável que melhor possa explicar o consumo de combustível nos Estados Unidos, dados sobre o consumo de gasolina (galões per capta por ano), renda (US$1.000 per capta por ano), imposto (US$centavos por galão) e habilitados (percentagem de pessoas com carteira de habilitação) e extensão da malha rodoviária federal (milhas) foram coletadas para os 48 estados contíguos daquele país em 1971. Considere, primeiramente, o quadro relativo às estatísticas para cada modelo:
Estatísticas da Regressão
	 Medidas
	Variáveis Independentes
	
	Imposto
	Habilitação
	Renda
	Malha
	R múltiplo
	0,4512
	0,699
	0,245
	0,024
	R-Quadrado
	0,2036
	0,488
	0,060
	0,001
	R-quadrado ajustado
	0,186
	0,477
	0,039
	-0,021
	Erro padrão
	100,92
	80,88
	109,65
	113,06
	Observações
	48
	48
	48
	48
A tabela abaixo apresenta os coeficientes linear e angular para cada modelo.
	Coeficiente
	Variáveis Independentes
	
	Imposto
	Habilitação
	Renda
	Malha
	Interseção
	984,01
	-227,31
	779,36
	572,56
	Inclinação
	-53,11
	14,10
	-0,048
	0,00076
a) De acordo com o seu julgamento, quais seriam as variáveis que possivelmente poderiam ser escolhidas para explicar as variações no consumo de combustível? Explicite o critério utilizado para a sua escolha.
b) Qual é a variável explicativa, dentre as escolhidas no item anterior, responsável pelo maior percentual de explicação da variação total do consumo de combustível? A escolha baseada no coeficiente de determinação coincide com o do menor erro padrão do modelo? Isso faz sentido? Em que unidade está expresso o erro padrão?
c) Interprete cada inclinação acima e diga em que unidade está expresso. Algum deles chama a atenção? Qual e por quê?
ESTUDO DE CASO – PASTÉISE PASTELÕES
A Pastéis e Pastelões Ltda. fabrica pastéis de forno a partir de dois ingredientes básicos: massa semi-pronta e recheio congelado. A empresa pretende estabelecer um modelo para previsão de lucro operacional mensal que lhe permita estabelecer o preço dos pastéis que deve ser praticado pela empresa. Desconsiderando a hipótese de alteração do tamanho e da qualidade dos pastéis, a diretoria considera que o preço unitário do pastel e o preço médio praticado pela concorrência são os únicos fatores relevantes na determinação da demanda, a qual se comporta segundo a seguinte equação: 
qd = 15000 – 5000x + 5000y ; onde x é o preço da Pastéis e Pastelões e y é o preço médio dos pastéis vendidos pelos concorrentes. 
· Dados adicionais:
	Preço médio praticado pela concorrência
	R$ 7,00
	Custo unitário da massa (R$ / pastel)
	R$ 1,30
	Custo unitário do recheio (R$ / pastel)
	R$ 2,00
	Custo unitário do processo (R$ / pastel)
	R$ 0,40
	Custo fixo
	R$ 6.000,00
a) Monte uma planilha para calcular o lucro total considerando o preço como variável de decisão.
· Resultados preliminares:
· O preço de R$ 4,00 não gera demanda suficiente para compensar a pequena margem de contribuição:
· Custo dos ingredientes: R$ 99.000,00
· Custo do processo: R$ 12.000,00
· Custo fixo: R$ 6.000,00
· Total: R$ 117.000,00
· Custo médio: R$ 117.000,00 / 30000 = R$ 3,90
· Margem de contribuição: R$ 4,00 – R$ 3,90 = R$ 0,10
· Lucro total: R$ 0,10 * 30000 = R$ 3.000,00
· O preço de R$ 8,00 retrai muito a demanda
· O preço de R$ 6,00 é mais atrativo. Mas é o ideal?
· E se o preço fosse R$ 7,00, como se comportaria a demanda e o lucro? 
b) Uma auditoria constatou, por meio de dados contábeis, que o custo unitário do processo é variável de acordo com o número de pastéis produzidos, ou seja, se comporta de forma diferente da que o modelo havia assumido (R$ 0,40 / pastel). Abaixo são apresentados os resultados da auditoria (planilha 05). Como melhorar o modelo de previsão do lucro considerando os dados observados?
	Nível de produção
	Custo de processo
($) REAL
	Custo de processo
($) MODELO
	10000
	3.200,00
	4000
	12000
	3.700,00
	4800
	14000
	4.500,00
	5600
	16000
	5.900,00
	6400
	18000
	7.100,00
	7200
	20000
	8.000,00
	8000
	22000
	9.700,00
	8800
	24000
	11.200,00
	9600
	26000
	14.000,00
	10400
	28000
	16.300,00
	11200
	30000
	19.400,00
	12000
Planilha 05
Respostas
3. 
a) y-est = -1,3286 + 1,7621.X
Para cada aumento de 1 ponto percentual na taxa de retorno do mercado espera-se um aumento de 1,76 ponto percentual na taxa de retorno da ação.
b) Pode-se dizer que 99,5% da variação na taxa de rentabilidade da ação pode ser explicada pela variação da rentabilidade do mercado, o que caracteriza uma excelente capacidade preditiva do modelo.
4. 
a) x = variável explicativa (independente) Contatos
y = variável resposta (dependente) Índice de Burnout (fadiga emocional)
b) Equação forma geral: y-est = b0 + b1.x
Equação: y-est = -29,497 + 8,865.X
b0 representa o número de pontos, na escala de fadiga emocional, para uma pessoa que não tem qualquer contato em uma semana. Está expresso em número de pontos.
b1 representa quantos pontos, na escala de fadiga emocional, as pessoas acrescentam para cada contato semanal mantido com alguém do seu grupo de trabalho. Está expresso como pontos por contatos semanais.
c) De acordo com a equação da reta, y-est = -29,497 + 8,865.x
Para x = 100, então y-est = -29,497 + 8,865(100) = 857,05. Para podermos avaliar o quanto esse valor representa, precisaríamos ter informação sobre a distribuição de pontos nessa escala e os pontos de corte para classificação.
d) Para x= 20, y-est = -29,497 + 8,865(20) = 147,8. A diferença entre esse valor, estimado pela reta, e o observado na amostra, 162,5, representa o resíduo. Como esse valor, 14,7, é positivo, podemos dizer que o modelo (a reta) está abaixo dessa observação, ou seja, está subestimando o índice de fadiga emocional para quem teve 20 contatos e apresentou um índice de 162,5 pts.
e) Tendo em vista o sinal da inclinação ser positivo, podemos dizer que a associação entre fadiga emocional e o número de encontros com pessoas do mesmo grupo de trabalho numa semana é positivo, isto é, quanto mais encontros semanais, maior deverá ser a fadiga emocional do profissional. A correlação de 0,7825 reflete uma associação alta entre essas duas variáveis.
5. 
a) Se tivéssemos que fazer uma decisão sobre o melhor modelo com apenas uma variável explicativa, baseados nos indicadores acima, apenas a variável habilitação estaria habilitada (sem trocadilho) a entrar no modelo. O seu Rm é o maior (na faixa de 0,7) indicando um alto grau de associação entre consumo e habilitação, embora a capacidade preditiva do modelo ficasse comprometida (Coeficiente de determinação baixo, medido pelo R-Quadrado). Em outras palavras, poderíamos dizer que a associação mais forte do consumo de combustível é com a variável explicativa Habilitação, apesar da fraca capacidade preditiva do modelo, caso este venha a ser utilizado para se fazer previsões.
b) A variável Habilitação, como dito acima, foi a variável com maior R2, tanto absoluto como o ajustado (o ajustamento para um modelo com uma variável explicativa apenas se dá em função de se começar a avaliar a incorporação de variáveis a partir do modelo sem a variável explicativa). Obviamente, tendo em vista o modelo linear simples, com apenas uma variável explicativa, o modelo com maior R2 será sempre o que levará ao menor erro padrão. Isto porque o erro representa tudo aquilo que o modelo não foi capaz de explicar, logo quanto maior a capacidade explicativa do modelo, expressa por R2, menor será o erro padrão do modelo, que é função da Soma dos Quadrados dos Resíduos.
c) Imposto:	A cada centavo de dólar por barril de acréscimo no imposto estadual, levará a uma diminuição de 53,11 barris per capta por ano no consumo de combustível no estado.
Habilitação: A cada ponto percentual a mais na proporção de pessoas com habilitação para conduzir veículos no estado, levará a um aumento de 14.1 barris per capta por ano naquele estado.
Renda: A cada US$1.000 a mais na renda per capta anual de um estado, levará a uma diminuição de 0,048 barril no consumo per capta anual do estado. Esta conclusão é particularmente estranha na medida em que esperávamos um aumento no consumo de combustível ao aumento na renda.
Malha: A cada milha de estrada federal construída no estado levará a um aumento praticamente desprezível, de 0,00076 barril per capta anual no estado.
Valores Y	28	28	30	31	32	33	34	35	40	40	480	490	500	500	500	510	520	530	550	28	28	30	31	32	33	34	35	40	40	1	y	11	5	3	9	12	6	5	9	25	13	8	20	25	12	10	15	x2	11	5	3	9	12	6	5	9	2	13	16	7	4	10	13	4	Valores Y	3	5	5	6	9	9	11	12	8	13	10	12	20	15	25	25	Valores Y	2	4	4	7	10	13	13	16	12	13	15	20	25	25	b	GMAT	600	510	550	500	480	500	520	500	530	490	0	40	33	40	35	28	28	34	30	32	31	
3
salário Gmat
40600
335100,836769
40550
35500
28480
28500
34520
30500
32530
31490
Plan1
	salário 	Gmat
	40	600
	33	510	0.836769493
	40	550
	35	500
	28	480
	28	500
	34	520
	30	500
	32	530
	31	490
x1y
11250,953051
513
38
920
1225
612
510
915
Plan1
	x1	y
	11	25	0.9530508491
	5	13
	3	8
	9	20
	12	25
	6	12
	5	10
	9	15
x2y
225
1313-0,87553
168
720
425
1012
1310
415
Gráf1
x2	2	13	16	7	4	10	13	4	y	25	13	8	20	25	12	10	15	
Plan1
	x2	y
	2	25
	13	13	-0.8755323769
	16	8
	7	20
	4	25
	10	12
	13	10
	4	15
Y
ˆ

Outros materiais