Buscar

Lista 2 Análise de Correlação e Análise de Regressão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Lista 2: Regressão e Correlação
Dica: use o Excel para fazer os gráficos (copie a tabela, cole no excel e descubra como é feito o gráfico de dispersão) 
1: Escreva um ensaio (ou seja faça uma dissertação) sobre análise de correlação e outro ensaio sobre regressão linear simples. Comente sobre quando tais análises devem e quando não devem ser realizadas. (Escreva tudo que vc sabe sobre, dê exemplos, etc!!)
2- É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y).
	Massa muscular (Y)
	Idade (X)
	82.0
	71.0
	91.0
	64.0
	100.0
	43.0
	68.0
	67.0
	87.0
	56.0
	73.0
	73.0
	78.0
	68.0
	80.0
	56.0
	65.0
	76.0
	84.0
	65.0
	116.0
	45.0
	76.0
	58.0
	97.0
	45.0
	100.0
	53.0
	105.0
	49.0
	77.0
	78.0
	73.0
	73.0
	78.0
	68.0
(a) Construa o diagrama de dispersão e interprete-o. 
(b) Calcule o coeficiente de correlação linear entre X e Y. (Resposta= -0,83) .Considere os seguintes dados para as contas
Denotamos as variáveis: Y = Massa Muscular e X = Idade 
 
(c) Ajuste uma reta de regressão para a relação entre as variáveis Y: massa muscular (dependente) e X: idade (independente). 
(d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos. 
3. Com respeito aos 23 alunos de uma turma de estatística, foram observadas as seguintes variáveis: número de faltas e nota final da disciplina. Estes dados acusaram a seguinte correlação, descrita pelo coeficiente de correlação de Pearson: r = – 0,76. Comente as seguintes frases relativas à turma em estudo e ao coeficiente obtido. 
a) “Como r = – 0,76 (correlação relativa moderada), nenhum aluno com grande número de faltas tirou nota alta.” 
b) “Como as duas variáveis são correlacionadas, bastaria usar uma delas como critério de avaliação, pois uma acarreta a outra.” 
c) “Os dados observados mostraram uma leve tendência de a nota final se relaciona inversamente com o número de faltas, então os alunos freqüentadores tiveram, em geral, melhor desempenho nas avaliações, do que os alunos que faltaram muito.” 
5) Numa amostra aleatória de n = 12 livros da Biblioteca Central, encontramos r = 0,207 entre a idade da edição e o número de páginas do livro. 
a) O que se pode dizer com base no valor deste coeficiente de correlação? 
b) Podemos dizer que a idade de edição e o número de páginas são independentes?
6. Atkinson et al. (1994) investigaram em que medida partículas de chumbo potencialmente tóxica emitidas por veículos automotores são absorvidas por ciclistas que participam de competições. A tabela abaixo, construída a partir de um gráfico apresentado em seu artigo, fornece níveis de chumbo no sangue e horas de treinamento de 10 ciclistas. 
	Horas de treinamento 
	8 
	10 
	10 
	12 
	15 
	18 
	18 
	21 
	25 
	25 
	Chumbo no sangue (mmol/L) 
	0,53 
	0,25 
	0,34 
	0,25 
	0,29 
	0,3 
	0,53 
	0,53 
	0,53 
	0,87 
a) Construa o gráfico de dispersão.
b) Verifique se há uma relação entre níveis de chumbo no sangue e horas de treinamento. 
7. Um administrador de uma grande sorveteria anotou por um longo período de tempo a temperatura média diária, em ºC (X), e o volume de vendas diária de sorvete, em kg (Y). Com os dados, estabeleceu uma equação de regressão, resultando em: 
y = 0,5 + 1,8x, com R2 = 0,80 
a) Qual o consumo esperado de sorvete num dia de 27ºC? 
b) Qual o incremento esperado nas vendas de sorvete a cada 1°C de aumento da temperatura? 
8. A tabela a seguir relaciona os pesos (em centenas de kg) e a eficiência do consumo de combustível em rodovia (km/litro) numa amostra de 10 carros de passeio novos. 
	Peso (centenas de Kg)
	12 
	13 
	14 
	14 
	16 
	18 
	19 
	22 
	24 
	26 
	Eficiencia (km/l)
	16 
	14 
	14 
	13 
	11 
	12 
	9 
	9 
	8 
	6 
a) Calcule o coeficiente de correlação de Pearson
b) Considerando o resultado do item a), como você avalia o relacionamento entre o peso e a eficiência , na amostra observada? (Resposta: Existe uma correlação muito forte entre o peso do veículo e a eficiência, indicando que quanto maior o peso, menor a eficiência do carro, ou seja, menos km/l o carro faz)
c) Para estabelecer uma reta de regressão, qual deve ser a variável dependente e qual deve ser a variável independente? Justifique a sua resposta. (Queremos saber: Eficiência dependendo do peso, ou seja, eficiência em função do peso, logo X=peso e Y=eficiência)
d) Estabeleça a equação de regressão, considerando a resposta do item c). 
e) Apresente o diagrama de dispersão (Fazer o gráfico)
f) Você considera adequado o ajuste do modelo de regressão do item d)? Dê uma medida desta adequação interpretando-a. 
g) Qual o consumo esperado para um carro de 2000 kg? Lembrete: os dados de consumo na tabela estão em centenas de kg
h) Você considera seu estudo capaz de predizer o consumo esperado para um carro de 7000 kg? Justifique sua resposta. 
9. Com o objetivo de verificar se numa certa região existe correlação entre o nível de escolaridade médio dos pais e o nível de escolaridade dos filhos, observou-se uma amostra aleatória de 8 indivíduos adultos, verificando o número de anos que estes freqüentaram (e tiveram aprovação) em escolas regulares (Y) e o número médio de anos que os seus pais freqüentaram (e tiveram aprovação) em escolas regulares (X). Os resultados são apresentados na tabela abaixo: 
	X 
	0 
	0 
	2 
	3 
	4 
	4 
	5 
	7 
	Y 
	2 
	3 
	2 
	5 
	9 
	8 
	8 
	15 
a) Calcule o coeficiente de correlação de Pearson. 
b) Em termos do resultado do item (a), o que se pode dizer sobre a correlação entre o número de anos que os 8 indivíduos freqüentaram escolas regulares (Y) e o número médio de anos que os seus pais freqüentaram escolas regulares? 
10. Suponha os seguintes dados na tabela 
	Despesas com Propaganda 
	Vendas de Certo Produto 
	(1000 000 R$) 
	(1000 unidades) 
	2,5 
	120 
	6,5 
	190 
	11,0 
	240 
	4,0 
	140 
	8,5 
	180 
	14,0 
	280 
	6,0 
	150 
	5,0 
	115 
	10,0 
	215 
	13,5 
	220 
	16,0 
	320 
a) Construa o diagrama de dispersão; 
b) Ajuste uma reta aos dados e estime as vendas do produto, para um gasto com propaganda de 12 milhões de reais; 
c) Qual o acréscimo nas vendas para cada milhão a mais gasto com propaganda? 
d) Trace a reta no diagrama de dispersão; 
e) Determine o coeficiente de correlação e interprete-o; 
f) Calcule e interprete o coeficiente de determinação do modelo de regressão, interprete-o.
g) Qual porcentagem de variação das vendas é explicada mediante um modelo de regressão linear pela variação das despesas de propaganda?
h)Qual a previsão de gastos com propaganda deve ter alguém que queira ganhar 200.000 unidades?
E de quem queira ganhar 800.000 unidades?
11. Sejam X e Y duas variáveis tais que: Y = 1 + 0,5X , para qualquer valor de X. Pode-se afirmar que:
a) Y é correlacionado com X e o índice de correlação é 0,5.
b) A correlação entre X e Y é negativa.
c) A correlação entre Y e X é exatamente igual a –1.
d) A correlação entre Y e X é perfeitamente linear e igual a 1.
12) Uma pesquisa sobre a qualidade da água foi realizada na Holanda. Em 8 comunidades com reservatórios de água na superfície, eles estudaram o efeito da quantidade de magnésio (miligramas por litro) (X) sobre o índice de qualidade (Y),.
	XC
	8,7
	9
	11
	8,5
	9,2
	12
	12
	18
	Y
	25
	25
	26
	48
	65
	87
	90
	100
A) Faça um gráfico de dispersão de X por Y. O que você observa?
B) Faça uma análise de regressão linear para a relação entre X e Y. 
13. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias.
	Renda Familiar (X)
	Gasto com Alimentação (Y)
	3
	1,5
	5
	2,0
	10
	6,0
	10
	7,0
	20
	10,0
	20
	12,0
	20
	15,0
	30
	8,0
	40
	10,0
	50
	20,0
	60
	20,0
	70
	25,0
	70
	30,0
	80
	25,0
	100
	40,0
	100
	35,0
	100
	40,0
	120
	30,0
	120
	40,0
	140
	40,0
	150
	50,0
	18040,0
	180
	50,0
	200
	60,0
	200
	50,0
(a) Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X) usndo o Excel 
(b) Calcular o coeficiente de correlação entre essas variáveis. 
 
(c) Obtenha a equação de regressão do gasto com alimentação em função da renda familiar. 
(d) Qual o significado prático do valor da inclinação da reta de regressão do item (c)?

Continue navegando