Buscar

Lista 2 de 2 para Prova 1 Análise de Correlação e Regressão + dicas Excel

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Lista 2: Regressão e Correlação
Dica: use o Excel para contas, gráficos...
1: Escreva um ensaio sobre análise de correlação e outro ensaio sobre regressão linear simples. Comente sobre quando tais análises devem e quando não devem ser realizadas. (Escreva tudo que vc sabe sobre, dê exemplos, etc!!)
2- É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y).
	Massa muscular (Y)
	Idade (X)
	82.0
	71.0
	91.0
	64.0
	100.0
	43.0
	68.0
	67.0
	87.0
	56.0
	73.0
	73.0
	78.0
	68.0
	80.0
	56.0
	65.0
	76.0
	84.0
	65.0
	116.0
	45.0
	76.0
	58.0
	97.0
	45.0
	100.0
	53.0
	105.0
	49.0
	77.0
	78.0
	73.0
	73.0
	78.0
	68.0
Construa o diagrama de dispersão e interprete-o. 
Calcule o coeficiente de correlação linear entre X e Y. 
Denotamos as variáveis: Y = Massa Muscular e X = Idade n=18
 
 
 
 
Ajuste uma reta de regressão para a relação entre as variáveis Y: massa muscular (dependente) e X: idade (independente). (Resposta 
)
Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos. (Resposta: 96,87)
3. Com respeito aos 23 alunos de uma turma de estatística, foram observadas as seguintes variáveis: número de faltas e nota final da disciplina. Estes dados acusaram a seguinte correlação, descrita pelo coeficiente de correlação de Pearson: r = – 0,76. Comente as seguintes frases relativas à turma em estudo e ao coeficiente obtido. 
a) “Como r = – 0,76 (correlação relativa moderada), nenhum aluno com grande número de faltas tirou nota alta.” 
b) “Como as duas variáveis são correlacionadas, bastaria usar uma delas como critério de avaliação, pois uma acarreta a outra.” 
c) “Os dados observados mostraram uma leve tendência de a nota final se relaciona inversamente com o número de faltas, então os alunos freqüentadores tiveram, em geral, melhor desempenho nas avaliações, do que os alunos que faltaram muito.” 
4) Numa amostra aleatória de n = 12 livros da Biblioteca Central, encontramos r = 0,207 entre a idade da edição e o número de páginas do livro. 
a) O que se pode dizer com base no valor deste coeficiente de correlação? 
b) Podemos dizer que a idade de edição e o número de páginas são independentes?
5. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias.
	Renda Familiar (X)
	Gasto com Alimentação (Y)
	3
	1,5
	5
	2,0
	10
	6,0
	10
	7,0
	20
	10,0
	20
	12,0
	20
	15,0
	30
	8,0
	40
	10,0
	50
	20,0
	60
	20,0
	70
	25,0
	70
	30,0
	80
	25,0
	100
	40,0
	100
	35,0
	100
	40,0
	120
	30,0
	120
	40,0
	140
	40,0
	150
	50,0
	180
	40,0
	180
	50,0
	200
	60,0
	200
	50,0
Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X). 
Calcular o coeficiente de correlação entre essas variáveis. (resposta: 0,95)
 
 
 
 
 
 
Obtenha a equação de regressão do gasto com alimentação em função da renda familiar. 
(Resposta: 
)
Qual o significado prático do valor da inclinação da reta de regressão do item (c)?
6. Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração medida através do instrumento (Y), obtendo:
	X
	2,0
	2,0
	2,0
	4,0
	4,0
	4,0
	6,0
	6,0
	6,0
	8,0
	8,0
	8,0
	10,0
	10,0
	10,0
	Y
	2,1
	1,8
	1,9
	4,5
	4,2
	4,0
	6,2
	6,0
	6,5
	8,2
	7,8
	7,7
	9,6
	10,0
	10,1
(a) Construa o diagrama de dispersão para esses dados. 
(b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Como essa reta pode ser útil na avaliação do instrumento? Resposta: Esta reta é útil, pois, quanto mais próximos os pontos estiverem nela, maior à precisão do instrumento, já que o ideal é Y=X.
(c) Calcule o coeficiente de correlação entre as variáveis X e Y. (resposta: 0,996)
 
 
 
 
 (d) Obtenha a reta de regressão da variável Y em função de X.(Resposta 
)
(e) Com base nos itens anteriores tire conclusões sobre a eficiência do instrumento.
(Resposta: Com base nos itens anteriores, nota-se que, o instrumento para medir a concentração de determinada substância no sangue encontra-se bem calibrado. Observa-se que existe uma alta correlação entre as medidas feitas pelo instrumento e a concentração da determinada substância, o que pode ser confirmado nos gráficos apresentados anteriormente. Além disso, a reta de regressão obtida é bem próxima da reta Y=X, indicando grande proximidade entre as medidas.)
7. Atkinson et al. (1994) investigaram em que medida partículas de chumbo potencialmente tóxica emitidas por veículos automotores são absorvidas por ciclistas que participam de competições. A tabela abaixo, construída a partir de um gráfico apresentado em seu artigo, fornece níveis de chumbo no sangue e horas de treinamento de 10 ciclistas. 
	Horas de treinamento 
	8 
	10 
	10 
	12 
	15 
	18 
	18 
	21 
	25 
	25 
	Chumbo no sangue (mmol/L) 
	0,53 
	0,25 
	0,34 
	0,25 
	0,29 
	0,3 
	0,53 
	0,53 
	0,53 
	0,87 
Construa o gráfico de dispersão.
Verifique se há uma relação entre níveis de chumbo no sangue e horas de treinamento. 
O ciclista 10 tem níveis muito altos. Nossa evidência de uma relação é proveniente quase que inteiramente desta observação? Repita (b) omitindo o ciclista 10. 
O que fizemos em (c) parece razoável? 
Está claro a partir do gráfico obtido em (a) que há variação nos dados que não é explicada pelas horas de treinamento. (O que nos dá esta informação?) Talvez o efeito de horas de treinamento não apareça tão fortemente como deveria, porque estamos deixando de levar em consideração outras variáveis importantes. Sugira algumas outras variáveis que poderiam ser importantes. 
8. Um administrador de uma grande sorveteria anotou por um longo período de tempo a temperatura média diária, em ºC (X), e o volume de vendas diária de sorvete, em kg (Y). Com os dados, estabeleceu uma equação de regressão, resultando em: 
y = 0,5 + 1,8x, com R2 = 0,80 
a) Qual o consumo esperado de sorvete num dia de 27ºC? 
b) Qual o incremento esperado nas vendas de sorvete a cada 1°C de aumento da temperatura? 
9. A tabela a seguir relaciona os pesos (em centenas de kg) e as taxas de consumo de combustível em rodovia (km/litro) numa amostra de 10 carros de passeio novos. 
	Peso 
	12 
	13 
	14 
	14 
	16 
	18 
	19 
	22 
	24 
	26 
	Consumo 
	16 
	14 
	14 
	13 
	11 
	12 
	9 
	9 
	8 
	6 
a) Calcule o coeficiente de correlação de Pearson. 
b) Considerando o resultado do item a), como você avalia o relacionamento entre o peso e o consumo, na amostra observada? 
c) Para estabelecer uma reta de regressão, qual deve ser a variável dependente e qual deve ser a variável independente? Justifique a sua resposta. 
d) Estabeleça a equação de regressão, considerando a resposta do item c). 
e) Apresente o diagrama de dispersão e a reta de regressão obtida em d). 
f) Você considera adequado o ajuste do modelo de regressão do item d)? Dê uma medida desta adequação interpretando-a. 
g) Qual o consumo esperado para um carro de 2000 kg? Lembrete: os dados de consumo na tabela estão em centenas de kg. 
h) Você considera seu estudo capaz de predizer o consumo esperado para um carro de 7000 kg? Justifique sua resposta. 
10. Com o objetivo de verificar se numa certa região existe correlação entre o nível de escolaridade médio dos pais e o nível de escolaridadedos filhos, observou-se uma amostra aleatória de 8 indivíduos adultos, verificando o número de anos que estes freqüentaram (e tiveram aprovação) em escolas regulares (Y) e o número médio de anos que os seus pais freqüentaram (e tiveram aprovação) em escolas regulares (X). Os resultados são apresentados na tabela abaixo: 
	X 
	0 
	0 
	2 
	3 
	4 
	4 
	5 
	7 
	Y 
	2 
	3 
	2 
	5 
	9 
	8 
	8 
	15 
a) Calcule o coeficiente de correlação de Pearson. 
b) Em termos do resultado do item (a), o que se pode dizer sobre a correlação entre o número de anos que os 8 indivíduos freqüentaram escolas regulares (Y) e o número médio de anos que os seus pais freqüentaram escolas regulares? 
11. Suponha os seguintes dados na tabela 
	Despesas com Propaganda 
	Vendas de Certo Produto 
	(1000 000 R$) 
	(1000 unidades) 
	2,5 
	120 
	6,5 
	190 
	11,0 
	240 
	4,0 
	140 
	8,5 
	180 
	14,0 
	280 
	6,0 
	150 
	5,0 
	115 
	10,0 
	215 
	13,5 
	220 
	16,0 
	320 
a) Construa o diagrama de dispersão; 
b) Ajuste uma reta aos dados e estime as vendas do produto, para um gasto com propaganda de 12 milhões de reais; 
c) Qual o acréscimo nas vendas para cada milhão a mais gasto com propaganda? 
d) Trace a reta no diagrama de dispersão; 
e) Determine o coeficiente de correlação e interprete-o; 
f) Calcule e interprete o coeficiente de determinação do modelo de regressão, interprete-o.
g) Qual porcentagem de variação das vendas é explicada mediante um modelo de regressão linear pela variação das despesas de propaganda?
h)Qual a previsão de gastos com propaganda deve ter alguém que queira ganhar 200.000 unidades?
E de quem queira ganhar 800.000 unidades?
12. Sejam X e Y duas variáveis tais que: Y = 1 + 0,5X , para qualquer valor de X. Pode-se afirmar que:
Y é correlacionado com X e o índice de correlação é 0,5.
A correlação entre X e Y é negativa.
A correlação entre Y e X é exatamente igual a –1.
A correlação entre Y e X é perfeitamente linear e igual a 1.
13) Uma pesquisa sobre a qualidade da água foi realizada na Holanda. Em 8 comunidades com reservatórios de água na superfície, eles estudaram o efeito da quantidade de magnésio (miligramas por litro) (X) sobre o índice de qualidade (Y),.
	XC
	8,7
	9
	11
	8,5
	9,2
	12
	12
	18
	Y
	25
	25
	26
	48
	65
	87
	90
	100
Faça um gráfico de dispersão de X por Y. O que você observa?
Faça uma análise de regressão linear para a relação entre X e Y. 
Como utilizar o Excel para análises de Estatística Descritiva
A5. Algumas ferramentas do Excel 
O programa Microsoft Excel fornece muitas ferramentas de análise estatística. A forma de entrada de dados no Excel é uma das mais simples e por ser um programa muito acessível se torna um dos programas mais usados como suporte computacional nas análises estatísticas. A seguir tem-se um guia com algumas ferramentas úteis para análise no Excel, maiores dúvidas podem ser tiradas no “Help” do Excel.
Rol: Para ordenar um conjunto de dados em ordem crescente (ou decrescente), basta selecionar a linha ou coluna onde estão os dados e clicar no ícone (ou ) na barra de ferramentas. Se estes ícones não estiverem dispostos na barra de ferramentas, clique em Dados – Classificar– Ordem crescente (ou decrescente) 
Filtros no Excel: O Excel tem uma ferramenta de filtragem dos dados que permite agrupar dados que contém em comum alguma característica específica. Para ativar o filtro do Excel basta ativar o ícone na barra de ferramentas ou clique em Dados-Filtrar-AutoFiltro. 
Ativado o AutoFiltro, o Excel disponibilizará no título de cada coluna botões da forma que permite escolher o grupos que se deseja selecionar. Por exemplo, num conjunto de dados com a variável peso, se desejar agrupar somente os dados iguais a 2000g clica-se em e no valor 2000 ( se o valor desejado, no caso 2000, não estiver disponível é porque não tem nenhum dado com este valor). Pode-se também personalizar um intervalo de valores. Suponha que queremos agrupar todos os dados da variável peso com valores entre 1500 e 2000. Para tal, clique em - Personalizar- ( e preencher como segue)
Existem inúmeras formas de agrupamento disponíveis. E é possível fazer filtro dentro de um grupo de dados já filtrados, com o mesmo procedimento descrito acima. Por exemplo, se desejarmos selecionar bebês do sexo masculino dentre o grupo dos bebês de peso entre 2500 e 3000. Uma vez filtrado os dados, o Excel fornece no rodapé a quantidade de dados que satisfazem a característica determinada na filtragem. O filtro pode ser muito útil para contar os valores de uma classe de uma distribuição de freqüências. 
 Para colocar uma linha de tendência no gráfico, clique no gráfico e clique em Gráfico- Adicionar linha de tendência
Cálculos de Estatísticas: O Excel tem algumas funções predefinidas que efetuam cálculos usando valores específicos, denominados argumentos, em uma determinada ordem ou estrutura. O cálculo de muitas estatísticas de um conjunto de dados pode ser feito clicando em uma célula limpa e em ou Inserir Função. Abrir-se-á uma janela como se segue onde é permitido selecionar uma categoria da função (no caso, Estatística) e selecionar uma função. 
O Excel descreve, como pode ser visto acima, cada uma das funções disponíveis quando selecionadas e “depois do ok” dá orientações de qual tipo de entrada espera em cada argumento da função. Eis algumas estatísticas, dentre muitas, que podem ser calculadas com funções do Excel:
Média: MÉDIA		Mediana: MED	Moda: MODO Quartil: QUARTIL Percentil: PERCENTIL	Desvio Padrão: DESVPAD	 	Variância: VAR
Índice de correlação linear: CORREL
Coeficiente angular da reta de regressão: INCLINAÇÃO
Intercepto da reta de regressão: INTERCEPÇÃO
Valores previstos pela regressão linear: TENDÊNCIA
Para calcular o coeficiente de correlação de ordem utilizando o Excel deve-se obter a ordem de cada uma das observações das variáveis. Para obter a ordem de cada observação dentro de uma coluna deve-se usar a função estatística ORDEM. A função ordem pede três argumentos
Daí calcula-se o índice de correlação de Pearson (função CORREL) com os valores da ordem de cada observação. 
Outras funções muito usadas:
SOMA= calcula a soma de colunas e/ou linhas
MULT= calcula o produto entre colunas e/ou linhas
CONT.VALORES= conta quantos valores não nulos tem no intervalo especificado
Como fazer um gráfico de dispersão no Excel?
Digite as duas colunas de dados sendo a primeira coluna a variável X, selecione os dados, com os títulos das variáveis, vá em “Inserir” e “Dispersão (no ícone que tem o gráfico de dispersão
Fique fuçando com curiosidade no Excel para editar gráficos e calcular estatísticas.
SEJAM MUITO CURIOSOS, FUCEM MUITO EM PROGRAMAS COMPUTACIONAIS!! 
TODAS AS PESSOAS QUE EU CONHEÇO E DOMINAM UM PROGRAMA DE ANALISE ESTATISTICA, NÃO APRENDERAM NA UNIVERSIDADE, APRENDERAM FUÇANDO E GOOGLANDO DUVIDAS!
DOMINEM PELO MENOS O EXCEL! ISSO FAZ DIFERENÇA!
�PAGE �
�PAGE �2�
_1047068887.unknown
_1141853011.unknown
_1141853251.unknown
_1141853684.unknown
_1141853025.unknown
_1141853030.unknown
_1141853017.unknown
_1141851559.unknown
_1141851574.unknown
_1141852998.unknown
_1141851565.unknown
_1141401928.unknown
_1141401952.unknown
_1141544857.unknown
_1047071148.unknown
_1047068711.unknown
_1047068833.unknown
_1047068417.unknown

Outros materiais

Outros materiais