Baixe o app para aproveitar ainda mais
Prévia do material em texto
ENGENHARIA CIVIL NOTURNO Estatística e Probabilidade Correlação e Regressão Linear - Exercícios UniEVANGÉLICA – Centro Universitário de Anápolis Curso de Engenharia Civil 2º período – Noturno Disciplina: Estatística e Probabilidade Acadêmico: Jean Paulo Mendes Alves Exercícios de CORRELAÇÃO E REGRESSÃO LINEAR 1- Abaixo você encontra uma lista de situações de pesquisa. Para cada uma delas indique se o apropriado é proceder uma análise de regressão ou uma de correlação. Justifique sua indicação. a) 0 rendimento escolar na Universidade favorece o êxito profissional? b) 0 tempo de treinamento influi no desempenho profissional? c) O objetivo e estimar o tempo necessário a consecução de certa tarefa usando, para tanto, o tempo de treinamento do executor. d) 0 objetivo e utilizar o preço da carne de gado para estimar a quantidade de procura desse bem. e) A quantidade procurada de carne de gado depende do preço da carne de porco? 2- Uma cadeia de supermercados financiou um estudo dos gastos realizados por família de quatro pessoas com renda mensal líquida entre oito e vinte salários mínimos. A pesquisa levou a equação de regressão Y = -1,2 + 0,4 X, onde Y representa a despesa mensal estimada ( através do modelo) e X a renda mensal líquida expressa em numero de salários mínimos. a) Estime a despesa mensal de uma família com renda líquida mensal de 15 salários mínimos. b) A equação parece sugerir que uma família com renda mensal de 3 salários mínimos nada gasta com mercadorias. O que você tem a dizer sobre isso ? c) A equação em questão serve para estimar a despesa mensal de uma família de 5 pessoas com renda líquida de 12 salários mínimos ? Justifique. 3- Uma amostra de fábricas de uma indústria levou a: Custo total Y Produção X 80 12 44 4 51 6 70 11 61 8 a) Determine a equação de regressão linear. b) Quais os significados econômicos de "a" e "b"? c) Encontre o coeficiente de determinação ( ou de explicação). d) Teste a existência da regressão a um nível de significância de 5%. e) Determine um Intervalo de Predição (90%) para a média de Y dado X=10. 4- Pretendendo estudar a relação entre o tempo necessário a um consumidor para optar e o número de produtos substitutos alternativos expostos a ele, foi observada uma amostra aleatória de 15 consumidores, da qual resultaram os seguintes dados,: Y X 5 2 8 2 8 2 7 2 9 2 7 3 9 3 8 3 9 3 10 3 10 3 11 4 10 4 12 4 9 4 A variável Y refere-se ao tempo necessário para a tomada de decisão e X o número de alternativas. a) Estime o coeficiente de correlação linear de Pearson. b) Determine a equação de regressão para a amostra dada. c)Interprete os valores dos coeficientes encontrados para a reta. d)Estime e interprete o coeficiente de determinação entre X e Y. 5- Para cada caso abaixo, estime a correspondente reta de regressão: a) n X Y XY X 20 200 300 6200 3600 2, , , , . b) n X Y XY X 36 7 2 37 3100 620 2, , , , , . 6- Uma população é composta por N=6 pontos (X;Y). São eles: (1;2) (5;6) (2;4) (2;3) (3;5) (5;10) a) Determine a reta de regressão populacional; b) Faça um diagrama de dispersão, localize a reta do item anterior e os segmentos que representam os 6 valores de u. Verifique que a soma de u é igual a zero. 7- Uma amostra de residências selecionadas aleatoriamente foi observada quanto à idade do imóvel X e quanto ao preço de venda. Resultou: X Y 1 10 2 30 3 40 4 50 5 65 6 70 a) Estime a reta de regressão populacional; b) Teste, usando o coeficiente angular, se o preço de venda do imóvel diminui á medida que a idade cresce. Use 5%. c) Obtenha e interprete o intervalo de projeção de 95% para o preço de uma casa com 3 anos; d) Obtenha e interprete o intervalo de projeção de 95% para o preço médio de uma casa com 3 anos; e) Estime os coeficientes de correlação e determinação entre X e Y; f) È necessário testar a significância do coeficiente de correlação? Explique. 8- Abaixo, você encontra 3 afirmações. Indique, justificando, se são verdadeiras ou falsas: a) Se entre X e Y o coeficiente de correlação é 1, apenas uma dessas variáveis exerce influência sobre a outra. Isso já não é verdade quando o coeficiente de correlação é –1. b) Se o coeficiente angular da reta de regressão é nulo, o coeficiente de correlação entre as mesmas variáveis também o é. c) Se o coeficiente angular da reta de regressão é positivo, necessariamente o coeficiente de correlação entre as mesmas variáveis também o é. 9- Para cada um dos casos abaixo teste, a 5%, a significância do coeficiente angular da reta de regressão: a) b=4; ;b1 n=12; b) b=-0,15 , ;b0 1 n=20; c) b=0,6 , ;b0 2 n=50. 10- Para estudar a poluição de um rio, um cientista mediu a concentração de um determinado composto orgânico (Y) e a precipitação pluviométrica na semana anterior (X): X Y 0,91 0,10 1,33 1,10 4,19 3,40 2,68 2,10 1,86 2,60 1,17 1,00 a)Existe alguma relação entre o nível de poluição e a precipitação pluviométrica? Informa-se que r= 0,89. Teste sua significância, ao nível de 5%. , b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%. c)Calcule o coeficiente de correlação linear de Pearson e teste a sua significância ao nível de 1 %. 11- Procurando quantificar os efeitos da escassez de sono sobre a capacidade de resolução de problemas simples, um agente tomou ao acaso 10 sujeitos e os submeteu a experimentação. Deixou-os sem dormir por diferentes números de horas, após o que solicitou que os mesmos resolvessem os itens "contas de adicionar" de um teste. Obteve, assim, os seguintes dados: No de erros - Y Horas sem dormir - X 8 8 6 8 6 12 10 12 8 16 14 16 14 20 12 20 16 24 12 24 a)Calcule o coeficiente de correlação linear de Pearson e teste a sua significância ao nível de 1%. b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%. 12-A tabela abaixo mostra o comprimento ( X ) e largura ( Y ) de 10 folhas extraídas de uma arvore aleatoriamente. a)Verifique se existe correlação significativa entre as variáveis com um nível de significância de 5%. b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1% e 5%. comprimento largura 12 10 15 14 11 9 16 13 13 10 12 12 10 8 9 7 17 13 15 14 13- A tabela abaixo mostra a freqüência do pulso médio em diferentes períodos etários: Idade Pulso 2 112 4 104 6 100 8 92 10 88 12 86 14 84 16 80 a) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%. 14- A tabela abaixo mostra o volume de vendas ( em 1.000 unidades ) e os gastos promocionais ( em 100.000 reais ). Vendas Promoção 80 2 90 4 95 5 95 6 100 8 110 8 115 10 110 10 120 12 130 15 a) Represente graficamente estes pontos. b) Calcule o coeficiente de correlação linear de Pearson. c) Ajuste os dados através de uma reta de mínimos quadrados. ( modelo linear ) d) Determine o coeficiente de explicação para a reta. e) Teste a existência da regressão ao um nível de significância de 5%. 15- Há suspeitas de que a qualidade do remédio depende do tempo de maturação despendido em sua produção. Paraverificar isso, um laboratório farmacêutico coletou os seguintes dados: Tempo-X Qualidade - Y 1 23 2 31 3 40 4 46 5 52 6 63 a) Represente graficamente estes pontos. b) Calcule o coeficiente de correlação linear de Pearson. c) Ajuste os dados através de uma reta de mínimos quadrados. ( modelo linear ) d) Determine o coeficiente de explicação para a reta. e) Teste a existência da regressão ao um nível de significância de 5%. 16- Em certa população, o coeficiente de correlação entre X e Y é –0,80. a) O que isto significa? b) Que percentual da variância de Y não é explicada pelas variações de X? 17- A tabela seguinte mostra os resultados de uma pesquisa com 10 famílias de determinada região. Famílias Renda (u.m.:100) Poupança u.m.:1000) Número de Filhos Média de Anos de Estudo da Família A 10 4 8 3 B 15 7 6 4 C 12 5 5 5 D 70 20 1 12 E 80 20 2 16 F 100 30 2 18 G 20 8 3 8 H 30 8 2 8 I 10 3 6 4 J 60 15 1 8 Calcule o coeficiente de correlação linear de Pearson entre: a) renda familiar e poupança das dez famílias; b) renda e numero de filhos para as dez famílias; c) poupança e numero de filhos; d) média de anos de estudo e numero de filhos; e)renda familiar e media de anos de estudo. 18- Um grupo de pesquisa estabeleceu uma escala de quocientes de violência para programas de televisão. Classificou cada um dos 6 programas e coletou dados sobre o percentual de pessoas que assistem cada programa. Verifique se existe correlação significativa entre as variáveis com um nível de significância de 5%. Programa Quociente de violência (X) % que assistem (Y) 1 10 15 2 30 20 3 40 24 4 50 30 5 65 35 6 70 35 19- Os dados abaixo representam o Consumo(Y) e Renda disponível (X) num período de 14 anos. As variáveis são expressas em milhões de dólares. X Y X Y XY 3915 5 3273 4 1150349 73 800330 16 959198 36 2 2, , , , , a) Determine as estimativas de “a” e “b” dos parâmetros da reta estimada; b) Qual o significado econômico dessas estimativas? c) Qual o consumo esperado para uma renda de 400 milhões de dólares? d) Calcule o poder explicativo da regressão e interprete-o. 20-Uma empresa está estudando como varia a demanda de certo produto em função de seu preço de venda. Para isso levantou as seguintes informações: Meses Unidades Vendidas (Y) Preço/unidade(X) J 248 162 F 242 167 M 234 165 A 216 173 M 230 170 J 220 176 J 213 178 A 205 180 S 198 182 O 195 187 N 197 190 D 260 200 a) Ajuste os dados através de um modelo linear; b) Qual o significado econômico das estimativas de “a” e “b” dos parâmetros da reta estimada? c) Teste a existência da regressão a um nível de 1%; d) Determine um intervalo de 95% de confiança para a média de y dado x=185. Respostas Lista de Exercícios de Correlação e Regressão Exercício 3 Custo Total Produção 80 12 44 4 51 6 70 11 61 8 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,988988 R- Quadrado 0,978098 R- quadrado ajustado 0,970797 Erro padrão 2,462819 Observaç ões 5 ANOVA gl SQ MQ F F de significação Regressã o 1 812,6036 812,6036 133,9719 0,001385 Resíduo 3 18,19643 6,065476 Total 4 830,8 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o 26,27679 3,211966 8,180904 0,003821 16,05487 36,4987 Variável X 1 4,258929 0,367954 11,57462 0,001385 3,087934 5,429923 Exercício 4 Tempo Alternativas 5 2 8 2 8 2 7 2 9 2 7 3 9 3 8 3 9 3 10 3 10 3 11 4 10 4 12 4 9 4 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,70907 R- Quadrado 0,502781 R- quadrado ajustado 0,464533 Erro padrão 1,27346 Observaç ões 15 ANOVA gl SQ MQ F F de significação Regressã o 1 21,31791 21,31791 13,14542 0,003077 Resíduo 13 21,08209 1,621699 Total 14 42,4 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o 4,268657 1,292327 3,303079 0,005714 1,476755 7,060558 Alternativ as 1,544776 0,426067 3,625661 0,003077 0,624313 2,465239 Exercício 7 X Y Preço de Venda Idade do Imóvel 6 10 5 30 4 40 3 50 2 65 1 70 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,987932 R- Quadrado 0,976009 R- quadrado ajustado 0,970012 Erro padrão 3,888322 Observaç ões 6 ANOVA gl SQ MQ F F de significação Regressã o 1 2460,357 2460,357 162,7323 0,000218 Resíduo 4 60,47619 15,11905 Total 5 2520,833 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o 85,66667 3,619831 23,66593 1,89E-05 75,61638 95,71695 Preço de Venda -11,8571 0,929487 -12,7567 0,000218 -14,4378 -9,27647 RESULTADOS DE RESÍDUOS Observaç ão Previsto( a) Idade do Imóvel Resíduos 1 14,52381 -4,52381 2 26,38095 3,619048 3 38,2381 1,761905 4 50,09524 -0,09524 5 61,95238 3,047619 6 73,80952 -3,80952 Exercício 10 X Y Compost o Precipitação 0,91 0,1 1,33 1,1 4,19 3,4 2,68 2,1 1,86 2,6 1,17 1 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,887119 R- Quadrado 0,78698 R- quadrado ajustado 0,733725 Erro padrão 0,622154 Observaç ões 6 ANOVA gl SQ MQ F F de significação Regressã o 1 5,720032 5,720032 14,77757 0,018394 Resíduo 4 1,548301 0,387075 Total 5 7,268333 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o -0,03858 0,522492 -0,07384 0,944679 -1,48926 1,412089 Compost o 0,867504 0,225668 3,844161 0,018394 0,240948 1,49406 Exercício 11 Y X N.erros Horas 8 8 6 8 6 12 10 12 8 16 14 16 14 20 12 20 16 24 12 24 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,801467 R- Quadrado 0,642349 R- quadrado ajustado 0,597642 Erro padrão 2,241651 Observaç ões 10 ANOVA gl SQ MQ F F de significação Regressã o 1 72,2 72,2 14,36816 0,005308 Resíduo 8 40,2 5,025 Total 9 112,4 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o 3 2,126617 1,410691 0,196016 -1,90399 7,903991 Horas 0,475 0,125312 3,790535 0,005308 0,18603 0,76397X Y Exercício 12 Comprim Largura 12 10 15 14 11 9 16 13 13 10 12 12 10 8 9 7 17 13 15 14 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,902732 R- Quadrado 0,814925 R- quadrado ajustado 0,79179 Erro padrão 1,15836 Observaç ões 10 ANOVA gl SQ MQ F F de significação Regressã o 1 47,26563 47,26563 35,22562 0,000348 Resíduo 8 10,73438 1,341797 Total 9 58 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o -0,17188 1,917645 -0,08963 0,930786 -4,59397 4,250225 Comprim 0,859375 0,144795 5,935117 0,000348 0,525477 1,193273 Exercício 13 X Y Idade Pulso 2 112 4 104 6 100 8 92 10 88 12 86 14 84 16 80 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,975971 R- Quadrado 0,95252 R- quadrado ajustado 0,944607 Erro padrão 2,601892 Observaç ões 8 ANOVA gl SQ MQ F F de significação Regressã o 1 814,881 814,881 120,3693 3,41E-05 Resíduo 6 40,61905 6,769841 Total 7 855,5 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o 113,0714 2,027378 55,77225 2,23E-09 108,1106 118,0322 Idade -2,20238 0,20074 -10,9713 3,41E-05 -2,69358 -1,71119 Exercício 14 X Vendas - Y Promoçã o 80 2 90 4 95 5 95 6 100 8 110 8 115 10 110 10 120 12 130 15 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,981686 R- Quadrado 0,963707 R- quadrado ajustado 0,95917 Erro padrão 3,066296 Observaç ões 10 ANOVA gl SQ MQ F F de significação Regressã o 1 1997,283 1997,283 212,4277 4,81E-07 Resíduo 8 75,21739 9,402174 Total 9 2072,5 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseçã o 74,06522 2,302313 32,16991 9,5E-10 68,75607 79,37436 Promoçã o 3,804348 0,26102 14,5749 4,81E-07 3,202433 4,406263 Exercício 20 Y X 248 162 242 167 234 165 216 173 230 170 220 176 213 178 205 180 198 182 195 187 197 190 260 200 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,251769 R- Quadrado 0,063388 R- quadrado ajustado -0,03027 Erro padrão 21,78059 Observaç ões 12 ANOVA gl SQ MQ F F de significação Regressã o 1 321,0579 321,0579 0,676774 0,42988 Resíduo 10 4743,942 474,3942 Total 11 5065 Coeficient es Erro padrão Stat t valor-P 95% inferiores 95% superiore s Inferior 95,0% Interseçã o 307,5842 104,8297 2,934133 0,014935 74,00911 541,1594 74,00911 X -0,48498 0,589527 -0,82266 0,42988 -1,79853 0,828566 -1,79853 Exercício 17 Renda Poupanç a Número de filhos Anos de estudo Renda Número de filhos 10 4 8 3 10 8 15 7 6 4 15 6 12 5 5 5 12 5 70 20 1 12 70 1 80 20 2 16 80 2 100 30 2 18 100 2 20 8 3 8 20 3 30 8 2 8 30 2 10 3 6 4 10 6 60 15 1 8 60 1 Renda Poupanç a Renda Anos de estudo Renda 1 Renda 1 Poupanç a 0,983518 1 Anos de estudo 0,947271 1 Renda Número de filhos Renda 1 Renda Anos de estudo Número de filhos -0,7586 1 10 3 15 4 Poupanç a Número de filhos 12 5 Poupanç a 1 70 12 Número de filhos -0,71136 1 80 16 100 18 Número de filhos Anos de estudo 20 8 Número de filhos 1 30 8 Anos de estudo -0,73672 1 10 4 60 8
Compartilhar