Baixe o app para aproveitar ainda mais
Prévia do material em texto
FAMA-Faculdade Aldete Maria Alves PRof: Onivaldo Batista Problemas de Correlação e Regressão Linear 1-Barbetta (2001, p.308). A tabela a seguir relaciona os pesos (em centenas de kg) e as taxas de consumo de combustível em rodovia (km/litro) numa amostra de 10 carros de passeio novos. Peso (x) 12 13 14 14 16 18 19 22 24 26 Consumo 16 14 14 13 11 12 9 9 8 6 a) Calcule o coeficiente de correlação de Pearson. RESPOSTA: -0,9584 b) Considerando o resultado do item anterior, como você avalia o relacionamento entre o peso e o consumo, na amostra observada? A CORRELAÇÃO E FORTE, TEM TUDO A VER COM O PESO E O CONSUMO. c) Calcule e interprete o resultado RESPOSTA: 91,87% 91,87% de certeza que o peso tem tudo a ver com o peso. d) Estabeleça a equação de regressão. Y=-0,6208x+22,25 e) Qual o consumo esperado para um carro de 2000 kg? Lembrete: os dados de consumo na tabela estão em centenas de kg. Y=-0,62,08*20+22,25=9,834 aproximadamente 10kg f) Você considera seu estudo capaz de predizer o consumo esperado para um carro de 7000 kg? Justifique sua resposta y=-0,6208*70+22,25=-22,206 Para uma precisão de um carro nesta pesagem está fórmula não é válida, porém um carro com bastante peso deve ser usado outra fórmula pois, não serve para veículos muitos pesados. 2- Barbetta (2001, p.308). Um administrador de uma grande sorveteria anotou por um longo período de tempo a temperatura média diária, em ºC (X), e o volume de vendas diária de sorvete, em kg (Y). Com os dados, estabeleceu uma equação de regressão, resultando em: y = 0,5 + 1,8x, com = 0,80. Pede-se: a) Qual o consumo esperado de sorvete num dia de 27ºC? R: Y=0,5+1,8X->Y=0,5+1,8*27->Y=49,1KG b) Qual o incremento esperado nas vendas de sorvete a cada 1°C de aumento da temperatura? Percebemos que a cada vez que o valor de x aumenta em 1°C, acrecentamos na equação 1,8kg, pois é o valor que liga a constante em X. 3- A administração de um banco desejava estabelecer um critério objetivo para avaliar a eficiência de seus gerentes. Para isso, levantou (para cada um dos subdistritos onde possuía agência) dados a respeito do depósito médio mensal por agência e o número de estabelecimentos comerciais existentes nesses subdistritos. Os dados são os seguintes: Subdistritos Número de Estabelecimentos Comerciais Depósito Médio Mensal por Agência (10 000 R$) Nossa Senhora do Ó 16 14 Casa verde 30 16 Vila Formosa 35 19 Santana 70 30 Barra Funda 90 31 Jardim Paulista 120 33 Santo Amaro 160 35 Lapa 247 33 Pinheiros 2278 50 a) Ajuste uma reta aos dados e estime depósito médio para um número de estabelecimentos comerciais igual a 350; Y=0,0116*350+25,078 Y=29,138 b) Qual o acréscimo nos depósitos médios, para cada estabelecimento a mais no subdistrito? RESPOSTA: O acréscimo e dado em 10.000 c) Determine o coeficiente de correlação e interprete-o; RESPOSTA: 56,94% d) Calcule e interprete o coeficiente de determinação. RESPOSTA: r2=0,5694 4- Barbetta (2001, p.286). Com respeito aos 23 alunos de uma turma de estatística, foram observadas as seguintes variáveis: número de faltas e nota final da disciplina. Estes dados acusaram a seguinte correlação, descrita pelo coeficiente de correlação de Pearson: r = – 0,56. Comente as seguintes frases relativas à turma em estudo e ao coeficiente obtido. a) “Como r = – 0,56 (correlação relativa moderada), nenhum aluno com grande número de faltas tirou nota alta. ” A Afirmação está indevida pois como temos uma correlação moderada, podemos ter também um aluno com um número de faltas altas com notas altas. b) “Como as duas variáveis são correlacionadas, bastaria usar uma delas como critério de avaliação, pois uma acarreta a outra. ” Esta questão está interligada com o coeficiente de correlação linear, que nós mostra duas variáveis e a relação entre elas. Quando uma é positiva, teremos duas variáveis diretamente proporcionais. Quando uma é negativa, elas são inversamente proporcionais. Ou seja, quanto mais próximo de 1, mais forte se é a correlação. c) “Os dados observados mostraram uma leve tendência de a nota final se relaciona inversamente com o número de faltas, então os alunos frequentadores tiveram, em geral, melhor desempenho nas avaliações, do que os alunos que faltaram muito. ” Como temos um coeficiente que não é igual a -1 e nem próximo disso, não temos uma correlação forte, então não podemos afirmar que alunos faltantes tenham tido nota alta. 5) Foram observados 4 lotes aleatórios de sucos concentrados, cada um com sua respectiva quantidade (em mg) por pacote e a quantidade de água necessária (em ml). Quant (mg) 100 200 400 500 Quant (ml) 50 70 100 120 Estime os parâmetros da reta de regressão y = a + bx. Onde x é a quantidade em mg. ____________________ = 5.666,67 4-1 4(300)2 ____________________ = 3.333,33 4-1 B=0,17 A __________________=34 4 Y=34+0,17X 6-A tabela indica o valor y do aluguel e a idade x de cinco casas. x 10 13 5 7 20 y 4 3 6 5 2 a) Encontre a reta y = a + bx A __________________ 5.743-3025 A=-0,26 B= 4 - (-0,26).11 B=6,8696 Yi=6,87-0,26xi b) Você acha que o modelo adotado é razoável? Olhamos para o gráfico e notamos que os pontos estão bem perto da reta então notamos que parece ser razoável. c) Qual o significado do coeficiente angular neste caso? Significa que o aluguel diminui a cada ano 0,26 vezes. d)E do coeficiente linear? Notamos que o valor médio do aluguel das casas e no tempo de 0 é de 6,8696 7- Observe o gráfico com fonte: Secretarias Estaduais de Saúde: *Até o dia 7 de junho, o infográfico com a curva de mortes dos estados mostrou os dados divulgados até as 23h59 pelas secretarias. A partir de 8 de junho, o gráfico apresenta os dados divulgados até as 20h. **Primeira morte foi confirmada em 17 de março em São Paulo. Fonte: Secretarias estaduais de Saúde. a) Calcule a correlação em relação a data (mês) e o número de mortes e interprete o resultado. RESPOSTA: Interpretamos que quando mais o tempo passa mais mortes vão se acumulando neste período. b) Calcule o coeficiente de determinação e interprete o resultado. Resposta: Sabemos que quando mais próximo de 1 mais forte se torna nossa correlação. b) Estabeleça a equação de regressão. Resposta: Y=18245X-75174 c) Qual é aproximadamente o total de mortes em 08/07/2020 RESPOSTA: Y=18.245*7-75174 Y=127.715-75.174 Y=52.541 MORTES Gráfico do Estado de Minas: Fonte Secretaria de Saúde. Com os dados do gráfico acima foi elaborada a tabela abaixo: Dia Número de dias Infectados Óbitos 08/03 1 1 0 21/03 21 55 0 29/03 29 231 1 30/04 61 1827 82 30/05 91 9630 263 07/06 99 15703 376 8-Faça o que se pede: a) Calcule a correlação (r) entre o número de dias e o total de infectados e faça a interpretação dos resultados RESPOSTA: Interpretamos que quanto mais os dias se passam mais pessoas se encontram infectadas. b) Calcule e interprete o resultado. RESPOSTA: Interpretamos que o coeficiente de correlação está mais próximo de 1 então a cada dia que se passa temos uma correlação mais forte. R2=0,7977 c) Escreva a equação da reta de regressão. Y=148,22x-2885,7 d) Calcule o número de infectados quando estivermos com 150 dias de pandemia. RESPOSTA: Y=148,22*150-2885,7 Y=19.347,3 9-Faça o que se pede: a) Correlação (r) entre o número de dias e o total de óbitos e faça a interpretação dos resultados RESPOSTA: Depois de calcularmos a reta notamos que a cada vez que o número de dias aumenta as mortes tendem a aumentar. b) Calcule e interprete o resultado. RESPOSTA: Após calcularmos o r2 notamos a proximidade dele com o 1 temos uma correlação forte em comparativo com os resultados. c) Escreva a equação da reta de regressão. Y=3,7852x-70,187 d) Calcule o número aproximado de óbitos quando estivermos com 150 dias de pandemia. RESPOSTA: Y=3,7852*150-70,187 Y=497,593 10-Faça o que se pede: a) Correlação (r) entre o número de infectados e o total de óbitos e faça interpretação dos resultados RESPOSTA: Notamosque a cada vez que o número de infectados aumenta o número de óbitos também aumenta. b) Calcule e interprete o resultado. RESPOSTA: r2=0,9862 significa que está bem próximo ao 1 portanto a correlação está bem forte. c) Escreva a equação da reta de regressão. RESPOSTA: Y=0,0243X+9,0191 d) Calcule o número de óbitos quando estivermos com 20000 infectados. RESPOSTA: Y=0,243*2000+9,0191 Y=495,0191 y y = 0,0116X + 25,078 16 30 35 70 90 120 160 247 2278 14 16 19 30 31 33 35 33 50 (Y) 10 13 5 7 20 4 3 6 5 2
Compartilhar