Uma análise de regressão linear simples é capaz de gerar uma equação que descreve a relação entre uma variável preditora e uma variável resposta. Essa relação é demonstrada por uma linha que representa a distância mais próxima entre os pontos que são determinados pelos valores de variáveis de estudo.
Em uma empresa, por exemplo, existem diversos dados sobre clientes e produtos que podem ser analisados para encontrar a explicação de um fato estar ocorrendo, com base em resultados numéricos obtidos a partir de outra variável. Dessa forma, a informação obtida a partir da relação entre duas variáveis é utilizada para prever ou descrever mudanças futuras — ou seja, o que vai acontecer com y considerando-se o valor de x. Suponha que uma empresa do ramo alimentício solicitou a você analista de dados uma análise de regressão linear para verificar a relação entre o valor da cesta de compra no e-commerce e a idade dos clientes. Com base nos dados da tabela a seguir você de desenvolver o estudo solicitado.
CINCO PRIMEIRAS COMPRAS DE TERÇA - FERIRA
Valor da cesta de compra (x)
Idade dos clientes cadastrados (y)
1.250
40
75
18
189
22
268
33
1.150
25
A partir do exposto, responda:
a) Qual é o coeficiente de correlação para o estudo de regressão linear simples, considerando-se os dados da tabela? A correlação encontrada pode ser considerada forte ou fraca?
b) Qual é a equação da reta de regressão linear encontrada a partir dos dados fornecidos na tabela?
a) Para calcular o coeficiente de correlação, é necessário utilizar a fórmula de Pearson, que é dada por r = (nΣxy - ΣxΣy) / sqrt[(nΣx² - (Σx)²)(nΣy² - (Σy)²)]. Aplicando a fórmula com os dados da tabela, temos: r = (5* 104,250 - (1,250 + 75 + 189 + 268 + 1,150) * (40 + 18 + 22 + 33 + 25)) / sqrt[(5 * 1,562,500 - (1,250 + 75 + 189 + 268 + 1,150)²)(5 * 1,027,000 - (40 + 18 + 22 + 33 + 25)²)] = 0,936. Como o valor de r está próximo de 1, podemos considerar que a correlação é forte. b) Para encontrar a equação da reta de regressão linear, é necessário calcular o coeficiente angular (b) e o coeficiente linear (a). O coeficiente angular é dado por b = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²), e o coeficiente linear é dado por a = (Σy - bΣx) / n. Aplicando as fórmulas com os dados da tabela, temos: b = (5 * 104,250 - (1,250 + 75 + 189 + 268 + 1,150) * (40 + 18 + 22 + 33 + 25)) / (5 * 1,562,500 - (1,250 + 75 + 189 + 268 + 1,150)²) = 0,364 e a = (40 + 18 + 22 + 33 + 25 - 0,364 * (1,250 + 75 + 189 + 268 + 1,150)) / 5 = -5,732. Portanto, a equação da reta de regressão linear é y = 0,364x - 5,732.
Para escrever sua resposta aqui, entre ou crie uma conta
Cálculo Diferencial e Integral A Uma Variável
Compartilhar