Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Aula 07 – Correlação e Regressão Prof. Me. André Breve andre.breve@estacio.br CCE0174 – Estatística Aplicada à Engenharia Correlação e Regressão Muitos problemas em engenharia e ciências envolvem explorar as relações entre duas ou mais variáveis. Pressão de um gás em um recipiente está relacionada à temperatura. A velocidade da água em um canal aberto está relacionada à largura do canal. O deslocamento de uma partícula em certo tempo está relacionado à sua velocidade. Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação e Regressão Correlação Objetivo: Verificar se existe relação entre duas variáveis quantitativas, uma chamada variável Y, e a outra, chamada variável X. Havendo relação entre as variáveis X e Y, podemos escreve-la por meio de uma equação da reta (equação de regressão), que melhor representa essa relação. Para encontrarmos a equação de regressão, utilizaremos a técnica de regressão linear simples. Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Diagrama de Regressão Responderemos às seguintes perguntas: Há algum tipo de relação entre as variáveis X e Y? Qual o tipo de relacionamento entre elas? Qual a intensidade da relação? Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Diagrama de Dispersão A primeira análise feita para identificar se existe relação entre duas variáveis é utilizar pares observados para construir um gráfico denominado diagrama de dispersão. Neste diagrama, os pares ordenados (x,y) representam pontos em um plano coordenado; A variável X é representada no eixo das abscissas (horizontal) e a variável Y no eixo das ordenadas (vertical) Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Diagrama de Dispersão – Alguns tipos de correlação: Correlação Linear Estatística Aplicada à Engenharia – Prof. Msc. André Breve Diagrama de Dispersão A análise do diagrama de dispersão nos permite identificar a forma, a direção e a força da relação particular existente entre duas variáveis quantitativas: Forma: análise baseada na disposições dos pontos, em forma de reta, curva etc. Direção: crescente ou decrescente Força: o quão próximo os pontos se aproximam mais de uma reta Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Diagrama de Dispersão – Os gráficos abaixo possuem forma bem definida, aproximadamente ao longo de uma linha reta, portanto, um padrão linear Correlação Linear Estatística Aplicada à Engenharia – Prof. Msc. André Breve Diagrama de Dispersão – Nota-se também que os gráficos possuem uma direção bem clara, uma vez que o da esquerda a medida que o X cresce, o Y tende a decrescer enquanto que no da direita a medida que o X cresce, o Y também cresce. Correlação Linear Estatística Aplicada à Engenharia – Prof. Msc. André Breve Diagrama de Dispersão – O gráfico da esquerda não possui forma definida, sugerindo que não há relação entre X e Y enquanto que o gráfico da direita mostra uma forma bem distinta, sugerindo uma relação entre X e Y, cuja forma não é uma reta Correlação Linear Estatística Aplicada à Engenharia – Prof. Msc. André Breve Coeficiente de Correlação Linear Somente a interpretação do diagrama de dispersão pode gerar interpretações subjetivas Uma informação complementar à análise gráfica é obtida com o cálculo do coeficiente de correlação linear, r, que é útil para detectar padrões lineares Coeficiente de correlação linear de Pearson: r = Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Coeficiente de correlação linear de Pearson r = Os valores do coeficiente estão sempre entre -1 ≤ r ≤ 1; Um valor +1 indica uma relação linear positiva perfeita entre x e y enquanto que um valor -1 indica uma correlação linear negativa perfeita entre x e y; Valores com coeficiente de correlação linear próximo de zero indicam que x e y não estão linearmente relacionados. Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Força da correlação linear De acordo com VIEIRA (2008, p.117), uma regra prática para julgar o valor de r, embora rudimentar, é a seguinte: 0 < r < 0,25 ou -0,25 < r < 0: correlação pequena ou nula • 0,25 < r < 0,50 ou -0,50 < r < -0,25: correlação fraca • 0,50 < r < 0,75 ou -0,75 < r < -0,50: correlação moderada 0,75 < r < 1 ou -1 < r < -0,75: correlação forte R = 1 ou r = -1: correlação perfeita Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Exemplo 1: Uma construtora quer verificar a eficácia de seus anúncios em determinado canal de televisão. O objetivo é verificar se há relação entre a quantidade de anúncios e o número de apartamentos vendidos. A tabela abaixo mostra o número de anúncios que foram ao ar por mês, durante seis meses, e o correspondente número de apartamentos vendidos de três torres em lançamentos. Vamos supor que, durante o período de seis meses, o anúncio em televisão foi o único meio de divulgação das torres em lançamento. Estatística Aplicada à Engenharia – Prof. Msc. André Breve NºAnúncios(X) NºAp.Vendidos(Y) 15 18 25 27 31 32 35 34 40 38 45 42 Correlação Linear Exemplo 1: Diagrama de Dispersão Correlação Linear Estatística Aplicada à Engenharia – Prof. Msc. André Breve Exemplo 1: Coeficiente de correlação de Pearson Nº Anúncios(X) NºAp.Vendidos(Y) X.Y X2 Y2 15 18 270 225 324 25 27 675 625 729 31 32 992 961 1024 35 34 1190 1225 1156 40 38 1520 1600 1444 45 42 1890 2025 1764 Σ=191 Σ=191 Σ=6537 Σ=6661 Σ=6441 r = = = = 0,9979 Conclusão: As variáveis nº de anúncios e nº de vendas são fortemente relacionadas Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Correlação Linear Três possíveis fontes de erros: Associação não implica causalidade: uma forte associação entre as variáveis não é suficiente para se tirar conclusões de causa e efeito. A variável Y pode ser afetada por alguma variável oculta. Dados que se baseiam em médias suprimem a variação individual e podem aumentar o coeficiente de correlação Propriedade da linearidade: mesmo que o valor do coeficiente de correlação linear indique que não há nenhuma correlação linear, o diagrama de dispersão pode retratar um padrão que reflete uma forte relação não-linear. Estatística Aplicada à Engenharia – Prof. Msc. André Breve Correlação Linear Regressão Linear Simples Uma reta de regressão é uma linha reta que descreve como uma variável resposta y muda à medida que uma variável explicativa x também varia Geralmente utilizamos uma reta de regressão para predizer o valor y a partir de um determinado valor de x Para obtermos a reta de regressão, precisamos da equação de regressão, que é estimada utilizando a técnica de regressão linear simples Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Regressão Linear Simples – A regressão linear simples envolve uma variável dependente e uma variável independente. Estatística Aplicada à Engenharia – Prof. Msc. André Breve – Equação Geral da Reta: y = mx + n m: coeficiente angular (informa a inclinação da reta em relação a x) n: intercepto (ordenada de intersecção da reta com o eixo y) Se m > 0 (positivo): a reta é crescente Se m < 0 (negativo): a reta é descrescente Se m = 0: a reta é paralela ao eixo das abscissas (eixo x) Regressão Linear Simples Regressão Linear Simples – Em Estatística, a equação de regressão é expressa na forma Os coeficientes b0 e b1 são estatísticas amostrais usadas para estimarem os parâmetros populacionais ᵝ0 e ᵝ1. Portanto, utilizaremos dados amostrais em pares para estimar a equação de regressão. y^ = b0 + b1x 𝑏1 = 𝑥 𝑦 ) − ( 𝑥 ). ( 𝑦𝑖) 𝑛 𝑖=1 𝑛 𝑖=1 𝑖 𝑛. ( 𝑛 𝑖=1 𝑖 𝑖 𝑖 𝑛. ( 𝑛 𝑖=1 𝑖 𝑥 )2 𝑥 2) − ( 𝑛 𝑖=1 e b0 = y - b1x Regressão Linear Simples Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples – Equação: 𝑏1 = 𝑥 𝑦 ) − ( 𝑥 ). ( 𝑦𝑖) 𝑛 𝑖=1 𝑛 𝑖=1 𝑖 𝑛. ( 𝑛 𝑖=1 𝑖 𝑖 𝑖 𝑛. ( 𝑛 𝑖=1 𝑖 𝑥 )2 𝑥 2) − ( 𝑛 𝑖=1 e b0 = y - b1x – Lembrando que: 𝑥 = 𝑛 𝑖=1 𝑥𝑖 (média de x) 𝑦 = 𝑛 𝑛 𝑖=1 𝑦𝑖 𝑛 (média de y) Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Exemplo: Vamos utilizar os dados do exemplo de correlação para encontrar a equação de regressão linear: Estatística Aplicada à Engenharia – Prof. Msc. André Breve NºAnúncios(X) NºAp.Vendidos(Y) X.Y X2 Y2 15 18 270 225 324 25 27 675 625 729 31 32 992 961 1024 35 34 1190 1225 1156 40 38 1520 1600 1444 45 42 1890 2025 1764 Σ=191 Σ=191 Σ=6537 Σ=6661 Σ=6441 y^ = 6,7957 + 0,7865x Regressão Linear Simples Regressão Linear Simples Interpretação do resultado: A equação de regressão tem uma inclinação de 0,7865, ou seja, se aumentarmos x (nº de anúncios) em 1 unidade, o número de apartamentos vendidos aumenta em 0,7865 unidades, aproximadamente. Esta interpretação fica fácil de ser verificada se substituirmos valores para x: – Se x = 3 => y = 6,7957 + 0,7865.(3) => y = 9,1552 – Se x = 4 => y = 6,7957 + 0,7865.(4) => y = 9,9417 y = 9,9417 - 0,7865 Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Regressão Linear Simples – Gráfico da regressão do exemplo: Regressão Linear Simples Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Podemos utilizar a equação de regressão para prever valores de Y para quaisquer valores de X dentro do intervalo estudado Exemplo: x = 38 y^ = 6,7957 + 0,7865.(38) => ^y = 36,6827 Interpretamos o valor y = 36,6827 como uma previsão do nº de apartamentos vendidos quando 38 anúncios forem ao ar durante um mês. Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Regressão Linear Simples – A equação de regressão deve ser utilizada para fazer previsões apenas se ela for um bom modelo para os dados, ou seja, se for verificado por meio de um teste de hipótese que a relação entre as duas variáveis é significante. Caso não seja, o melhor valor previsto é a média. Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Resumo de Correlação e Regressão O diagrama de dispersão nos dá uma ideia da relação, ou não, entre duas variáveis quantitativas. O coeficiente de correlação linear de Pearson mede a intensidade da relação linear, ou seja, só tem sentido calculá-lo se o digrama de dispersão indicar uma relação linear Correlação não indica causa. Uma forte relação entre duas variáveis não é suficiente para que se tirem conclusões de causa e efeito Caso haja relação entre duas variáveis quantitativas, podemos descrevê-la através da equação de regressão que melhor representa a relação Devemos usar a equação de regressão para previsões somente se houver uma correlação linear, confirmada pelo teste de hipótese Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Coeficiente de determinação Em geral, nem todos os pontos ficam sobre a reta Para medir a precisão da reta de regressão ajustada, isto é, a proporção de variação de Y que é explicada pela reta de regressão (variação de X), utilizamos o coeficiente de determinação (R2) R2 = (0,9979)2 = 0,9958 Isto significa que 99,58% da variação do número de apartamentos vendidos se explica pela quantidade de anúncios que foram ao ar durante o mês. Este coeficiente é particularmente importante se vamos usar a equação de regressão para fazer previsões. Quanto mais próximo de 1 for o valor do coeficiente, melhor é o resultado. Estatística Aplicada à Engenharia – Prof. Msc. André Breve Regressão Linear Simples Exercício: Certa empresa está estudando a variação da demanda de um de seus produtos em relação à variação do preço de venda. Os dados estão a seguir: Estatística Aplicada à Engenharia – Prof. Msc. André Breve Analisando os dados, responda aos seguintes itens: Faça o diagrama de dispersão e interprete Calcule o coeficiente de correlação linear Encontre a equação de regressão Faça a previsão para a demanda, considerando o preço de venda x = 105 Calcule o coeficiente de determinação e interprete Preço(X) 40 43 52 55 61 65 70 82 95 108 Demanda(Y) 370 330 300 270 258 249 240 225 220 206 Correlação e Regressão
Compartilhar