Buscar

Aula 07 – Correlação e Regressão

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Aula 07 – Correlação e Regressão
Prof. Me. André Breve andre.breve@estacio.br
CCE0174 – Estatística Aplicada à Engenharia
Correlação e Regressão
Muitos problemas em engenharia e ciências envolvem explorar as relações entre duas ou mais variáveis.
Pressão	de	um	gás	em	um	recipiente	está	relacionada	à temperatura.
A velocidade da água em um canal aberto está relacionada à largura do canal.
O	deslocamento	de	uma	partícula	em	certo	tempo	está relacionado à sua velocidade.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação	e Regressão
Correlação
Objetivo: Verificar se existe relação entre duas variáveis quantitativas, uma chamada variável Y, e a outra, chamada variável X.
Havendo relação entre as variáveis X e Y, podemos escreve-la por meio de uma equação da reta (equação de regressão), que melhor representa essa relação.
Para encontrarmos a equação de regressão, utilizaremos a técnica de regressão linear simples.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Diagrama de Regressão
Responderemos às seguintes perguntas:
Há algum tipo de relação entre as variáveis X e Y?
Qual o tipo de relacionamento entre elas?
Qual a intensidade da relação?
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Diagrama de Dispersão
A primeira análise feita para identificar se existe relação entre duas variáveis é utilizar pares observados para construir um gráfico denominado diagrama de dispersão.
Neste diagrama, os pares ordenados (x,y) representam pontos em um plano coordenado;
A variável X é representada no eixo das abscissas (horizontal) e a variável Y no eixo das ordenadas (vertical)
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Diagrama de Dispersão
–	Alguns tipos de correlação:
Correlação Linear
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Diagrama de Dispersão
A análise do diagrama de dispersão nos permite identificar a forma, a direção e a força da relação particular existente entre duas variáveis quantitativas:
Forma:	análise	baseada	na	disposições	dos	pontos,	em
forma de reta, curva etc.
Direção: crescente ou decrescente
Força: o quão próximo os pontos se aproximam mais de uma
reta
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Diagrama de Dispersão
– Os gráficos abaixo possuem forma bem definida, aproximadamente ao longo de uma linha reta, portanto, um padrão linear
Correlação Linear
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Diagrama de Dispersão
– Nota-se também que os gráficos possuem uma direção bem clara, uma vez que o da esquerda a medida que o X cresce, o Y tende a decrescer enquanto que no da direita a medida que o X cresce, o Y também cresce.
Correlação Linear
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Diagrama de Dispersão
– O gráfico da esquerda não possui forma definida, sugerindo que não há relação entre X e Y enquanto que o gráfico da direita mostra uma forma bem distinta, sugerindo uma relação entre X e Y, cuja forma não é uma reta
Correlação Linear
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Coeficiente de Correlação Linear
Somente a interpretação do diagrama de dispersão pode gerar
interpretações subjetivas
Uma informação complementar à análise gráfica é obtida com o cálculo do coeficiente de correlação linear, r, que é útil para detectar padrões lineares
Coeficiente de correlação linear de Pearson:
r =
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Coeficiente de correlação linear de Pearson
r =
Os valores do coeficiente estão sempre entre -1 ≤ r ≤ 1;
Um valor +1 indica uma relação linear positiva perfeita entre x e y enquanto que um valor -1 indica uma correlação linear negativa perfeita entre x e y;
Valores com coeficiente de correlação linear próximo de zero indicam que x e y não estão linearmente relacionados.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Força da correlação linear
De acordo com VIEIRA (2008, p.117), uma regra prática para
julgar o valor de r, embora rudimentar, é a seguinte:
0 < r < 0,25 ou -0,25 < r < 0: correlação pequena ou nula
•	0,25 < r < 0,50 ou -0,50 < r < -0,25: correlação fraca
•	0,50 < r < 0,75 ou -0,75 < r < -0,50: correlação moderada
0,75 < r < 1 ou -1 < r < -0,75: correlação forte
R = 1 ou r = -1: correlação perfeita
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Exemplo 1: Uma construtora quer verificar a eficácia de seus anúncios em determinado canal de televisão. O objetivo é verificar se há relação entre a quantidade de anúncios e o número de apartamentos vendidos. A tabela abaixo mostra o número de anúncios que foram ao ar por mês, durante seis meses, e o correspondente número de apartamentos vendidos de três torres em lançamentos. Vamos supor que, durante o período de seis meses, o anúncio em televisão foi o único meio de divulgação das torres em lançamento.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
NºAnúncios(X)
NºAp.Vendidos(Y)
15
18
25
27
31
32
35
34
40
38
45
42
Correlação Linear
Exemplo 1: Diagrama de Dispersão
Correlação Linear
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Exemplo 1: Coeficiente de correlação de Pearson
Nº Anúncios(X)
NºAp.Vendidos(Y)
X.Y
X2
Y2
15
18
270
225
324
25
27
675
625
729
31
32
992
961
1024
35
34
1190
1225
1156
40
38
1520
1600
1444
45
42
1890
2025
1764
Σ=191
Σ=191
Σ=6537
Σ=6661
Σ=6441
r =	=	=	= 0,9979
Conclusão: As variáveis nº de anúncios e nº de vendas são fortemente relacionadas
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Correlação Linear
Três possíveis fontes de erros:
Associação não implica causalidade: uma forte associação entre as variáveis não é suficiente para se tirar conclusões de causa e efeito. A variável Y pode ser afetada por alguma variável oculta.
Dados que se baseiam em médias suprimem a variação individual e podem aumentar o coeficiente de correlação
Propriedade da linearidade: mesmo que o valor do coeficiente de correlação linear indique que não há nenhuma correlação linear, o diagrama de dispersão pode retratar um padrão que reflete uma forte relação não-linear.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Correlação Linear
Regressão Linear Simples
Uma reta de regressão é uma linha reta que descreve como uma variável resposta y muda à medida que uma variável explicativa x também varia
Geralmente utilizamos uma reta de regressão para predizer o valor y a partir de um determinado valor de x
Para obtermos a reta de regressão, precisamos da equação de regressão, que é estimada utilizando a técnica de regressão linear simples
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Regressão Linear Simples
–	A regressão linear simples envolve uma variável dependente e uma variável independente.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
–	Equação Geral da Reta:
y = mx + n
m: coeficiente angular (informa a inclinação da reta em relação a x) n: intercepto (ordenada de intersecção da reta com o eixo y)
Se m > 0 (positivo): a reta é crescente
Se m < 0 (negativo): a reta é descrescente
Se m = 0: a reta é paralela ao eixo das abscissas (eixo x)
Regressão Linear Simples
Regressão Linear Simples
–	Em Estatística, a equação de regressão é expressa na forma
Os	coeficientes	b0	e	b1	são	estatísticas	amostrais	usadas	para
estimarem	os	parâmetros
populacionais	ᵝ0	e	ᵝ1.
Portanto,
utilizaremos dados amostrais em pares para estimar a equação de
regressão.
y^ = b0 + b1x
𝑏1 =
𝑥 𝑦 )	− ( 
𝑥 ). ( 
𝑦𝑖)
𝑛
𝑖=1
𝑛
𝑖=1 	 𝑖
𝑛. ( 𝑛
𝑖=1	𝑖 	 𝑖
𝑖
𝑛. ( 𝑛
𝑖=1
𝑖
𝑥 )2
𝑥 2)	− ( 𝑛
𝑖=1
e	b0 = y - b1x
Regressão Linear Simples
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
–	Equação:
𝑏1 =
𝑥 𝑦 )	− ( 
𝑥 ). ( 
𝑦𝑖)
𝑛
𝑖=1
𝑛
𝑖=1 	 𝑖
𝑛. ( 𝑛
𝑖=1	𝑖 	 𝑖
𝑖
𝑛. ( 𝑛
𝑖=1
𝑖
𝑥 )2
𝑥 2)	− ( 𝑛
𝑖=1
e	b0 = y - b1x
–	Lembrando que:
𝑥 =
𝑛
 𝑖=1 𝑥𝑖
(média de x)
𝑦 =
𝑛
𝑛
 𝑖=1 𝑦𝑖
𝑛
(média de y)
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Exemplo: Vamos utilizar os dados do exemplo de correlação para
encontrar a equação de regressão linear:
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
NºAnúncios(X)
NºAp.Vendidos(Y)
X.Y
X2
Y2
15
18
270
225
324
25
27
675
625
729
31
32
992
961
1024
35
34
1190
1225
1156
40
38
1520
1600
1444
45
42
1890
2025
1764
Σ=191
Σ=191
Σ=6537
Σ=6661
Σ=6441
y^ = 6,7957 + 0,7865x
Regressão Linear Simples
Regressão Linear Simples
Interpretação do resultado:
A equação de regressão tem uma inclinação de 0,7865, ou seja, se aumentarmos x (nº de anúncios) em 1 unidade, o número de apartamentos vendidos aumenta em 0,7865 unidades, aproximadamente.
Esta interpretação fica fácil de ser verificada se substituirmos valores para x:
– Se x = 3	=>	y = 6,7957 + 0,7865.(3)	=>	y = 9,1552
– Se x = 4	=>	y = 6,7957 + 0,7865.(4)	=>	y = 9,9417
y = 9,9417 - 0,7865
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Regressão Linear Simples
–	Gráfico da regressão do exemplo:
Regressão Linear Simples
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Podemos utilizar a equação de regressão para prever valores de Y para quaisquer valores de X dentro do intervalo estudado
Exemplo: x = 38
y^ = 6,7957 + 0,7865.(38)	=> ^y = 36,6827
Interpretamos o valor y = 36,6827 como uma previsão do nº de apartamentos vendidos quando 38 anúncios forem ao ar durante um mês.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Regressão Linear Simples
– A equação de regressão deve ser utilizada para fazer previsões apenas se ela for um bom modelo para os dados, ou seja, se for verificado por meio de um teste de hipótese que a relação entre as duas variáveis é significante. Caso não seja, o melhor valor previsto é a média.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Resumo de Correlação e Regressão
O diagrama de dispersão nos dá uma ideia da relação, ou não, entre duas variáveis quantitativas.
O coeficiente de correlação linear de Pearson mede a intensidade da relação linear, ou seja, só tem sentido calculá-lo se o digrama de dispersão indicar uma relação linear
Correlação não indica causa. Uma forte relação entre duas variáveis não é suficiente para que se tirem conclusões de causa e efeito
Caso haja relação entre duas variáveis quantitativas, podemos descrevê-la através da equação de regressão que melhor representa a relação
Devemos usar a equação de regressão para previsões somente se
houver uma correlação linear, confirmada pelo teste de hipótese
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Coeficiente de determinação
Em geral, nem todos os pontos ficam sobre a reta
Para medir a precisão da reta de regressão ajustada, isto é, a proporção de variação de Y que é explicada pela reta de regressão (variação de X), utilizamos o coeficiente de determinação (R2)
R2 = (0,9979)2 = 0,9958
Isto significa que 99,58% da variação do número de apartamentos vendidos se explica pela quantidade de anúncios que foram ao ar durante o mês.
Este coeficiente é particularmente importante se vamos usar a equação de regressão para fazer previsões. Quanto mais próximo de 1 for o valor do coeficiente, melhor é o resultado.
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Regressão Linear Simples
Exercício: Certa empresa está estudando a variação da demanda de um de seus produtos em relação à variação do preço de venda. Os dados estão a seguir:
Estatística Aplicada à Engenharia – Prof. Msc. André Breve
Analisando os dados, responda aos seguintes itens:
Faça o diagrama de dispersão e interprete
Calcule o coeficiente de correlação linear
Encontre a equação de regressão
Faça a previsão para a demanda, considerando o preço de venda x = 105
Calcule o coeficiente de determinação e interprete
Preço(X)
40
43
52
55
61
65
70
82
95
108
Demanda(Y)
370
330
300
270
258
249
240
225
220
206
Correlação	e Regressão

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando