Buscar

ANÁLISE DE REGRESSÃO E CORRELAÇÃO LINEAR 2017

Prévia do material em texto

ANÁLISE DE REGRESSÃO LINEAR E COEFICIENTE DE CORRELAÇÃO
Objetivo: Predizer o valor de uma variável dependente (resultado da função), uma vez conhecido o valor da variável independente (conteúdo da função). Constitui uma tentativa de estabelecer uma equação matemática linear que descreva o relacionamento entre duas variáveis (uma dependente e outra independente).
A equação de regressão tem por finalidade ESTIMAR valores de uma variável, com base em valores conhecidos da outra.
Ex.: Peso x Idade; Vendas x Lucro; Nota x Horas de Estudo
Ex: Y = a + bxVariável dependente
Variável independente
Hipóteses:
A variável dependente (Y) é uma variável aleatória
Variáveis dependentes (Y) e independentes (X) estão associadas linearmente
As variâncias (valores em torno das médias de Y) da variável dependente, em qualquer valor da variável independente (x), são todas iguais.
DIAGRAMA DE DISPERSÃO:y
X
Método dos mínimos quadrados (mmq) para determinar uma linha de regressão:
Ŷx = a + bx, onde
Ŷx éo valor estimado da variável dependente dado um valor específico da variável independente. “a” é o ponto de interseção da linha de regressão com o eixo y (coeficiente linear); “b” é a declividade da linha de regressão (coeficiente angular); e “x” é o valor da variável independente.
Médias:
 
 
Cálculo da equação de regressão:
Determinação da equação
 portanto, 
O erro padrão de estimação e intervalos de predição (syx) é um desvio padrão condicional, na medida que indica o desvio padrão de uma variável dependente (Y).
O coeficiente de correlação (r) 
Cálculo do erro padrão
Cálculo do Coeficiente de Correlação
 (coeficiente de determinação)
 (coeficiente de correlação)
Exercícios:
Suponha que um analista toma uma amostra aleatória de 10 carregamentos recentes feitos por caminhão de uma determinada companhia e anota a distância em KM e o tempo de entrega em dias.
Determinar a equação de regressão:
	Carregamento
	1
	2
	3
	4
	5
	6
	7
	8
	9
	10
	Distância (Km)
	825
	215
	1070
	550
	480
	920
	1350
	325
	670
	1215
	Tempo (Dias)
	3,5
	1
	4
	2
	1
	3
	4,5
	1,5
	3
	5
	Carregamento
	Distância (X)
	Tempo (Y)
	X.Y
	X2
	Y2
	1
	825
	3,5
	2.887,5
	680.625,0
	12,25
	2
	215
	1,0
	215,0
	46.225,0
	1,00
	3
	1070
	4,0
	4.280,0
	1.144.900,0
	16,00
	4
	550
	2,0
	1.100,0
	302.500,0
	4,00
	5
	480
	1,0
	480,0
	230.400,0
	1,00
	6
	920
	3,0
	2.760,0
	846.400,0
	9,00
	7
	1350
	4,5
	6.075,0
	1.822.500,0
	20,25
	8
	325
	1,5
	487,5
	105.625,0
	2,25
	9
	670
	3,0
	2.010,0
	448.900,0
	9,00
	10
	1215
	5,0
	6.075,0
	1.476.225,0
	25,00
	TOTAL
	7620
	28,5
	26.370,0
	7.104.300,0
	99,75
 
 
 
 
Equação:
a = 2,85 – 0,0036 . 762 => 2,85 – 2,74 => a 0,11
Portanto: Y = 0,11 + 0,0036x
Erro padrão
Coeficiente de Correlação
 
 
 
 
Portanto, 91% da variância, no tempo de entrega, é explicada pela distância. 9% não tem explicação.

Continue navegando