Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISE DE REGRESSÃO LINEAR E COEFICIENTE DE CORRELAÇÃO Objetivo: Predizer o valor de uma variável dependente (resultado da função), uma vez conhecido o valor da variável independente (conteúdo da função). Constitui uma tentativa de estabelecer uma equação matemática linear que descreva o relacionamento entre duas variáveis (uma dependente e outra independente). A equação de regressão tem por finalidade ESTIMAR valores de uma variável, com base em valores conhecidos da outra. Ex.: Peso x Idade; Vendas x Lucro; Nota x Horas de Estudo Ex: Y = a + bxVariável dependente Variável independente Hipóteses: A variável dependente (Y) é uma variável aleatória Variáveis dependentes (Y) e independentes (X) estão associadas linearmente As variâncias (valores em torno das médias de Y) da variável dependente, em qualquer valor da variável independente (x), são todas iguais. DIAGRAMA DE DISPERSÃO:y X Método dos mínimos quadrados (mmq) para determinar uma linha de regressão: Ŷx = a + bx, onde Ŷx éo valor estimado da variável dependente dado um valor específico da variável independente. “a” é o ponto de interseção da linha de regressão com o eixo y (coeficiente linear); “b” é a declividade da linha de regressão (coeficiente angular); e “x” é o valor da variável independente. Médias: Cálculo da equação de regressão: Determinação da equação portanto, O erro padrão de estimação e intervalos de predição (syx) é um desvio padrão condicional, na medida que indica o desvio padrão de uma variável dependente (Y). O coeficiente de correlação (r) Cálculo do erro padrão Cálculo do Coeficiente de Correlação (coeficiente de determinação) (coeficiente de correlação) Exercícios: Suponha que um analista toma uma amostra aleatória de 10 carregamentos recentes feitos por caminhão de uma determinada companhia e anota a distância em KM e o tempo de entrega em dias. Determinar a equação de regressão: Carregamento 1 2 3 4 5 6 7 8 9 10 Distância (Km) 825 215 1070 550 480 920 1350 325 670 1215 Tempo (Dias) 3,5 1 4 2 1 3 4,5 1,5 3 5 Carregamento Distância (X) Tempo (Y) X.Y X2 Y2 1 825 3,5 2.887,5 680.625,0 12,25 2 215 1,0 215,0 46.225,0 1,00 3 1070 4,0 4.280,0 1.144.900,0 16,00 4 550 2,0 1.100,0 302.500,0 4,00 5 480 1,0 480,0 230.400,0 1,00 6 920 3,0 2.760,0 846.400,0 9,00 7 1350 4,5 6.075,0 1.822.500,0 20,25 8 325 1,5 487,5 105.625,0 2,25 9 670 3,0 2.010,0 448.900,0 9,00 10 1215 5,0 6.075,0 1.476.225,0 25,00 TOTAL 7620 28,5 26.370,0 7.104.300,0 99,75 Equação: a = 2,85 – 0,0036 . 762 => 2,85 – 2,74 => a 0,11 Portanto: Y = 0,11 + 0,0036x Erro padrão Coeficiente de Correlação Portanto, 91% da variância, no tempo de entrega, é explicada pela distância. 9% não tem explicação.
Compartilhar