Baixe o app para aproveitar ainda mais
Prévia do material em texto
09/04/2015 1 Regressão Linear Simples – Revisão e Exercícios Prof. Cesar Alexandre de Souza Material desenvolvido em conjunto com a Profa. Adriana Backx Noronha Viana EAD0655 – Técnicas Estatísticas de Projeção Agenda • Correção da Atividade 5 • Revisão do Método dos Mínimos Quadrados – Coeficientes da regressão (bo e b1) – Coeficiente de Determinação (R2) • Exercícios e Dúvidas • Informações sobre a Prova (dia 24/4) O assunto dessa aula encontra-se nas páginas 427 a 444 do livro de Anderson et al (2008) 09/04/2015 2 Atividade 5 Fonte- U.S. Department of Transportation - Página 480 - Texto 2 (Anderson et al; Capítulo 12 - Regressão Linear Simples). Cidades % de motoristas habilitados com menos de 21 Acidentes fatais por mil CNH 1 13% 2,962 2 12% 0,708 3 8% 0,885 4 12% 1,652 5 11% 2,091 6 17% 2,627 7 18% 3,83 8 8% 0,368 9 13% 1,142 10 8% 0,645 11 9% 1,028 12 16% 2,801 13 12% 1,405 14 9% 1,433 15 10% 0,039 16 9% 0,338 17 11% 1,849 18 12% 2,246 19 14% 2,855 20 14% 2,352 21 11% 1,294 Cidades % de motoristas habilitados com menos de 21 Acidentes fatais por mil CNH 22 17% 4,1 23 8% 2,19 24 16% 3,623 25 15% 2,623 26 9% 0,835 27 8% 0,82 28 14% 2,89 29 8% 1,267 30 15% 3,224 31 10% 1,014 32 10% 0,493 33 14% 1,443 34 18% 3,614 35 10% 1,926 36 14% 1,643 37 16% 2,943 38 12% 1,913 39 15% 2,814 40 13% 2,634 41 9% 0,926 42 17% 3,256 a) O que pode-se concluir pela análise visual da relação entre as variáveis? 09/04/2015 3 d) O que se pode concluir a partir do modelo de regressão obtido? 09/04/2015 4 Conceito • Análise de Regressão Linear: técnica estatística utilizada para prever os valores de uma variável dependente, com base nos valores de uma variável independente (Regressão Simples), ou de diversas variáveis independentes (Regressão Múltipla). Variável Independente X Variável Dependente Y Variáveis Independentes X1, X2, X3, ... Xn Regressão Simples Regressão Múltipla O Modelo de Regressão Linear Simples • Modelo de Regressão Linear Simples yi = 0 + 1xi + i • Equação da Regressão Linear Simples E(y|x) = 0 + 1x • Equação Estimada da Regressão Linear Simples (reta ajustada) ŷ = b0 + b1x 09/04/2015 5 O Modelo de Regressão Linear Simples Anderson et al (2008) Pg 430 Ao calcular os valores de b0 e b1 pelo MMQ, estamos na verdade interessados na estimativa dos valores de 0 e 1 tais que E(y|x) = 0 + 1x Daí virá a necessidade de se estudar significância estatística dos coeficientes, que será apresentada na próxima aula QUIZ • A regressão linear simples permite obter: Uma equação que identifica para cada x, o valor exato de y Uma equação que identifica para cada x, o valor esperado de y Uma equação que identifica para cada x, o valor aproximado de y 09/04/2015 6 Estimação dos Parâmetros do Modelo: Método dos Mínimos Quadrados (MMQ) Y X x1 xn XbbY o . ˆ 1 Erros de Predição ... Reta de melhor ajuste x2 xi y1 ... y2 yi yn .. . Estimação dos Parâmetros do Modelo: Método dos Mínimos Quadrados (MMQ) • A minimização pelo método dos mínimos quadrados significa localizar os valores de bo e b1 para minimizar a função • Substituindo , temos que minimizar a seguinte função para os valores de a e b 2 )ˆ( ii YYSSE 2 10 )( ii XbbYSSE ioi XbbY . ˆ 1 2102210221101 ... nn XbbYXbbYXbbYSSE onde: yi = valor observado da variável dependente para a i-ésima observação xi = valor observado da variável independente para a i-ésima observação 09/04/2015 7 Estimação dos Parâmetros do Modelo: Método dos Mínimos Quadrados (MMQ) • Minimizar essa expressão requer igualar suas derivadas parciais em bo e b1 a zero 0 0 1 b SSE b SSE o SSE bo b1 Estimação dos Parâmetros do Modelo: Método dos Mínimos Quadrados (MMQ) • Derivando-se as duas expressões é obtido um conjunto de duas equações simultâneas, que, se resolvido, gera as seguintes soluções: XbYb 10 Eq. ii nxx nyxyx b ii iiii /)( /)( 221 Eq. iii 09/04/2015 8 Estimação dos Parâmetros do Modelo: Método dos Mínimos Quadrados (MMQ) • A partir da equação (iii), é possível derivar a equação (i), mais simplificada para cálculos em planilhas 21 )( ))(( XX YYXX b i ii Eq. i Estimação dos Parâmetros do Modelo: Método dos Mínimos Quadrados (MMQ) • Também é possível demonstrar que a eq (i), no caso da regressão linear simples, pode ser convertida para uma relação entre o coef. de correlação de pearson e os desvios padrão das variáveis x y yx i ii S S r XX YYXX b ,21 )( ))(( Eq. i 09/04/2015 9 Variância Total do Modelo (SST) 200 300 400 500 600 700 800 900 0 20 40 60 80 V e n d as Investimento em Propaganda Vendas por Investimento em Propaganda ŷ = y = 600 2 )( YYSST i Erros em Relação à Previsão (SSE) 200 300 400 500 600 700 800 900 0 20 40 60 80 V e n d as Investimento em Propaganda Vendas por Investimento em Propaganda 2 )ˆ( ii YYSSE ŷ = 364,3 + 5,89x 09/04/2015 10 Avaliação do Modelo: Ajuste Geral • Coeficiente de Determinação (R2) –Variância Total = Variância Não Explicada + Variância Explicada –Variância Total: (SST) –Variância Não Explicada: (SSE) –Variância Explicada: (SSR) 2 )ˆ( ii YY SST SSE SST SSR R 12 Eq. iv 2 )( YYi 2 )ˆ( ii YY QUIZ • Em relação ao coeficiente de determinação, qual dessas afirmações está incorreta: A variância não explicada decorre dos erros de predição A variância total decorre das diferenças em relação à media A variância explicada decorre dos erros em relação à média 09/04/2015 11 y = 0,2871x - 1,5974 R² = 0,7046 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 7% 9% 11% 13% 15% 17% 19% A ci d e n te s fa ta is p o r m il C N H Porcentagem de motoristas habilitados com menos de 21 Acidentes fatais por mil CNH Exercício 1 - a • São dadas cinco observações referentes a duas variáveis, x e y • Desenvolva o diagrama de dispersão para esses dados • O que o diagrama de dispersão indica a respeito da relação entre as duas variáveis? X 1 2 3 4 5 Y 3 7 5 11 14 Anderson et al (2008) 09/04/2015 12 Exercício 1 - b • Observe a tabela desenvolvida a partir dos dados. • Obtenha a equação de regressão para os dados • Use a equação para prever o valor de y quando x = 4 • Sabendo que nesse caso, calcule o coeficiente de determinação X Y 1 3 -2 -5 2 7 -1 -1 3 5 0 -3 4 11 1 3 5 14 2 6 média 3 8 )( YYi )( XX i 40,12)ˆ( 2 ii YY Exercício 2 Um gerente deseja saber se existe relação entre tempo de trabalho (emprego) e salário. Assim, coletou os dados de cinco funcionários e obteve as informações apresentadas a seguir. A tabela apresenta os cálculos dos valores padronizados (x´ e y´). Dados Originais Dados Padronizados Funcion ário Tempo de Trabalho (X)Salário em mil reais (Y) X' Y' X' * Y' 1 1 1,1 -1,21 -1,00 1,21 2 3 1,2 -0,76 -0,78 0,60 3 7 1,4 0,13 -0,35 -0,05 4 9 2 0,58 0,95 0,56 5 12 2,1 1,26 1,17 1,47 Média 6,4 1,56 SOMA 3,79 Desv. pad 4,45 0,46 a) Obtenha o coeficiente de correlação de Pearson e explique o seu significado. b) Teste se existe correlação entre as variáveis (usar α=0,05 e α=0,01): 09/04/2015 13 Exercício 2 Exercício 3 Dada a matriz de correlações a seguir, e considerando que os valores foram obtidos a partir de amostra de 8 respondentes, responda verdadeiro ou falso para cada uma das afirmativas: a) Existe uma forte correlação positiva entre renda e média de anos de estudo dos pais ( ) V ( ) F b) Podemos afirmar que não existe correlação entre as variáveis entre poupança e média de anos de estudo dos para um α=10% ( ) V ( ) F c) A correlação entre média de anos de estudo dos pais e número de filhos indica que quanto maior a média de anos de estudo dos pais, maior o número de filhos ( ) V ( ) F d) A correlação entre poupança e número de filhos é significativa para um α = 5% ( ) V ( ) F Renda Poupança Nr. Filhos Anos de Estudo dos Pais Renda 1 Poupança 0,986 1 Nr. Filhos -0,752 -0,689 1 Anos de Estudo dos Pais 0,974 0,954 -0,788 1 09/04/2015 14 Prova – 24/4 • Em sala (G5) • Individual e sem consulta • Após o início da prova, não é permitido sair da sala antes de terminá-la • Cai: – Correlação de Pearson e Spearman – Significância das correlações de Pearson e Spearman – Regressão Linear simples • Obtenção da Equação da reta ajustada • Coeficiente de Determinação • Significância dos Coeficientes (conceitual – será apresentado na próx aula de 17/4 – em EAD) • Pode usar calculadora (não smartphone), não pode emprestar (traga a sua, por favor)
Compartilhar