Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Aulas 22, 23 e 24 Correlação e Regressão Profs. Fernando Tobal Berssaneti André Leme Fleury Renato de Oliveira Moraes Leandro Alves Patah Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • Coeficiente de Correlação • Método dos Mínimos Quadrados Regressão CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • Tendência conjunta: o comportamento de uma está vinculado ao comportamento da outra Duas variáveis quantitativas de interesse CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Coeficiente de Correlação de Pearson n i i yy n i i xx n i iixy yyS xxS yyxxS Onde 1 2 1 2 1 )( )( ))(( yyxx xy SS S r . CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística :,onde SS S r YYXX XY n yx yxSXY . . 2 2 n x xSXX 2 2 n y ySYY CORRELAÇÃO LINEAR Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Coeficiente de Correlação de Pearson r=1 0<r<1 r≈0 -1<r<0 r=-1 CORRELAÇÃO LINEAR Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • Equação que relaciona as variáveis de interesse REGRESSÃO Regressão ),...,,( 21 nxxxfy Y = variável dependente X = variável independente Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • x1, x2, ..., xn são admitidos sem erro; • y é admitido com erro; • ~ N(0; σ²R); • σ²R = constante; Hipóteses – Modelo Usual de Regressão REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Regressão Linear Simples σ²r X1 X2 X3 Modelo Teórico yi = α + βxi + εi REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Reta teórica Reta Estimativa xyi bxay ˆ Coeficiente AngularCoeficiente Linear CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Método dos Mínimos Quadrados 2 22 minˆminmin iiiii bxayyyd di A reta de regressão é aquela que minimiza a soma dos quadrados das distâncias di CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • Sempre há uma reta que representa um conjunto de pontos • Mas nem sempre esta reta é o melhor modelo Método dos Mínimos Quadrados CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 2 22 minˆminmin iiiii bxayyyd 00 22 ii d b ed a CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 2 0)(2 02 iiii ii iii ii xbxayx xbnay Assim bxayx bxay CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística xbya S S xx yxx b xx xy i ii 2 n x xS n yx yxS Onde i ixx ii iixy 2 2 . CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Mês Investimento Vendas Perdidas 1 130 10,1 2 81 10,5 3 93 11,3 4 113 10,5 5 90 11,6 6 63 12,4 7 55 15 8 102 11,3 9 92 12,4 Mês Investimento Vendas Perdidas 10 81 12 11 103 10,9 12 90 11,6 13 74 12,4 14 73 13,1 15 102 10,9 16 78 12 17 100 10,5 18 100 10,5 EXEMPLO 01 Obter a reta de regressão pelo método dos mínimos quadrados que relacione o investimento feito em publicidade e as vendas perdidas mensais obtidas por uma empresa do ramo de confecções. Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Mês Investimento (x) Vendas Perdidas (y) xi² yi² xiyi 1 130 10,1 16900 102,01 1313 2 81 10,5 6561 110,25 850,5 3 93 11,3 8649 127,69 1050,9 4 113 10,5 12769 110,25 1186,5 5 90 11,6 8100 134,56 1044 6 63 12,4 3969 153,76 781,2 7 55 15 3025 225 825 8 102 11,3 10404 127,69 1152,6 9 92 12,4 8464 153,76 1140,8 10 81 12 6561 144 972 11 103 10,9 10609 118,81 1122,7 12 90 11,6 8100 134,56 1044 13 74 12,4 5476 153,76 917,6 14 73 13,1 5329 171,61 956,3 15 102 10,9 10404 118,81 1111,8 16 78 12 6084 144 936 17 100 10,5 10000 110,25 1050 18 100 10,5 10000 110,25 1050 Total 1620 209 151404 2451,02 18504,9 5604 18 1620 151404 1,305 18 2091620 9,18504 . 2 2 2 n x xS n yx yxS i ixx ii iixy EXEMPLO 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística xbya S S xx yxx b xx xy i ii 2 0544,0 5604 1,305 xx xy S S b 511,16 18 1620 0544,0 18 209 xbyaEXEMPLO 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Reta estimativa de regressão: xy 0544,0511,16ˆ EXEMPLO 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Podemos afirmar que o modelo linear é significativo? Qual o valor esperado de y para um determinado x? Podemos testar estatisticamente hipóteses sobre os parâmetros da reta de Mínimos Quadrados? CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Conclusão a partir do valor de r: Se r próximo de +1, existe forte correlação positiva Se r próximo de -1, existe forte correlação negativa Estimativa da Reta de Regressão: Reta de Regressão: abxy xbya Sxx Sxy b :queEm Regressão Linear Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Possíveis exemplos de correlação: Correlação positiva quando X aumenta, Y também aumenta x y x y Possíveis exemplos de correlação: Correlação negativa quando X aumenta, Y diminui Regressão Linear Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Possíveis exemplos de correlação: Nenhuma correlação para cada valor de X, não existe um valor preferencial de Y x y Regressão Linear Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Na elaboração dos gráficos de correlação é importante utilizar o conceito de estratificação Isto é, os pares de dados colocados no gráfico devem corresponder a um conjunto de dados homogêneos x y Regressão Linear Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti,Fleury, Moraes e Patah PRO 3200 – Estatística Os dados da tabela abaixo relacionam a quantidade de recursos humanos empregados em um projeto de TI com a quantidade de dias para execução de um determinado pacote de atividades do projeto. Qtde de pessoas 6 7 8 9 10 Tempo para finalizar o pacote de atividades (dias) 4,62 4,12 3,21 2,86 1,83 4,5 3,88 3,05 2,53 2,02 4,43 4,01 3,16 2,71 2,24 4,81 3,67 3,3 2,62 1,95 Qual a sua conclusão com relação à correlação dos dados? Se eu precisar realizar esse pacote de atividades em 4,5 dias, quantos recursos precisarei alocar? EXERCÍCIO 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística TESTE PARA O COEFICIENTE DE CORRELAÇÃO Para um dado valor de r, o qual é um estimador do coeficiente de correlação populacional , é possível concluir, a um dado nível de significância , se realmente existe correlação linear entre as variáveis 𝐻0: 𝜌 = 0 𝐻1: 𝜌 ≠ 0 𝑡𝑐𝑎𝑙 = 𝑟 𝑛 − 2 1 − 𝑟2 𝑡𝑐𝑟𝑖𝑡 = 𝑡𝑛−2;𝛼 𝑜𝑢 𝛼 2 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Pessoa Altura (cm) Peso (Kg) 1 174 73 2 161 66 3 170 64 4 180 94 5 182 79 6 164 72 7 156 62 8 168 64 9 176 90 10 175 81 Verificar se podemos, ao nível de significância de 5%, concluir a existência de correlação positiva entre altura e o peso das pessoas da amostra abaixo. EXERCÍCIO 02 (Exemplos págs. 183 e 185 – Costa Neto) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuições das Estimativas Intervalos de Confiança CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Testes de Hipóteses Intervalos de Confiança ... Regressão Reta teórica Reta estimativa '' xy 'ˆ bxay CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Variação residual xx xy S S b xbya bxay 'ˆ 2 xxS yxxS ixx iixy CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Método dos Mínimos Quadrados Minimizar a variação residual Variação em torno da reta dos Mínimos Quadrados di 2 )ˆ( 1 2 2 n yy S n i ii R CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Estimação dos parâmetros a e b 2 ... 2 )ˆ( 1 2 2 n bSS n yy S xyyy n i ii R n y yyyS i iiyy 2 22 CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Variáveis aleatórias, portanto, têm distribuição normal com uma média e uma variância. bxay ˆ );(~, );(~ Normalba Normal CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Pode-se demonstrar que: xx R S b b ² )²( )( )(b CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística xx R S b b Normalb ² )²( )( ~ xx R S S bS 2 2 )( CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Pode-se demonstrar que: )(a xx iR nS x a a Normala 2 ² )²( )( ~ CORRELAÇÃO E REGRESSÃO xx iR nS xS aS 22 2 )( Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Intervalos de confiança CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística ')'ˆ( xy 'yˆ 'x CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Intervalo de confiança para o coeficiente angular da reta (β) CORRELAÇÃO E REGRESSÃO )(.2/;2 bStb n Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Intervalo de confiança para a constante “α” CORRELAÇÃO E REGRESSÃO )(.2/;2 aSta n Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Intervalo de Confiança para α+βx’ CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Também é uma distribuição Normal xx i Ri i ii S xx n bxaVar estimativadaVariância bxaEstimativa xy 2 2 1 )( : )( CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Região de confiança de α+βxi ) '1 (.'ˆ 2 2 2/;2 xx Rn S xx n Sty CORRELAÇÃO E REGRESSÃO 𝑦′ = 𝑎 + 𝑏𝑥 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Também é uma distribuição Normal xx i Rii i S xx n bxaVar estimativadaVariância bxaEstimativa 2 2 11)( : CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Região de Previsão para yi = α+βxi+εi xx Rn S xx n Sty 2 2/;2 '1 1.'ˆ CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Dados os pontos abaixo, a respeito de duas substâncias produzidas durante uma reação química. Construir intervalos de 95% de confiança para o valor médio de y e para a previsão y´, quando x=10. x 1 2 3 4 5 6 7 8 y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 EXERCÍCIO 03 (Exemplos págs. 192 e 203 – Costa Neto) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística CORRELAÇÃO E REGRESSÃO Teste de Hipóteses e Análise de Variância aplicados à Regressão POPULAÇÃO AMOSTRA μ σ π x S p Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística xy bxay ˆ Reta teórica Reta experimental CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística x 1 2 3 4 5 6 7 8 y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 EXEMPLO 02a (Exemplo pág. 200 – Costa Neto) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Reta dos Mínimos Quadrados x 1 2 3 4 5 6 7 8 y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 xy 2167,01749,0ˆ xx xy S S b xbya bxay ˆ EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 06,2 8 )2,9( 64,12 42 8 36 204 1,9 8 2,9.36 5,50 2 2 yy xx xyS S S xi yi xiyi xi² yi² 1 2 3 4 5 6 7 8 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 0,5 1,2 2,7 3,2 6,0 9,0 11,9 16,0 1 4 9 16 25 36 49 64 0,25 0,36 0,81 0,64 1,44 2,25 2,89 4,00 36 9,2 50,5 204 12,64 EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Ao nível de 5% de significância, a reta tem inclinação superior a 0,10? EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 1,0: 1,0: 1 0 H H β Teste de Hipóteses EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 0147,0 6 1,9.2167,006,2 2 . 2 2 2 n SbS n yy S xyyyi R Variância residual 06,2 42 1,9 yy xx xy S S S EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 00035,0 42 01422,0 )( 2 2 xx R S S bS Como já vimos na unidade anterior... EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 24,6 00035,0 1,02167,0 )( 00 bS b S S b t xx R calc T de Student EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 943,1 24,6 %5;6;2 ttt t ncrit calc 1,943 EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 1,0: 1,0: 1 0 H H β > 0,10 Como tcalc > tcrít Rejeito H0 a inclinação da reta é maior que 0,10 EXEMPLO 02a Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística xy Ao nível de 5% de significância, a reta passa pela origem? α = 0 EXEMPLO 02b (Exemplo pág. 200 – Costa Neto) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 0: 0: 1 0 H H Teste de Hipóteses EXEMPLO 02b Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 0089,0 42.8 204.0147,0 )²( 854,1 0089,0 01749,0 )( 22 0 xx iR calc nS xS aS Onde aS a t T de Student EXEMPLO 02b Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 447,2 854,1 %5,2;62/;2 ttt t ncrit calc T de Student Continua válida a hipótese de que a reta passa pela origem! EXEMPLO 02b Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Verificar a validade do modelo de regressão Análise de Variância aplicada à Regressão CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 222 ˆˆ yyyyyyS iiyy Graus de Liberdade SQT = SQR + SQE n - 1 = n - 2 + 1 Fonte de Variação x y y^ _ SQR SQE SQT y ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 80 82 84 86 1 2 3 4 5 6 y ymédio 2 : totalVariação yyS yy iyy i SQT = SQR + SQE Fonte de Variação 222 ˆˆ yyyyyyS iiyyANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 80 82 84 86 1 2 3 4 5 6 y f(x) 2 :explicada não Variação ˆ xfy xfyyy i ii SQT = SQR + SQE Fonte de Variação 222 ˆˆ yyyyyyS iiyyANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 80 82 84 86 0 1 2 3 4 5 6 ymédio f(x) 2 :regressão pela explicada Variação ˆ yxf yxfyy SQT = SQR + SQE Fonte de Variação 222 ˆˆ yyyyyyS iiyyANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística xxyyi xyxx yyi SbSSQESQTyySQR bSSbyySQE SyySQT 22 22 2 ˆ ˆ 222 ˆˆ yyyyyyS iiyy SQT = SQR + SQE Fonte de Variação ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 11 2 2 n S n yy S yyi Y 2 ². 2 ˆ 2 2 n SbS n yy S xxyyi R Variância Total Variância Residual ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio F F Regressão 1 Residual Total 2n 1n xxSb . 2 2 ². n SbS xxyy R xx S Sb F 2 2. ;2;1 nF SQT = SQR + SQE xxSbSQE . 2 xxyy SbS SQR .2 yySSQT Se Fcalc > Fcrít Há evidências para validar a regressão ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Coeficiente de Determinação CORRELAÇÃO E REGRESSÃO r2 = SQE SQT = SQT − SQR SQT O coeficiente de determinação mede quanto da variação total foi explicada pela regressão. No caso da regressão linear. É igual ao coeficiente de correlação ao quadrado. Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística ikki Uxxxy ...2211 i k ki Uxxxy ...221 Regressão Linear Múltipla Regressão Polinomial CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Regressão Polinomial CORRELAÇÃO E REGRESSÃO 𝑦𝑃 = 𝑎 + 𝑏 𝑥 − 𝑥 + c(x − 𝑥) 2 𝑦𝑖 = 𝑛𝑎 + 𝑐 𝑥𝑖 − 𝑥 2 𝑥𝑖 − 𝑥 𝑦𝑖 = 𝑏 𝑥𝑖 − 𝑥 2 𝑥𝑖 − 𝑥 2 𝑦𝑖 = 𝑎 𝑥𝑖 − 𝑥 2 + 𝑐 𝑥𝑖 − 𝑥 4 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística X Y 1 0,5 2 0,6 3 0,9 4 0,8 5 1,2 6 1,5 7 1,7 8 2,0 Ajustar a parábola de mínimos quadrados aos dados do quadro ao lado. EXERCÍCIO 04 (Exemplo pág. 200 – Costa Neto) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Analise de Melhoria CORRELAÇÃO E REGRESSÃO • Sempre é possível encontrar um polinômio de grau n-1 que se ajusta aos “n” pontos experimentais • Sempre é possível buscar equações mais elaboradas até o ponto em que a melhoria de ajuste conseguida em relação ao modelo anterior seja significativa Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Analise de Melhoria CORRELAÇÃO E REGRESSÃO • Primeiramente, deve-se achar a equação da reta de regressão • Depois, deve-se verificar se a adoção de uma parábolatraz uma melhoria de ajuste em relação à reta. Se isso ocorrer, verifica-se se a cúbica de regressão apresenta melhoria de ajuste em relação à parábola, e assim sucessivamente • Recomenda-se prosseguir até que duas etapas sucessivas não tenham produzido melhoria significativa Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Analise de Melhoria CORRELAÇÃO E REGRESSÃO A hipótese a ser testada é a de não haver melhoria de ajuste. Essa hipótese será testada, de maneira semelhante ao teste da regressão linear, por: 𝐹 = 𝑦𝑃𝑖 − 𝑦𝑖 2 𝑆𝑃 2 Onde 𝑆𝑃 2 é a estimativa da variância residual em torno da parábola, sendo dado por: 𝑆𝑃 2 = 𝑦𝑖 − 𝑦𝑃𝑖 2 𝑛 − 3 Admitiremos que houve melhoria significativa de ajuste se F > 𝐹1, 𝑛−3;𝛼 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística CORRELAÇÃO E REGRESSÃO 𝑦𝑖 − 𝑦𝑖 2 = 𝑦𝑃𝑖 − 𝑦𝑖 2 + 𝑦𝑖 − 𝑦𝑃𝑖 2 Graus de Liberdade n - 2 = 1 + n - 3 Onde 𝑦𝑃𝑖 são os valores calculados pela parábola Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados G.L. Quadrado Médio F F Melhoria de ajuste 𝑦𝑃𝑖 − 𝑦𝑖 2 1 𝑦𝑃𝑖 − 𝑦𝑖 2 𝐹 = 𝑦𝑃𝑖 − 𝑦𝑖 2 𝑆𝑃 2 𝐹1,𝑛−3; 𝛼 Residual s/ a parábola 𝑦𝑖 − 𝑦𝑃𝑖 2 n-3 𝑆𝑃 2 = 𝑦𝑖 − 𝑦𝑃𝑖 2 𝑛 − 3 Residual s/ a reta 𝑆𝑦𝑦 − 𝑏 2𝑆𝑥𝑥 n-2 CORRELAÇÃO E REGRESSÃO Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 𝑦𝑃 = 0,408 + 0,0772x + 0,0155𝑥 2 Testar se a parábola de mínimos quadrados obtida anteriormente oferece uma representação do fenômeno significativamente melhor que a reta, para os dados do exemplo apresentado anteriormente. 𝑥𝑖 𝑦𝑖 1 0,5 2 0,6 3 0,9 4 0,8 5 1,2 6 1,5 7 1,7 8 2 𝑛 = 𝑆𝑦𝑦 = 𝑆𝑥𝑥 = 𝑦𝑖 = 𝑏 = 𝑥 = EXERCÍCIO 05 (Exemplo pág. 218 – Costa Neto) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 𝑥𝑖 𝑦𝑖 𝑦𝑃𝑖 𝑦𝑖 − 𝑦𝑃𝑖 (𝑦𝑖 − 𝑦𝑃𝑖) 2 1 0,5 2 0,6 3 0,9 4 0,8 5 1,2 6 1,5 7 1,7 8 2 SQRp = EXERCÍCIO 05 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados G.L. Quadrado Médio F F Melhoria de ajuste 𝑦𝑃𝑖 − 𝑦𝑖 2 1 𝐹1,𝑛−3; 𝛼 Residual s/ a parábola 𝑦𝑖 − 𝑦𝑃𝑖 2 n-3 Residual s/ a reta 𝑆𝑦𝑦 − 𝑏 2𝑆𝑥𝑥 n-2 EXERCÍCIO 05 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Os dados da tabela ao lado correspondem às variáveis gasto com alimentação (y) e renda familiar (x), numa amostra de 10 famílias. Ao analisar o diagrama de dispersão, ficou claro que o modelo linear (reta) não é adequado à representação de y em função de x. Porém, não está claro qual dos dois modelos é preferível: uma parábola quadrática ou uma parábola cúbica. X Y 3 1,5 5 3 10 6 20 10 30 15 50 20 70 25 100 30 150 40 200 46 EXERCÍCIO 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Após encontradas as equações para a parábola quadrática e para a parábola cúbica, foram calculados os resíduos para estes dois modelos. y x 𝑦𝑖 − 𝑦𝑃𝑖 quadratico 𝑦𝑖 − 𝑦𝑃𝑖 cubico 1,5 3 -1,72 -0,87 3 5 -0,96 -0,31 6 10 0,21 0,42 10 20 0,66 0,22 15 30 2,28 1,42 20 50 1,00 -0,07 25 70 0,37 -0,31 30 100 -1,85 -1,37 40 150 -0,63 1,20 46 200 0,65 -0,33 a) Que modelo é mais adequado: quadrático ou cúbico? Usar alfa=5%. b) Qual o valor do coeficiente de determinação (r2) para o modelo quadrático? E para o cúbico? c) Qual a estimativa de gasto com alimentação para uma família que tem renda de 1000? EXERCÍCIO 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística y x 𝑦𝑖 − 𝑦𝑃𝑖 quadratico 𝑦𝑖 − 𝑦𝑃𝑖 cubico 𝑦𝑖 − 𝑦𝑃𝑖 2 quadatico 𝑦𝑖 − 𝑦𝑃𝑖 2 Cubico 1,5 3 -1,72 -0,87 3 5 -0,96 -0,31 6 10 0,21 0,42 10 20 0,66 0,22 15 30 2,28 1,42 20 50 1,00 -0,07 25 70 0,37 -0,31 30 100 -1,85 -1,37 40 150 -0,63 1,20 46 200 0,65 -0,33 SQRq = SQRc = SQT = (yi− y 2 = EXERCÍCIO 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte variação SQ GL QM Fcal Fcrit Melhoria Residual para a cúbica Residual para a parábola EXERCÍCIO 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Não se pode afirmar nada. SQT = (yi− y) 2 = 2152,025 R2q = SQT − SQRq SQT = 2152,025 − 14,9369 2152,025 = 0,9931 R2c = SQT − SQRc SQT = 2152,025 − 6,621 2152,025 = 𝟎, 𝟗𝟗𝟔𝟗 EXERCÍCIO 06
Compartilhar