Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA I AULA 07 CORRELAÇÃO E REGRESSÃO <data/hora> <rodapé> 4 Aulas prévias Planejamento da pesquisa. Análise Exploratória de Dados: através de tabelas e gráficos Análise Exploratória de Dados: através de medidas de síntese Correlação e regressão: diagrama de dispersão, coeficiente de correlação <data/hora> <rodapé> <número> Conteúdo desta aula Correlação e regressão: Regressão linear simples. Coeficiente de determinação. <data/hora> <rodapé> <número> Regressão Linear Simples Apenas DUAS variáveis. Variação de Y (dependente) é “explicada” pela variação de X (independente) através do modelo de regressão. Modelo de regressão: equação. Regressão “linear”: equação de reta. <data/hora> <rodapé> <número> Suposições "A função de regressão 'explica' grande parte da variação de Y com X. Uma parcela da variação permanece sem ser explicada, e é atribuída ao acaso". Variação de Y em torno da função: média zero, desvio padrão constante. Possível avaliar a equação de regressão pelo diagrama de dispersão. <data/hora> <rodapé> <número> Exemplo 1 <data/hora> <rodapé> <número> Coeficientes da equação Qual é a “melhor” reta? Método dos MÍNIMOS QUADRADOS: <data/hora> <rodapé> <número> Coeficientes da reta <data/hora> <rodapé> <número> Exemplo 2 Filial Clientes (X) Vendas (Y) X2 Y2 XY 1 907 11,2 822649 125,44 10158,4 2 926 11,05 857476 122,1025 10232,3 ... ... ... ... ... ... 20 621 7,41 385641 54,9081 4601,61 Somatório 14623 176,11 11306209 1602,097 134127,9 <data/hora> <rodapé> <número> Exemplo 2 <data/hora> <rodapé> <número> Exemplo 2 <data/hora> <rodapé> <número> No Excel b = INCLINAÇÃO(células com y; células com x) a = INTERCEPÇÃO(células com y; células com x) <data/hora> <rodapé> <número> Outros modelos Logarítmico Polinômio de 2º grau Potência Exponencial ; <data/hora> <rodapé> <número> Coeficiente de Determinação – r2 Mede quanto da variação total de Y em torno da sua média pode ser explicada pelo modelo de regressão. <data/hora> <rodapé> <número> Coeficiente de Determinação – r2 0 ≤ r2 ≤ 1 Quanto mais próximo de 1 for o r2 melhor será o modelo de regressão. Ao comparar dois modelos de regressão para os mesmos dados: recomendável o de maior r2. <data/hora> <rodapé> <número> Exemplo 3 APENAS para o caso linear: r2 = (0,9549)2 = 0,9118 Em média, 91,18% da variabilidade de Y pode ser “explicada” pela variabilidade de X através do modelo linear Y = 0,0087 ×X + 2,423 <data/hora> <rodapé> <número> Exemplo 3 <data/hora> <rodapé> <número> Tô afim de saber... Sobre regressão linear simples, coeficiente r2 e outros aspectos: BARBETTA,P. A. Estatística Aplicada às Ciências Sociais. 8ª. ed. – Florianópolis: Ed. da UFSC, 2008, capítulo 13. MOORE, D.S., McCABE, G.P., DUCKWORTH, W.M., SCLOVE, S. L., A prática da estatística empresarial: como usar dados para tomar decisões. Rio de Janeiro: LTC, 2006. Capítulo 2. <data/hora> <rodapé> <número> Tô afim de saber... Para saber como realizar as análises descritas na Unidade 4 através do Microsoft Excel consulte “Análise Bidimensional com o Microsoft Excel ”, disponível no ambiente virtual assim como o arquivo de dados usado nos exemplos apresentados, ou no canal menreis39 no YouTube. <data/hora> <rodapé> <número> Próxima aula Correlação e Regressão Análise de Resíduos <data/hora> <rodapé> <número> image1.wmf 4567891011121340050060070080090010001100Vendas semnais da filial ($1000)Número semanal de clientes da filialVendas semanais por número de clientes oleObject1.bin image2.wmf a bX Y + = ˆ oleObject2.bin image3.wmf ( ) å - Þ 2 i Y ˆ i Y min b e a image4.wmf a bX Y + = ˆ image5.wmf ( ) å - Þ 2 i Y ˆ i Y min b e a image6.wmf ( ) ( ) 2 1 1 2 1 1 1 ÷ ø ö ç è æ - ´ ´ - ´ ´ = å å å å å = = = = = n i i n i i n i i n i i n i i i x x n y x y x n b image7.wmf n x b y a n i i n i i å å = = ´ - = 1 1 image8.wmf ( ) ( ) 2 1 1 2 1 1 1 ÷ ø ö ç è æ - ´ ´ - ´ ´ = å å å å å = = = = = n i i n i i n i i n i i n i i i x x n y x y x n b image9.wmf n x b y a n i i n i i å å = = ´ - = 1 1 image10.wmf ( ) ( ) ( ) 008729 , 0 14623 11306209 20 ) 11 , 176 14623 ( 9 , 134127 20 2 2 1 1 2 1 1 1 = - ´ ´ - ´ = ÷ ø ö ç è æ - ´ ´ - ´ ´ = å å å å å = = = = = n i i n i i n i i n i i n i i i x x n y x y x n b image11.wmf 423 , 2 20 14623 008729 , 0 11 , 176 1 1 = ´ - = ´ - = å å = = n x b y a n i i n i i image12.wmf ( ) ( ) ( ) 008729 , 0 14623 11306209 20 ) 11 , 176 14623 ( 9 , 134127 20 2 2 1 1 2 1 1 1 = - ´ ´ - ´ = ÷ ø ö ç è æ - ´ ´ - ´ ´ = å å å å å = = = = = n i i n i i n i i n i i n i i i x x n y x y x n b image13.wmf 423 , 2 20 14623 008729 , 0 11 , 176 1 1 = ´ - = ´ - = å å = = n x b y a n i i n i i image14.wmf y = 0,0087x + 2,423 4567891011121340050060070080090010001100Vendas semnais da filial ($1000)Número semanal de clientes da filial Vendas semanais por número de clientes image15.wmf ( ) ( ) total iância explicada variância Y Y Y Y r n i i n i i var ˆ 1 2 1 2 2 = - - = å å = = image16.wmf ( ) ( ) total iância explicada variância Y Y Y Y r n i i n i i var ˆ 1 2 1 2 2 = - - = å å = = image17.wmf y = 0,0087x + 2,423R² = 0,91194567891011121340050060070080090010001100Vendas semnais da filial ($1000)Número semanal de clientes da filialVendas semanais por número de clientes
Compartilhar