Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIDADE III Estatística Aplicada Prof. Mauricio do Fanno Correlação: Existência ou não de relação de causalidade entre duas variáveis. Regressão: Modelo matemático que relaciona duas variáveis que se correlacionam. Funções matemáticas: Linear. Quadrática. Logarítmica. Exponencial. Etc. Correlação e regressão lineares Definição Exemplos: O salário de um trabalhador está relacionado à escolaridade dele, ou seja, em que grau a variável, “salário médio de um trabalhador”, está ligada à variável “escolaridade do trabalhador”? A quantidade de livros que uma pessoa já leu está relacionada à sua escolaridade? Em que grau o peso de uma pessoa está relacionado à sua altura? Correlação linear A estatura de uma pessoa está relacionada à sua alimentação? A lucratividade de uma empresa está relacionada ao grau de escolaridade de seus executivos? A capacidade de aprender estatística está relacionada ao sexo do aluno? Variáveis independentes (x) e dependentes (y). Correlação perfeita, forte, fraca e inexistente. Correlação linear Correlação linear Fonte: autoria própria Medida da correlação: coeficiente de Pearson. Correlação linear Correlação de acordo com o coeficiente r: r = -1,00: correlação negativa perfeita r = -0,75: correlação negativa forte r = -0,50: correlação negativa média r = -0,25: correlação negativa fraca r = 0,00: correlação linear inexistente r = +0,25: correlação positiva fraca r = +0,50: correlação positiva média r = +0,75: correlação positiva forte r = +1,00: correlação positiva perfeita Correlação linear Um engenheiro agrônomo afirma que a produção de leite está relacionada com o volume de chuvas no período considerado. Para provar a sua tese ele montou a tabela abaixo referente a nove anos consecutivos. Existe correlação entre essas duas variáveis? E de que tipo se existir? Correlação linear Ano Índice pluviométrico em mm Produção em milhões de litros 2009 19 23 2010 30 27 2011 24 26 2012 23 25 2013 25 24 2014 32 30 2015 28 26 2016 22 25 2017 20 24 n Ano Índice pluviométrico em mm (xi) Produção em milhões de litros (yi) xi 2 yi 2 xi.yi 1 2009 19 23 361 529 437 2 2010 30 27 900 729 810 3 2011 24 26 576 676 624 4 2012 23 25 529 625 575 5 2013 25 24 625 576 600 6 2014 32 30 1024 900 960 7 2015 28 26 784 676 728 8 2016 22 25 484 625 550 9 2017 20 24 400 576 480 Somatórios 223 230 5683 5912 5764 Correlação linear Fonte: autoria própria n Ano xi yi xi 2 yi 2 xi.yi Somatórios 223 230 5683 5912 5764 Correlação linear Fonte: autoria própria Correlação linear Correlação positiva forte Estatisticamente, aferimos a existência da correlação entre duas variáveis utilizando o coeficiente de correlação de Pearson. Suponha que tenhamos calculado esse coeficiente para uma determinada situação prática e ele resultou no valor -0,687. A partir dessa informação, podemos afirmar: a) A correlação entre as variáveis é forte e, quando a variável x aumenta, a variável y diminui. b) A correlação entre as variáveis é média e, quando a variável x aumenta, a variável y também aumenta. Interatividade c) A correlação entre as variáveis é média e, quando a variável x aumenta, a variável y diminui. d) A correlação entre as variáveis é fraca e, quando a variável x aumenta, a variável y diminui. e) A correlação entre as variáveis é forte e, quando a variável x diminui, a variável y também diminui. Interatividade Estatisticamente, aferimos a existência da correlação entre duas variáveis utilizando o coeficiente de correlação de Pearson. Suponha que tenhamos calculado esse coeficiente para uma determinada situação prática e ele resultou no valor -0,687. A partir dessa informação, podemos afirmar: c) A correlação entre as variáveis é média e, quando a variável x aumenta, a variável y diminui. Resposta O gerente de logística de uma transportadora defende que existe correlação entre a quantidade de carga transportada e os consumos de combustível. Para demonstrar seu ponto de vista, montou a tabela a seguir. Existe correlação e, se existir, de que tipo? Correlação linear Carga transportada (toneladas) Consumo de combustível (km/L) 75 4,7 69 5,1 56 4,9 100 3,7 88 4 106 3,4 81 4,1 127 3,5 72 4,9 114 3,3 Fonte: autoria própria n Carga transportada (xi) Consumo de combustível (yi) xi 2 yi 2 xi.yi 1 75,0 4,7 5625,0 22,1 352,5 2 69,0 5,1 4761,0 26,0 351,9 3 56,0 4,9 3136,0 24,0 274,4 4 100,0 3,7 10000,0 13,7 370,0 5 88,0 4,0 7744,0 16,0 352,0 6 106,0 3,4 11236,0 11,6 360,4 7 81,0 4,1 6561,0 16,8 332,1 8 127,0 3,5 16129,0 12,3 444,5 9 72,0 4,9 5184,0 24,0 352,8 10 114,0 3,3 12996,0 10,9 376,2 Somat. 888,0 41,6 83372,0 177,3 3566,8 Correlação linear Fonte: autoria própria n Carga transportada (xi) Consumo de combustível (yi) xi 2 yi 2 xi.yi Somat. 888,0 41,6 83372,0 177,3 3566,8 Correlação linear Fonte: autoria própria Correlação linear Correlação negativa forte Regressão linear Fonte: autoria própria y = variável dependente x = variável independente a = coeficiente angular dado por: b = termo independente dado por: Regressão linear Regressão linear Um engenheiro agrônomo afirma que a produção de leite está relacionada com o volume de chuvas no período considerado. Calculou o coeficiente de correlação( r=0,887) e confirmou sua tese. Determinar agora a reta de regressão linear. Regressão linear Ano Índice pluviométrico em mm Produção em milhões de litros 2009 19 23 2010 30 27 2011 24 26 2012 23 25 2013 25 24 2014 32 30 2015 28 26 2016 22 25 2017 20 24 Fonte: autoria própria Cálculo da média e do desvio padrão de x. Regressão linear n xi di 2 1 19 33,6 2 30 27,0 3 24 0,6 4 23 3,2 5 25 0,0 6 32 51,8 7 28 10,2 8 22 7,8 9 20 23,0 Somatórios 223 157,2 Fonte: autoria própria Cálculo da média e do desvio padrão de y. Regressão linear n yi di 2 1 23 6,8 2 27 2,0 3 26 0,2 4 25 0,4 5 24 2,6 6 30 19,4 7 26 0,2 8 25 0,4 9 24 2,6 Somatórios 230 34,6 Fonte: autoria própria Em que: Regressão linear Regressão linear Regressão linear Fonte: autoria própria Na reta de regressão linear, temos dois coeficientes caracterizadores: o coeficiente angular e o termo independente. Acerca desses dois componentes, podemos afirmar que: a) O termo independente determina a inclinação da reta e, se for positivo, a reta será crescente. b) O coeficiente angular determina o ponto no qual a reta cruza o eixo vertical e, se for positivo, a reta será crescente. Interatividade c) O termo independente determina o ponto no qual a reta cruza o eixo vertical e, se for positivo, a reta será crescente. d) O coeficiente angular determina a inclinação da reta e, se for positivo, a reta será crescente. e) O coeficiente angular determina a inclinação da reta e, se for negativo, a reta será crescente. Interatividade Na reta de regressão linear, temos dois coeficientes caracterizadores: o coeficiente angular e o termo independente. Acerca desses dois componentes, podemos afirmar que: d) O coeficiente angular determina a inclinação da reta e, se for positivo, a reta será crescente. Resposta O gerente de logística de uma transportadora sabe que existe correlação entre o peso de carga transportada e o consumo de combustível, com um índice de correlação de -0,921. Ele querprever o consumo correspondente a uma carga de 140 toneladas. Como fazer? Regressão linear Carga transportada (toneladas) Consumo de combustível (km/L) 75 4,7 69 5,1 56 4,9 100 3,7 88 4 106 3,4 81 4,1 127 3,5 72 4,9 114 3,3 Fonte: autoria própria Cálculo da média e do desvio padrão de x. Regressão linear n xi di 2 1 75 190,4 2 69 392,0 3 56 1075,8 4 100 125,4 5 88 0,6 6 106 295,8 7 81 60,8 8 127 1459,2 9 72 282,2 10 114 635,0 Somatórios 888 4517,2 Fonte: autoria própria Cálculo da média e do desvio padrão de y. Regressão linear n yi di 2 1 4,7 0,25 2 5,1 0,81 3 4,9 0,49 4 3,7 0,25 5 4 0,04 6 3,4 0,64 7 4,1 0,01 8 3,5 0,49 9 4,9 0,49 10 3,3 0,81 Somatórios 41,6 4,28 Fonte: autoria própria Em que: Regressão linear Regressão linear Regressão linear Fonte: autoria própria Regressão linear Fonte: autoria própria Regressão linear O gráfico visto a seguir relaciona, como vimos, a produção de leite com o índice pluviométrico anual. Baseando-se nele, podemos dizer que, para um índice pluviométrico de 25 mm, estima-se a produção de leite em: a) 27,0 milhões de litros. b) 25,6 milhões de litros. c) 28,8 milhões de litros. d) 24,0 milhões de litros. e) 27,8 milhões de litros. Interatividade Fonte: autoria própria O gráfico visto a seguir relaciona, como vimos, a produção de leite com o índice pluviométrico anual. Baseando-se nele, podemos dizer que, para um índice pluviométrico de 25 mm, estima-se a produção de leite em: a) 27,0 milhões de litros. b) 25,6 milhões de litros. c) 28,8 milhões de litros. d) 24,0 milhões de litros. e) 27,8 milhões de litros. Resposta Fonte: autoria própria 25,6 A produção de uma empresa química do produtos XPRO, em milhões de toneladas, nos últimos 11 anos está relacionada no quadro a seguir. Desejamos estimar a produção para os próximos dois anos. Regressão linear – séries históricas Ano Produção Ano Produção 2008 66,6 2014 93,2 2009 84,9 2015 111,6 2010 88,6 2016 88,3 2011 78,0 2017 117,1 2012 96,8 2018 115,2 2013 105,2 Fonte: autoria própria Também se usa o método dos mínimos quadrados, com adaptações. Vários métodos, por exemplo: Regressão linear – séries históricas Regressão linear – séries históricas x y x2 xy 2008 -5 66,6 25 -333,0 2009 -4 84,9 16 -339,6 2010 -3 88,6 9 -265,8 2011 -2 78,0 4 -156,0 2012 -1 96,8 1 96,8 2013 0 105,2 0 0 2014 1 93,2 1 93,2 2015 2 111,6 4 223,2 2016 3 88,3 9 264,9 2017 4 117,1 16 468,0 2018 5 115,2 25 576,0 Somatórios 0 1045,4 110 434,1 Fonte: autoria própria Regressão linear – séries históricas 2012 0 2014 1 2015 2 2016 3 2017 4 2018 5 2019 6 2020 7 Regressão linear – séries históricas Fonte: autoria própria Considerando-se a série histórica que acabamos de calcular, podemos estimar a produção dessa empresa para 2025 em, aproximadamente: a) 131 milhões de toneladas. b) 118 milhões de toneladas. c) 142 milhões de toneladas. d) 151 milhões de toneladas. e) 121 milhões de toneladas. Interatividade Considerando-se a série histórica que acabamos de calcular, podemos estimar a produção dessa empresa para 2025 em, aproximadamente: a) 131 milhões de toneladas. b) 118 milhões de toneladas. c) 142 milhões de toneladas. d) 151 milhões de toneladas. e) 121 milhões de toneladas. Resposta ATÉ A PRÓXIMA!
Compartilhar