Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Msc. Luciano Melo ESTATÍSTICA – CORRELAÇÃO E REGRESSÃO LINEAR CORRELAÇÃO LINEAR Em estatística descritiva, o coeficiente de correlação de Pearson, também chamado de "coeficiente de correlação produto-momento" ou simplesmente de " de Pearson" mede o grau da correlação (e a direção dessa correlação - se positiva ou negativa) entre duas variáveis de escala métrica (intervalar ou de razão). Este coeficiente, normalmente representado por assume apenas valores entre -1 e 1. • Se ρ=1, significa uma correlação perfeita positiva entre as duas variáveis. • Se ρ=-1 significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma aumenta, a outra sempre diminui. • Se ρ=0, significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado deve ser investigado por outros meios. Aqui vamos explorar a penas a correlação linear. CORRELAÇÃO LINEAR Uma empresa compra de um fornecedor, "produtos descartáveis para o consumo mensal" de seus funcionários. As quantidades e os custos destes produtos estão expressos na tabela a seguir. Construa um diagrama de dispersão,(gráfico de nuvem) e obtenha a reta regressão (ajustada) para esta situação. Calcule o valor para uma quantidade estimada em 50 unidades do produto. Quantidades(x) 10 11 12 13 14 15 18 20 Custos(Y) 80 92 100 120 135 142 150 158 Gráfico e equação da reta regressão y = 7,8658x + 11,021 R² = 0,8839 0 20 40 60 80 100 120 140 160 180 0 5 10 15 20 25 C U S TO S QUANTIDADES CONSUMO DE PRODUTOS DESCARTÁVEIS EMPRESA ALFA MAR/2013 Gráfico em nuvem No gráfico de nuvem, devem aparecer somente os pontos! A reta ajustada é traçada ao final. Para traçar a reta, é necessário considerar valores arbitrário para "x" na equação e obter "y". Neste caso, se x=0 , teremos y=11 / Se x=10, teremos y=78. Com estes pontos que podemos chamar de A(0; 11) e B(10,78), traçamos a reta ajustada. Da geometria analítica, temos um postulado que diz "dois pontos determinam uma reta". Assim, os valores indicados para "x" na equação devem ser convenientes...dependendo dos valores das variáveis. Importante: Não é possível determinar a equação da reta (regressão)diretamente pelo modo clássico! As variáveis tem relação estatística entre si, não são, portanto, meras relações funcionais. Passos para obter a equação... 1. Monte a tabela para obter os somatórios com os valores dados no problema. 2. Obtenha os somatórios no final de cada coluna. 3. Determine incialmente as médias para as variáveis "x e "y". 4. Determine o valor do coeficiente "a" usando a fórmula. 5. Determine o valor de "b" apenas substituindo os valores de "x" ; "y" e "a" na fórmula da equação da reta de regressão. 6. Trace os pontos no gráfico "x" e "y" obtendo a nuvem. Neste caso use os dados do problema inicial. 7. Por último trace a reta ajustada, após obter os dois pontos A e B, com valores arbitrários. 8. Finalmente, obtenha o valor para a quantidade desejada substituindo-o na equação final da reta de regressão. Cálculos para obtenção da equação X Y X.Y X.X 10 80 800 100 11 92 1012 121 12 100 1200 144 13 120 1560 169 14 135 1890 196 15 142 2130 225 18 150 2700 324 20 158 3160 400 113 977 14452 1679 Total médias n y y n x x ;12,122 8 977 ;12,14 8 113 87,7 )113()1679.(8 977.113)452.14.(8 )( .. 222 xxn yxyxn a 1112,14).87,7(12,122 bxayb 11.87,7. xbxaY Coeficiente correlação X Y X.Y X.X Y.Y 10 80 800 100 6400 11 92 1012 121 8464 12 100 1200 144 10000 13 120 1560 169 14400 14 135 1890 196 18225 15 142 2130 225 20164 18 150 2700 324 22500 20 158 3160 400 24964 113 977 14452 1679 125117 Total Esta tabela é a mesma da questão anterior, basta acrescentar a coluna Y.Y. OBS: nesta parte do cálculo, não há gráficos! A fórmula para o cálculo de "r" sofre uma modificação no denominador... Veja a raiz quadrada! Cálculo e análise de r... 22 2222 )977()125117.(8].[)113()1679.(8[ )977.(113)14452.(8 ])(.].[)([ .. yynxxn yxyxn r 94,0 88,5546 5215 30767841 5215 r Nota: Este resultado indica uma forte correlação entre as variáveis quantidade e custo. O resultado 0,94 pode ser multiplicado por 100 para exibir a porcentagem, portanto, 94%.
Compartilhar