Baixe o app para aproveitar ainda mais
Prévia do material em texto
73 6. CORRELAÇÃO E REGRESSÃO LINEAR É o estudo da existência e do grau de relação entre variáveis, tendo por objetivo medir e avaliar o grau de relação existente entre duas variáveis aleatórias. Por exemplo: O sucesso de um emprego pode ser predito com base no resultado de testes; Quanto maior for a produção, maior será o custo total; Quanto maior for a idade de um automóvel, menor será seu preço de venda. Problemas como esses podem ser estudados através de uma análise de correlação simples, onde podemos determinar a “força” do relacionamento entre estas duas variáveis estudadas. 6.1. CORRELAÇÃO LINEAR SIMPLES Procura medir a relação entre as variáveis X e Y através da disposição dos pontos (X, Y) em torno de uma reta. Como a correlação em estudo tem como “imagem” uma reta crescente ela é chamada correlação linear positiva. Assim, uma correlação é: a) Linear Positiva se os pontos do diagrama têm com “imagem” uma reta crescente; b) Linear Negativa se os pontos do diagrama têm com “imagem” uma reta decrescente; c) Não Linear se os pontos têm com “imagem” uma curva. Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, concluímos que não há relação alguma entre as variáveis em estudo. Temos então: 6.2. COEFICIENTE DE CORRELAÇÃO LINEAR SIMPLES Medida do grau de associação (relacionamento) entre duas variáveis estudadas a partir de uma série de observações. Esta medida é também chamada de coeficiente de correlação de Pearson, em homenagem ao seu criador e é dada por: 74 2222 iiii iiii yynxxn yxyxn r Onde n é o número de pares de valores (x, y) observados e r varia no intervalo 11 r , para o mesmo, temos que: • Valores de r próximos de +1 indicam uma forte correlação positiva entre x e y; • Valores de r próximos de – 1 indicam uma forte correlação negativa entre x e y; • Valores de r próximos de 0 indicam uma fraca correlação positiva ou negativa entre x e y. A partir dos valores de r, podemos verificar o tipo da correlação existente entre as variáveis estudadas, conforme a seguinte tabela: Exemplo: Calcular o coeficiente de correlação relativo a tabela a seguir. Matemática (X) Estatística (Y) X .Y X2 Y2 5 6 8 9 7 8 10 10 6 5 7 7 9 8 3 4 8 6 2 2 Daí: r = ________, resultado que indica uma correlação linear ________________________________ Significativa entre as duas variáveis. Valor de r Correlação 0,0 nula 0,0 ----| 0,5 fraca 0,5 ----| 0,8 média 0,8 ---- 1,0 forte 1,0 perfeita 75 6.3. REGRESSÃO LINEAR Sempre que desejamos estudar determinada variável em função de outra, fazemos uma análise de regressão. Podemos dizer que a análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de n observações das mesmas. As variáveis estudadas serão: x, denominada de variável independente, e y, denominada de variável dependente. As funções resultantes do ajuste de uma função linear entre 2 variáveis y e x, define a linha reta que descreve a associação entre duas características e permite estimar o valor de uma medida pela outra. Para obter a reta de regressão é necessário calcular o Coeficiente angular “a” e o coeficiente linear da reta com o eixo das ordenadas “b”. Parâmetros da reta y = ax + b (Regressão): 22 ii iiii xxn yxyxn a e xayb . Onde: n x x i e n y y i . Exemplo: Com base no exemplo anterior encontre a equação da reta ajustada e em seguida trace-a no gráfico. USANDO O EXCEL Correlação 1. Nas colunas A e B insira os dados conforme imagem. 2. Na célula C2 escreva: r 3. Na célula D2 digite a fórmula: =CORREL(A2:A11;B2:B11) 4. Aperte o ENTER e o valor do coeficiente de correlação aparecerá na célula B2. 76 Regressão Linear 1. Selecione a célula A2 até B11 2. Vá em INSERIR gráfico de dispersão 3. Clique com o botão direito do mousse em um dos pontos do gráfico 4. Vá em adicionar linha de tendência 5. Selecione LINEAR e mostrar equação no gráfico 6. Aperte o ENTER e a equação de regressão linear aparecerá no gráfico. 77 EXERCÍCIOS 1. Sejam os seguintes diagramas de dispersão. Determine se há uma correlação linear positiva, uma correlação linear negativa ou se não há correlação entre as variáveis. ________________________ ________________________ _________________________ 78 2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela: Peso real ( ix ) Peso aparente ( iy ) ii yx 2 ix 2 iy 18 10 30 23 42 33 62 60 73 91 97 98 120 159 ________ _________ ______ ______ ______ Com a tabela preenchida, calcule o índice de correlação. r = 0,98 3. Uma amostra de residências selecionadas aleatoriamente, num bairro, foi observada quanto à idade do imóvel (x), em anos, e ao preço de venda (y), em mil reais, resultando: ix iy ii yx 2 ix 2 iy 1 100 2 80 3 90 4 15 5 50 6 20 _______ _______ _______ _______ _______ Com os dados da tabela, responda os itens abaixo. a) Estime a reta de regressão. y = – 16,14 x + 115,66 b) Calcule o coeficiente de correlação x e y. r = – 0,83 4. Considere os resultados de dois testes, x e y, obtidos por um grupo de alunos da escola A: ix iy ii yx 2 ix 2 iy 11 13 14 14 19 18 19 15 22 22 28 17 30 24 31 22 34 24 37 25 _______ _______ _______ _______ _______ Com os dados da tabela, calcule o coeficiente de correlação. r = 0,89 79 5. Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica” (xi) e “volume de produção nas empresas industriais” (yi), fez-se uma amostragem que inclui vinte empresas, computando- se os seguintes valores: .13,22,96,84,16,12,72,20,34,11 22 iiiiii yxyxyx Determine: a) o cálculo do coeficiente de correlação; r = 0,54 b) a equação de regressão de y para x; y = 1,81 x + 0,01 6. A variação do valor da UPC (Unidade Padrão de Capital), relativamente a alguns meses de 2009, deu origem à tabela: Meses ix Valores (R$) ( iy ) ii yx 2 ix 2 iy Maio 21,75 Junho 21,75 Julho 21,78 Agosto 21,78 Setembro 21,78 Outubro 21,81 Novembro 21,81 _____ _____________ ________ ________ ________ Preencha a tabela e responda os itens abaixo. a) calcule o grau de correlação. r = 0,94 b) estabeleça a equação de regressão de y sobre x. y = 0,34 x + 8,58 c)estime o valor da UPC para o mês de dezembro. R$ 12,66 Sugestão: Substitua os meses, respectivamente, por 5, 6, ..., 11. 7. A partir da tabela: ix iy ii yx 2 ix 2 iy 1 70 2 50 3 40 4 30 5 20 6 10 ___________ _____________ ________ _______ _______ a) calcule o grau de correlação; r = – 0,99 b) determine a reta ajustada; y = – 11,43 x + 76,68 c) estime o valor de y para x = 0. y = 76,68 8. Usando uma amostra de 18 elementos casuais um agente estimou o coeficiente de correlação entre x e y em 0,32. O que isso te comunica sobre essas duas variáveis nessa população? 9. Em certa população o coeficiente de correlação entre x e y é – 0,8. O que isso significa? 10. Quando você investiga a relação entre duas variáveis aleatórias contínuas, por que é importante fazer um gráfico de dispersão dos dados? 80 11. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (x) e a massa muscular (y). Idade (xi) Massa muscular (yi) ii yx 2 ix 2 iy 71 82 64 91 43 100 67 68 56 87 73 73 68 78 56 80 76 65 65 84 45 116 58 76 45 97 53 100 49 105 78 77 73 73 68 78 ________ _________ ________ _________ _________ Com os dados da tabela, responda os itens abaixo. a) O diagrama de dispersão está construído abaixo, interprete-o. b) Calcule o coeficiente de correlação linear entre x e y. O que se pode concluir sobre a correlação de posse do valor de r? c) Ajuste uma reta de regressão para a relação entre as variáveis y: massa muscular (dependente) e x: idade (independente). d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos.
Compartilhar