Baixe o app para aproveitar ainda mais
Prévia do material em texto
CORRELAÇÃO E REGRESSÃO LINEAR 1.COEFICIENTE DE CORRELAÇÃO LINEAR O instrumento empregado para a medida da correlação é o coeficiente de correlação linear. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sen- tido dessa correlação (positivo ou negativo). Faremos uso do coeficiente de correlação de Pearson, que é dado por: 𝑟 = 𝑐𝑜𝑣 𝑎 𝑟𝑖â𝑛𝑐𝑖𝑎(𝑋, 𝑌) 𝑑𝑒𝑠𝑣𝑖𝑜𝑝𝑎𝑑𝑟ã𝑜(𝑋) × 𝑑𝑒𝑠𝑣𝑖𝑜𝑝𝑎𝑑𝑟ã𝑜(𝑌) ( ) ( ) ( ) ( ) − = − − i i i i XY 2 2 i i2 2 i i X Y X Y n X Y X . Y n n r ( ) ( ) − = − − i i i i XY 2 2 2 2 i i i i n. X .Y X . Y n. X X n. Y Y r ou − − = − − i i XY 2 2 i i (X X)(Y Y) (X X) . (Y Y) r O valor do coeficiente de correlação linear nunca será maior que 1 ou menor que – 1. Oscilará sempre neste intervalo, ou seja, – 1 ≤ r ≤ 1. A fórmula que será escolhida para o cálculo do coeficiente de correlação linear, dependerá dos dados fornecidos na questão. 3. TIPOS DE CORRELAÇÃO Correlação Linear Positiva: Valores crescentes de X associados a valores crescentes de Y. Correlação Linear Perfeita Positiva: Pontos perfei tamente alinhados. 𝑟𝑥𝑦 = 1 Os pontos (X,Y) estão em cima de uma ret a crescente. Correlação Linear Negativa: Valores crescentes d e X associados a valores decrescentes de Y. −1 < 𝑟𝑥𝑦 < 0 Correlação Linear Perfeita Negativa: Pontos perfe itamente alinhados. 𝑟𝑥𝑦 = −1 Os pontos (X,Y) estão em cima de uma reta decr escente. Correlação Linear Nula: Quando não há relação e ntre X e Y. 0 < 𝑟𝑥𝑦 < 1 𝑟𝑥𝑦 = 0 Não podemos definir uma reta crescente nem decrescente para estes pontos acima. 4. PROPRIEDADES DA CORRELAÇÃO: O desenho abaixo mostra a intensidade de correlação de acordo com valor do coeficiente de correlação linear. 1ª) A correlação entre x e x é igual a 1. Ou seja: r (x,x)=1. E também temos que: r(–x, x)= –1,0 r(x, –x)= –1,0 r(–x, –x)=1,0 2ª) A correlação entre x e y é igual à correlação entre y e x. r(x,y) = r(y,x) 3ª) A correlação não é influenciada nem por operações de soma, nem de subtração, nem de produto, e nem de divisão, exceto pelo sinal. r(ax±b, cy±d) = r(x,y) r(ax±b, –cy±d) = r(x,–y) = –r(x,y) r(–ax±b, cy±d) = r(–x,y) = –r(x,y) r(–ax±b, –cy±d) = r(–x,–y) = r(x,y) Regressão Linear Simples A análise de regressão linear simples tem por objeto obter a equação matemática da reta que representa o melhor relacionamento numérico li- near entre o conjunto de pares de dados em amos- tra selecionadas, dos dois conjuntos variáveis. A equação da reta obtida pode ser representada como: Y = a + b. x De um modo geral, as variáveis X e Y, por conven- ção, são definidas do seguinte modo: Y = variável dependente, explicada X = variável independente, explicada No processo de determinação dos valores das constantes a e b, costuma-se aplicar o método dos mínimos quadrados, que determina a equação de ajuste linear que apresenta a menor soma dos quadrados dos erros. A reta estimada de regressão é y = a + b. x, onde: Y = valor calculado na reta de regressão para os valores de X a = ordenada do intercepto da reta no eixo Y b = coeficiente angular da reta de regressão O método dos mínimos quadrados determina que a e b devem ser obtidos de modo que: Correlação: inter- cepto: 𝑎 = ∑ 𝑌 − 𝑏 ∑ 𝑋 𝑛 Correlação: coeficiente angu- lar 𝑏 = 𝑛(∑ 𝑋𝑌) − (∑ 𝑋 ∑ 𝑌) 𝑛(∑ 𝑋2) − (∑ 𝑋)2 EXERCÍCIOS PROPOSTOS Use o enunciado a seguir para responder as questões seguintes. Os dados dos investimentos em publicidade e as vendas da Malhas e Modas Varejo de Roupas Ltda. Estão apresentadas na tabela seguinte. Um analista pensa em executar um ajuste linear, com Y = a + b.X. Mês Gastos com Publi- cidade (X) Vendas (Y) X2 Y2 XY 1 1 7 1 49 7 2 4 18 16 324 72 3 2 10 4 100 20 4 5 22 25 484 110 5 7 27 49 729 189 6 3 15 9 225 45 Soma 22 99 104 1911 443 1. Assinale a alternativa que apresenta o coefici- ente angular do modelo. a) 2,81. c) 4,17. e) 6,67. b) 3,43. d) 5,23. 2. Assinale a alternativa que apresenta o inter- cepto do modelo. a) 0,58. d) 3,92. b) 1,28. e) 4,18. c) 2,88. 3. Sabendo que a empresa projeta para o próximo ano vendas iguais a 25, quais os gastos com pu- blicidade que deveriam ser projetados? a) 6,15 b) 7,18 c) 7,89 d) 8,14 e) 9,74 4. Sabendo que a empresa planeja para o próximo ano gastos com publicidade iguais a 6, quais as vendas projetadas? a) 19,50 b) 20,50 c) 21,50 d) 23,50 e) 24,50 5. Um pesquisador resolveu construir uma equação de ajuste linear para os pontos apresentados na ta- bela seguinte. X Y -2 - 8 6 18 5 11 5 13 1 6 Assinale a alternativa que apresenta um ponto so- bre a reta ajuste. a) 1 e 2 c) 3 e 8 e) 6,67. b) 2 e 5 d) 4 e 10 (ESAF AFTN) Considere a seguinte tabela que apresenta valores referentes às variáveis X e Y, por ventura relacionadas a resolução das cinco questões seguintes. Valores das variáveis X e Y relacionadas X Y X2 Y2 XY 1 5 1 25 5 2 7 4 49 14 3 12 9 144 36 4 13 16 169 52 5 18 25 324 90 6 20 36 400 120 Soma 21 75 91 1111 317 6. Marque a opção que representa o coeficiente de correlação linear entre as variáveis X e Y: a) 0,903. b) 0,926. c) 0,947. d) 0,962. e) 0,989. 7. Marque a opção que representa o coeficiente de determinação entre as variáveis X e Y: a) 0,9522. b) 0,9647. c) 0,9782. d) 0,9899. e) 0,9905. 8. Marque a opção que representa o coeficiente an- gular entre as variáveis X e Y: a) 4,84. b) 3,11. c) 6,75. d) 5,78. e) 2,90. 9. Marque a opção que representa o intercepto en- tre as variáveis X e Y: a) 1,60. b) 0,95. c) 2,48. d) 3,77. e) 4,44. 10. Marque a opção que representa a equação da reta ajuste de mínimos quadrados: a) Yi = 1,601 + 3,114 xi. b) Yi = 1,643 + 3,482 xi. c) Yi = 1,685 + 3,271 xi. d) Yi = 1,713 + 2,992 xi. e) Yi = 1,726 + 2,864 xi. 11. Determine o coeficiente de correlação linear, r, para os dados apresentados a seguir. X Y 1 3 3 7 4 9 a) 0. b) – 1. c) 1. d) Menor que 1 e maior que zero. e) Maior que – 1 e menor que zero. 12. (ANAC) As estatísticas a seguir foram obtidas de observações realizadas em 100 indivíduos com relação a duas características X e Y. ∑ 𝑋𝑖 100 𝑖=1 = 248, ∑ 𝑌𝑖 = −58 100 𝑖=1 , ∑ (𝑋𝑖 − �̄�) 2 = 25100𝑖=1 ∑ (𝑌𝑖 − 𝑌) 2100 𝑖=1 = 144 e ∑ (𝑋𝑖 − �̄�) 10 𝑖=1 (𝑌 − 𝑌) = 43,2 O coeficiente de correlação amostral entre x e y é igual a: a) -0,36. b) -0,18. c) 0,44. d) 0,72. e) 0,80. 13. (TRF) O coeficiente de correlação entre duas variáveis Y e X é igual a +0,8. Considere, agora, a variável Z definida como: Z = 0,2 – 0,5X. o coefici- ente de correlação entre as variáveis Z e X, e o co- eficiente de correlação entre as variáveis Z e Y se- rão iguais, respectivamente, a: a) – 1,0; – 0,8. b) + 1,0; + 0,8. c) – 0,5; – 0,8. d) – 0,5; + 0,8. e) – 0,2; – 0,4. 14. (TRF) Para 5 pares de observações das variá- veis X e Y, obtiveram os seguintes resultados: ∑ 𝑥 = ∑ 𝑦 = 15, ∑ 𝑋2 =∑ 𝑌2 = 55 𝑒 ∑ 𝑋𝑌 = 39 Sabendo se que esses 5 pares de observações constituem a totalidade da distribuição conjunta po- pulacional dessas duas variáveis, o valor do coefi- ciente de correlação entre X e Y é igual a a) + 1,000. b) + 0,709. c) + 0,390 . d) – 0,975. e) – 0,600. 15. (DECEA) Um pesquisador estudou a relação entre o tempo, medido em segundos, que um ins- petor leva para reagir a um estimulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25 inspetores foram coletados e obtidas as se- guintes informações: ∑ 𝑌𝑖 25 𝑖=1 = 2000 ∑ 𝑌𝑖 2 25 𝑖=1 = 235000 ∑ 𝑋𝑖 25 𝑖=1 = 500 ∑ 𝑋𝑖 2 25 𝑖=1 = 20000 ∑ 𝑋𝑖𝑌𝑖 25 𝑖=1 = 65000 As estimativas dos mínimos quadrados, para o co- eficiente linear e a inclinação da reta, respectiva- mente, são: a) 80 e 3,25. b) 50 e 2,85. c) 30 e 2,50. d) 20 e 4,0. e) 10 e 3,62. 16. (ARCE Economista) um comerciante deseja sa- ber a relação entre o aumento da receita de vendas (Y) de seu produto, em milhares de reais, e seu gasto com propagandas (X), também em milhares de reais. Primeiramente optou por analisar o mo- delo linear simples 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖, em que Yi re- presenta o aumento de vendas no mês i, Xi, o gasto com propaganda no mês i, e εi o erro aleatório com hipóteses consideradas para a Regressão Linear Simples (α e β são parâmetros desconhecidos). Com base nas informações do últimos 10 meses e utilizando o método dos mínimos quadrados, ob- teve a equação da reta correspondente e o respec- tivo coeficiente da explicação (R²). ∑ 𝑌𝑖 10 𝑖=1 = 100 ∑ 𝑌𝑖 2 10 𝑖=1 = 1008 ∑ 𝑋𝑖 10 𝑖=1 = 20 ∑ 𝑋𝑖 2 10 𝑖=1 = 120 ∑ 𝑋𝑖𝑌𝑖 10 𝑖=1 = 220 A equação da reta obtida pelo método dos mínimos quadrados e o valor do coeficiente da explicação R² são, respectivamente, a) 𝑌�̂� = 9 + 0,5𝑋𝑖 𝑒 62,5%. b) 𝑌�̂� = 9,5 + 0,25𝑋𝑖 𝑒 62,5%. c) 𝑌�̂� = 9,6 + 0,2𝑋𝑖 𝑒 80%. d) 𝑌�̂� = 9 + 0,5𝑋𝑖 𝑒 80%. e) 𝑌�̂� = 9,5 + 0,25𝑋𝑖 𝑒 80%. 17. (TCE MG Economia) Um estudo realizado em uma empresa sobre a relação entre o lucro bruto anual (Y), em milhares de reais, e os gastos anuais com propaganda (X), também em milhares de re- ais, indica que uma boa opção é a utilização do mo- delo linear simples 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖, em que Yi é o lucro no ano i, Xi representa os gastos com propa- ganda no ano i e εi o erro aleatório com as respec- tivas hipóteses consideradas para a Regressão li- near Simples e α e β são parâmetros desconheci- dos. Por meio do método mínimo quadrado obteve- se o valor de 150 para a estimativa do parâmetro α, considerando as seguintes informações obtidas pe- las observações nos últimos 10 anos: ∑ 𝑌𝑖 10 𝑖=1 = 2500 ∑ 𝑋𝑖 10 𝑖=1 = 400 Utilizando a equação da reta obtida pelo método dos mínimos quadrados, caso a empresa almeje obter em um determinado ano um lucro bruto de 450 mil reais, deve apresentar um total de gastos com propaganda, em mil reais, de a) 60. b) 80. c) 120. d) 160. e) 200. (Aeronáutica Estatístico/2010) O coeficiente da correlação do produto de momentos de Pearson (r), ou apenas coeficientes de correlação linear (r), mede a intensidade da relação linear entre os valo- res quantitativos emparelhados x e y em uma amostra. Dados coletados acerca de duas variáveis aleatórias x (despesas com propaganda) e y (vo- lume de vendas), para quatro empresas, apresen- tam: ∑ 𝑋 = 10, ∑ 𝑋² = 30 ∑ 𝑋. 𝑌 = 60 ∑ 𝑌 = 20, ∑ 𝑌² = 120 18. Qual é o coeficiente linear entre essas duas va- riáveis? a) 0,456. b) 0,587. c) 0,841. d) 1,000. 19. (CODEVASF) Conhecidos os valores: cov (x, y) = -0,0318, desvio-padrão (x) = 0,213073, desvio- padrão (y) = 0,260960, todos referidos à população de duas séries de observações X e Y, o coeficiente de correlação é: a) - 0,5917. b) - 5179. c) 0,5179. d) 0,5791. e) - 0,5791. 0 1 2 3 4 5 6 7 8 9 0 1 SIGA MEU PERFIL NO PASSEI DIRETO https://www.passeidireto.com/perfil/matematica-rapidola
Compartilhar