Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA Aula 05 Correlação e Regressão Correlação é a medida da relação entre duas variáveis. Características: - A correlação está compreendida entre -1 e 1 - Se o valor estiver próximo de zero as variáveis não estão relacionadas - Se o valor é positivo indica que as variáveis se movem juntas - Se o valor é negativo indica que as variáveis se movem em direções opostas Tipos: - Positiva - Negativa - Linear - Não linear Diagramas de dispersão Os diagramas de dispersão constituem uma representação gráfica da relação entre duas variáveis quantitativas, sendo uma de causa e a outra de efeito. Fonte: ebook 4 Fonte: ebook 4 Coeficiente de Correlação de Pearson 𝑟 = 𝑛σ𝑥𝑖𝑦𝑖 − σ𝑥𝑖 σ𝑦𝑖 [𝑛 σ 𝑥𝑖 2 − (σ𝑥𝑖) 2 ][𝑛 σ 𝑦𝑖 2 − (σ𝑦𝑖) 2 ] 𝑛 é 𝑜 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 −1 ≤ 𝑟 ≤ 1 - Se r = +1 há uma correlação perfeita e positiva entre as variáveis - Se r = -1 há uma correlação perfeita e negativa entre as variáveis - Se r = 0 não há correlação entre as variáveis ou a relação que existe não é linear Exemplo 1) (CRESPO, 17 ed.p. 153 ex.1) Calcule o coeficiente de correlação para os valores das variáveis: 𝒙𝒊 4 6 8 10 12 𝒚𝒊 12 10 8 12 14 Solução: n = 5 𝒙𝒊 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊 𝟐 𝒚𝒊 𝟐 4 6 8 60 12 10 12 8 12 14 48 120 64 10 168 16 36 64 100 144 144 100 144 64 196 = 40 = 56 = 460 = 360 = 648 𝑟 = 𝑛σ𝑥𝑖𝑦𝑖 − σ𝑥𝑖 σ𝑦𝑖 [𝑛 σ 𝑥𝑖 2 − (σ𝑥𝑖) 2 ][𝑛 σ 𝑦𝑖 2 − (σ𝑦𝑖) 2 ] 𝑟 = 5.460 − 40.56 [5.360 − 40 2][5.648 − 562] 𝑟 = 2300 − 2240 [1800 − 1600][3240 − 3136] 𝑟 = 60 [200][104] 𝑟 = 0,42 correlação positiva fraca 𝑥𝑖 = 40 𝑦𝑖 = 56 𝑥𝑖𝑦𝑖 = 460 𝑥𝑖 2 = 360 𝑦𝑖 2 = 648 Exemplo 2) (CRESPO, 17 ed.p. 152 ex.1) Calcule o coeficiente de correlação para os valores das variáveis: Matemática 𝒙𝒊 Estatística 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊 𝟐 𝒚𝒊 𝟐 5 6 8 9 7 8 10 10 6 5 7 7 9 8 3 4 8 6 2 2 = 65 = 65 30 72 56 100 30 49 72 12 48 4 = 473 25 64 49 100 36 49 81 9 64 4 4 36 81 64 100 25 49 64 16 36 = 481 = 475 𝑟 = 𝑛σ𝑥𝑖𝑦𝑖 − σ𝑥𝑖 σ𝑦𝑖 [𝑛 σ 𝑥𝑖 2 − (σ𝑥𝑖) 2 ][𝑛 σ 𝑦𝑖 2 − (σ𝑦𝑖) 2 ] 𝑟 = 10.473 − 65.65 [10.481 − 65 2][10.475 − 652] 𝑟 = 4730 − 4225 [4810 − 4225][4750 − 4225] 𝑟 = 505 [585][525] 𝑟 = 0,91 correlação linear positiva forte 𝑟 = 505 554,18 𝑥𝑖 = 65 𝑦𝑖 = 65 𝑥𝑖𝑦𝑖 = 473 𝑥𝑖 2 = 481 𝑦𝑖 2 = 475 Regressão A regressão descreve a partir de um modelo matemático a relação entre duas variáveis considerando n observações. A variável sobre a qual desejamos fazer uma estimativa é a variável dependente (Y) e a outra é a independente (X). 𝑌 = 𝑎 + 𝑏𝑋, a e b são os parâmetros e 𝑌 é 𝑢𝑚𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎. os parâmetros são dados por: 𝑏 = 𝑛σ𝑥𝑖𝑦𝑖 − σ𝑥𝑖 σ𝑦𝑖 𝑛σ𝑥𝑖 2 − (σ𝑥𝑖) 2 ത𝑦 = σ𝑦𝑖 𝑛 𝑎 = ത𝑦 − 𝑏 ҧ𝑥 ҧ𝑥 = σ𝑥𝑖 𝑛 Exemplo 3) (CRESPO, 17 ed.p. 152 ex.1) Escreva a equação de regressão para a tabela a seguir: Matemática 𝒙𝒊 Estatística 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊 𝟐 5 6 8 9 7 8 10 10 6 5 7 7 9 8 3 4 8 6 2 2 = 65 = 65 30 72 56 100 30 49 72 12 48 4 = 473 25 64 49 100 36 49 81 9 64 4 = 481 ҧ𝑥 = σ𝑥𝑖 𝑛 ҧ𝑥 = 65 10 = 6,5 ത𝑦 = σ𝑦𝑖 𝑛 ത𝑦 = 65 10 = 6,5 𝑏 = 𝑛σ𝑥𝑖𝑦𝑖 − σ𝑥𝑖 σ𝑦𝑖 𝑛σ𝑥𝑖 2 − (σ𝑥𝑖) 2 𝑏 = 10.473 − 65.65 10.481 − 652 𝑏 = 4730 − 4225 4810 − 4225 𝑏 = 505 585 𝑏 = 0,8632 𝑎 = ത𝑦 − 𝑏 ҧ𝑥 𝑎 = 6,5 − 0,8632.6,5 𝑎 = 0,8892 𝑌 = 𝑏𝑋 + 𝑎 𝑌 = 0,86𝑋 +0,89 0 2 4 6 8 10 12 0 2 4 6 8 10 12 𝑌 = 0,86𝑋 +0,89 Se x = 0 𝑌 = 0,86 Se x = 10 𝑌 = 9,49 Interpolação e extrapolação Considere a tabela do exemplo anterior e a equação de regressão obtida: 𝑌 = 0,86𝑋 +0,89 Matemática 𝒙𝒊 Estatística 𝒚𝒊 5 6 8 9 7 8 10 10 6 5 7 7 9 8 3 4 8 6 2 2 Podemos estimar qual seria a nota em Estatística se a nota em Matemática foi igual a 4,0. Observe que 4,0 ∈ [2,10] Usando a equação temos: 𝑌 = 0,86.4 +0,89 𝑌 = 4,33 Foi feita uma interpolação porque 4,0 ∈ [2,10] Matemática 𝒙𝒊 Estatística 𝒚𝒊 5 6 8 9 7 8 10 10 6 5 7 7 9 8 3 4 8 6 2 2 Podemos estimar qual seria a nota em Estatística se a nota em Matemática foi igual a 1,0. Observe que 1,0 ∉ [2,10] Usando a equação temos: 𝑌 = 0,86.1 +0,89 𝑌 = 1,75 Foi feita uma extrapolação porque 1,0∉ [2,10] Exercício 1) (CRESPO, 17 ed.p. 159 ex.7) Uma empresa, estudando a variação da demanda de seu produto em relação à variação do preço de venda, obteve a tabela: Preço (𝒙𝒊) 38 42 50 56 59 63 70 80 95 110 Demanda (𝒚𝒊) 350 325 297 270 256 246 238 223 215 208 Determine: a) O coeficiente de correlação b) Estabeleça a equação da reta ajustada c) Estime Y para X = 60 e X = 120 preço 𝒙𝒊 Demanda 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊 𝟐 𝒚𝒊 𝟐 38 350 42 325 50 297 56 270 59 256 63 246 70 238 80 223 95 215 110 208 = 663 = 2 628 13650 13300 14850 15120 15104 15498 16660 17840 20425 22880 1444 1764 2500 3136 3481 3969 4900 6400 9025 12100 122500 105625 88209 72900 65536 60516 56644 49729 46225 43264 = 165 327 σ =48 719 =711 148 a) O coeficiente de correlação 𝑟 = 𝑛σ𝑥𝑖𝑦𝑖 − σ𝑥𝑖 σ𝑦𝑖 [𝑛 σ 𝑥𝑖 2 − (σ𝑥𝑖) 2 ][𝑛σ𝑦𝑖 2 − (σ𝑦𝑖) 2 ] 𝑥𝑖𝑦𝑖 = 165327 𝑥𝑖 = 663 𝑦𝑖 = 2628 𝑥𝑖 2 = 48719 𝑦𝑖 2 = 711148 𝑟 = 10.165327 − 663.2628 [10.48719 − 663 2][10.711148 − 2628 2] 𝑟 = 1653270 − 1742364 [487190 − 439569][7111480 − 6906384] 𝑟 = −89094 [47621][205096] 𝑟 = −89094 98827,5 𝑟 = −0,9015 b) Equação da reta ajustada ҧ𝑥 = σ𝑥𝑖 𝑛 ҧ𝑥 = 663 10 = 66,3 ത𝑦 = σ𝑦𝑖 𝑛 ത𝑦 = 2628 10 = 262,8 𝑏 = 𝑛σ𝑥𝑖𝑦𝑖 − σ𝑥𝑖 σ𝑦𝑖 𝑛σ𝑥𝑖 2 − (σ𝑥𝑖) 2 𝑏 = 10.165327 − 663.2628 10.48719 − 6632 𝑏 = −89094 47621 𝑏 = −1,87 𝑎 = ത𝑦 − 𝑏 ҧ𝑥 𝑎 = 262,8 − (−1,87). 66,3 𝑎 =386,8 𝑌 = 𝑎 + 𝑏𝑋 𝑌 = 386,8 − 1,87𝑋 c) Estime Y para X = 60 e X = 120 𝑌 = 386,8 − 1,87𝑋 𝑌 = 386,8 − 1,87.60 𝑌 = 274,6 𝑌 = 386,8 − 1,87.120 𝑌 = 162,4 Exercício 2) (LARSON/FABER, 4 ed. p.412 ex.3 adaptado) A equação de regressão para os dados sobre gastos com publicidade (em milhares de reais) e vendas da empresa (em milhares de reais) é: 𝑌 = 50 729𝑋 + 104 061 Qual a venda esperada para os seguintes gastos com publicidade: a) 1,5 mil reais; b) 1,8 mil reais a) 𝑌 = 50729𝑋 + 104061 Solução: 𝑌 = 50729. 1,5 + 104061 𝑌 = 180154 𝑚𝑖𝑙 𝑟𝑒𝑎𝑖𝑠 b) 𝑌 = 50729𝑋 + 104061 𝑌 = 50729. 1,8 + 104061 𝑌 = 195373 𝑚𝑖𝑙 𝑟𝑒𝑎𝑖𝑠 Exercício 3) (LARSON/FABER, 4 ed. p.412 ex.1 adaptado) Relacione a descrição na coluna esquerda com a da coluna direita: Coluna I Coluna II 1. Linha de regressão ( ) 2. O valor 𝑦 do ponto de dados que corresponde a 𝑥𝑖 ( ) a linha de melhor ajuste 3. O valor 𝑦 para um ponto na linha de regressão correspondente a 𝑥𝑖 ( ) 𝑦𝑖 4. Inclinação ( ) b 5. Intersecção com o eixo 𝑦 ( ) 6. A média dos valores de 𝑦 ( ) 7. O ponto pelo qual uma linha de regressão sempre passa ( ) a 3 1 2 4 5 6 7 ො𝑦𝑖 ( ҧ𝑥, ത𝑦) ത𝑦 considere a equação de regressão dada por: 𝑌 = 𝑎 + 𝑏𝑋 Exercício 4) (LARSON/FABER, 4 ed. p.412 ex.9 adaptado) Relacione a equação com o gráfico. ( ) ො𝑦 = -1,04.x +50,3 ( ) ො𝑦 = 1,662.x + 83,34 ( ) ො𝑦 = 0,00114.x +2,53 ( ) ො𝑦 = -0,667.x +52,6 C b a d Exercício 4) (ENADE 2021) Exercício 4) (ENADE 2021)
Compartilhar