Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 TRABALHO DE ESTATÍSTICA EXERCÍCIOS - CORRELAÇÃO E REGRESSÃO CURITIBA 2010 2 DANIELE FERREIRA TRABALHO DE ESTATÍSTICA EXERCÍCIOS - CORRELAÇÃO E REGRESSÃO CURITIBA 2010 Trabalho apresentado à ESIC - Business & Marketing School, como requisito para obtenção de nota parcial na disciplina de Estatística dedutiva, turma 3F1D. Sob orientação do prof o Gilmar Bornatto. 3 SUMÁRIO 1. EXERCÍCIO .......................................................................................................... 7 RESOLUÇÃO .......................................................................................................... 8 Item (a) – diagrama de dispersão .......................................................................... 8 Item (b) – Coeficiente de Pearson ......................................................................... 9 2. EXERCÍCIO .......................................................................................................... 9 RESOLUÇÃO ........................................................................................................ 10 Item (a) – diagrama de dispersão ........................................................................ 10 Item (b) – Ponto Discrepante ............................................................................... 11 Item (c) – Coeficiente de Pearson ........................................................................ 11 Item (d) – Coeficiente de Pearson – sem ponto discrepante ............................. 12 4. EXERCÍCIO ........................................................................................................ 13 RESOLUÇÃO ........................................................................................................ 13 Item (a) – Coeficiente de Pearson ........................................................................ 13 5. EXERCÍCIO ........................................................................................................ 14 RESOLUÇÃO ........................................................................................................ 14 Item (a) – Interpretação ....................................................................................... 14 Item (b) – Interpretação ....................................................................................... 14 Item (c) – Interpretação ....................................................................................... 14 6. EXERCÍCIO ........................................................................................................ 15 RESOLUÇÃO .......................................................................................................... 5 Item (a) – Interpretação ....................................................................................... 15 Item (b) – Interpretação ....................................................................................... 15 7. EXERCÍCIO ........................................................................................................ 15 RESOLUÇÃO ........................................................................................................ 15 Item (a) – Interpretação ....................................................................................... 15 Item (b) – Equação da regressão ......................................................................... 15 Item (c) – Gráfico .................................................................................................. 17 Item (d) – Interpretação ....................................................................................... 17 Item (e) – Coeficiente de Determinação .............................................................. 17 Item (f) – Interpretação ........................................................................................ 18 4 9. EXERCÍCIO ........................................................................................................ 18 RESOLUÇÃO ........................................................................................................ 18 Item (a) – Média e Desvio Padrão ....................................................................... 19 Item (b) – Diagrama de Dispersão ...................................................................... 19 Item (c) – Reta de Regressão ............................................................................... 20 Item (d) – Coeficiente de Correlação .................................................................. 21 10. EXERCÍCIO ........................................................................................................ 22 RESOLUÇÃO ........................................................................................................ 22 Item (a) – Interpretação ....................................................................................... 22 Item (b) – Diagrama de Dispersão ...................................................................... 23 Item (c) – Coeficiente de Correlação ................................................................... 23 11. EXERCÍCIO ........................................................................................................ 24 RESOLUÇÃO ........................................................................................................ 25 Item (a) – Média e Desvio Padrão ....................................................................... 25 1. Conjunto 1 ........................................................................................................ 25 2. Conjunto 2 ......................................................................................................... 26 3. Conjunto 3 ........................................................................................................ 26 4. Conjunto 4 ........................................................................................................ 27 Item (b) – Coeficiente de Correlação .................................................................. 27 1. Conjunto 1 ........................................................................................................ 27 2. Conjunto 2 ......................................................................................................... 28 3. Conjunto 3 ........................................................................................................ 28 4. Conjunto 4 ........................................................................................................ 29 Item (c) – Diagrama de Dispersão ....................................................................... 29 1. Conjunto 1 ........................................................................................................ 29 2. Conjunto 2 ......................................................................................................... 30 3. Conjunto 3 ........................................................................................................30 4. Conjunto 4 ........................................................................................................ 31 Item (d) – Interpretação ....................................................................................... 31 12. EXERCÍCIO ........................................................................................................ 32 RESOLUÇÃO ........................................................................................................ 32 Item (a) – Diagrama de Dispersão ....................................................................... 32 1. Produtividade X Alimentação .......................................................................... 32 2. Produtividade X Exercícios ............................................................................... 33 3. Produtividade X Rodízio .................................................................................. 33 Item (b) – Coeficiente de Correlação .................................................................. 34 1. Produtividade X Alimentação .......................................................................... 34 5 2. Produtividade X Exercícios ............................................................................... 35 3. Produtividade X Rodízio .................................................................................. 36 13. EXERCÍCIO ........................................................................................................ 37 RESOLUÇÃO ........................................................................................................ 37 Item (a) – Diagrama de Dispersão (Renda e Poupança) ................................... 38 Item (b) – Equação da regressão e Interpretação .............................................. 38 Item (c) – Interpretação ....................................................................................... 39 Item (d) – Coeficiente de Correlação .................................................................. 40 Item (e) – Coeficiente de Determinação .............................................................. 40 Item (f) – Diagrama de Dispersão (Renda e Consumo) .................................... 41 14. EXERCÍCIO ........................................................................................................ 42 RESOLUÇÃO ........................................................................................................ 43 Item (a) – Diagrama de Dispersão ....................................................................... 43 Item (b) – Equação da regressão e Interpretação .............................................. 43 Item (c) – Interpretação ....................................................................................... 44 Item (d) – Reta de Regressão ............................................................................... 44 Item (e) – Coeficiente de Correlação ................................................................... 45 Item (f) – Coeficiente de Determinação .............................................................. 45 15. EXERCÍCIO ........................................................................................................ 46 RESOLUÇÃO ........................................................................................................ 47 Item (a) – Coeficiente de Correlação .................................................................. 47 1. Renda e Poupança ............................................................................................. 47 2. Renda e número de Filhos ................................................................................. 48 3. Poupança e número de Filhos ........................................................................... 49 4. Média dos anos de estudo e número de Filhos ................................................. 50 5. Renda Familiar e média dos anos de estudo ..................................................... 51 Item (b) – Equação da regressão e Interpretação ............................................... 51 16. EXERCÍCIO ........................................................................................................ 52 RESOLUÇÃO ........................................................................................................ 53 Item (a) – Diagrama de Dispersão ....................................................................... 53 Item (b) – Equação da regressão e Interpretação .............................................. 53 Item (c) – Interpretação ....................................................................................... 54 Item (d) – Reta de Regressão ............................................................................... 55 Item (e) – Coeficiente de Correlação ................................................................... 55 Item (d) – Coeficiente de Determinação ............................................................. 56 6 17. EXERCÍCIO ........................................................................................................ 56 RESOLUÇÃO ........................................................................................................ 56 Item (a) – Coeficiente de Correlação .................................................................. 56 Item (b) – Interpretação ....................................................................................... 57 18. EXERCÍCIO ........................................................................................................ 57 RESOLUÇÃO ........................................................................................................ 58 Item (a) – Coeficiente de Correlação .................................................................. 58 Item (b) – Interpretação ....................................................................................... 58 Item (c) – Interpretação ....................................................................................... 58 Item (d) – Equação da Regressão ........................................................................ 59 Item (e) – Diagrama de Dispersão e reta de Regressão ..................................... 59 Item (f) – Interpretação ........................................................................................ 60 Item (g) – Interpretação ....................................................................................... 60 Item (h) – Interpretação ....................................................................................... 60 19. EXERCÍCIO ........................................................................................................ 61 RESOLUÇÃO ........................................................................................................ 61 Item (a) – Interpretação ....................................................................................... 61 Item (b) – Interpretação ....................................................................................... 61 20. EXERCÍCIO ........................................................................................................ 61 RESOLUÇÃO ........................................................................................................62 Item (a) – Diagrama de Dispersão ....................................................................... 62 Item (b) – Coeficiente de Correlação .................................................................. 63 Item (c) – Interpretação e Coeficiente de Correlação ....................................... 64 Item (d) – Interpretação ....................................................................................... 64 Item (e) – Interpretação ....................................................................................... 64 7 Correlação e Regressão- Lista De Exercícios 1. Considerando os dados do Quadro 1: a) Construir um diagrama de dispersão para as variáveis taxa de alfabetização e taxa de mortalidade infantil. Quais as informações observadas no gráfico? b) Calcule o coeficiente de correlação de Pearson entre as variáveis taxa de alfabetização e taxa de mortalidade infantil. Interprete o resultado obtido. Quadro 1 - Alguns dados de doze importantes municípios catarinenses município população (em 1000 hab.) população urbana % população urbana taxa de cresc. Demográfico taxa mortalidade infantil taxa de alfabetização Itajaí 101 94 93 3,19 37 85 Blumenau 193 181 94 4,6 27 90 Rio do Sul 42 39 94 2,78 38 85 Joinville 304 292 96 6,46 25 87 Curitibanos 42 32 76 1,99 67 75 Lages 152 126 83 1,89 63 78 Canoinhas 55 36 66 2,92 41 81 Chapecó 105 77 73 5,32 13 75 Concórdia 68 25 37 2,71 28 84 Floripa 219 186 85 3,11 17 87 Criciúma 129 116 90 3,11 32 85 Laguna 42 33 78 1,21 32 77 8 Resolução: n taxa de mortalidade (x) taxa de alfabetização (y) x2 y2 (x.y) 1 37 85 1369 7225 3145 2 27 90 729 8100 2430 3 38 85 1444 7225 3230 4 25 87 625 7569 2175 5 67 75 4489 5625 5025 6 63 78 3969 6084 4914 7 41 81 1681 6561 3321 8 13 75 169 5625 975 9 28 84 784 7056 2352 10 17 87 289 7569 1479 11 32 85 1024 7225 2720 12 32 77 1024 5929 2464 ∑ 420 989 17596 81793 34230 a) Diagrama de Dispersão: Observa-se que os pontos estão bastante dispersos, poderá, provavelmente, haver fraca ou média correlação.// 74 76 78 80 82 84 86 88 90 92 0 20 40 60 80 9 b) Coeficiente de Pearson r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟐.(𝟑𝟒𝟐𝟑𝟎)–(𝟒𝟐𝟎).(𝟗𝟖𝟗) √[𝟏𝟐.(𝟏𝟕𝟓𝟗𝟔)−(𝟒𝟐𝟎)𝟐].[𝟏𝟐.(𝟖𝟏𝟕𝟗𝟑)−(𝟗𝟖𝟗)𝟐] r= 𝟒𝟏𝟎𝟕𝟔𝟎−𝟒𝟏𝟓𝟑𝟖𝟎 √[𝟐𝟏𝟏𝟏𝟓𝟐−𝟏𝟕𝟔𝟒𝟎𝟎].[𝟗𝟖𝟏𝟓𝟏𝟔−𝟗𝟕𝟖𝟏𝟐𝟏] → r= −𝟒𝟔𝟐𝟎 √[𝟑𝟒𝟕𝟓𝟐].[𝟑𝟑𝟗𝟓] r= −𝟒𝟔𝟐𝟎 √𝟏𝟏𝟕𝟗𝟖𝟑𝟎𝟒𝟎 → r= −𝟒𝟔𝟐𝟎 𝟏𝟎𝟖𝟔𝟏,𝟗𝟗𝟗𝟖𝟐 → r= -0,42533604// O coeficiente de Pearson é -0,4253 existindo portanto, uma correlação negativa fraca.// 2. Sendo X= nota na prova do vestibular de matemática e Y= nota final na disciplina de cálculo. Estas variáveis foram observadas em 20 alunos, ao final do primeiro período letivo de um curso de engenharia. Os dados são apresentados a seguir: x y x y x y x y x y 39 65 43 78 21 52 64 82 65 88 57 92 47 89 28 73 75 98 47 71 34 56 52 75 35 50 30 50 28 52 40 70 70 50 80 90 32 58 67 88 a) Construa um diagrama de dispersão e verifique se existe correlação entre os dados observados destas duas variáveis. b) Existe algum aluno que foge ao geral dos demais (ponto discrepante)? c) Calcule a correlação entre a nota no vestibular de matemática e a nota na disciplina de cálculo d) Retire o valor discrepante detectado e calcule novamente o coeficiente r . Interprete. 10 Resolução: n x y x2 y2 (x.y) 1 39 65 1521 4225 2535 2 57 92 3249 8464 5244 3 34 56 1156 3136 1904 4 40 70 1600 4900 2800 5 43 78 1849 6084 3354 6 47 89 2209 7921 4183 7 52 75 2704 5625 3900 8 70 50 4900 2500 3500 9 21 52 441 2704 1092 10 28 73 784 5329 2044 11 35 50 1225 2500 1750 12 80 90 6400 8100 7200 13 64 82 4096 6724 5248 14 75 98 5625 9604 7350 15 30 50 900 2500 1500 16 32 58 1024 3364 1856 17 65 88 4225 7744 5720 18 47 71 2209 5041 3337 19 28 52 784 2704 1456 20 67 88 4489 7744 5896 ∑ 954 1427 51390 106913 71869 a) Diagrama de Dispersão: Observa-se no gráfico a existência de uma correlação média entre os dados.// 0 20 40 60 80 100 120 0 20 40 60 80 100 11 b) Sim, o ponto em questão é P= (70,50) a tendência é que a nota na disciplina de cálculo seja sempre maior que a nota obtida no vestibular de matemática, este aluno foi o único que obteve nota no vestibular superior a nota na disciplina de cálculo.// c) Coeficiente de Pearson: r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟐𝟎.(𝟕𝟏𝟖𝟔𝟗)–(𝟗𝟓𝟒).(𝟏𝟒𝟐𝟕) √[𝟐𝟎.(𝟓𝟏𝟑𝟗𝟎)−(𝟗𝟓𝟒)𝟐].[𝟐𝟎.(𝟏𝟎𝟔𝟗𝟏𝟑)−(𝟏𝟒𝟐𝟕)𝟐] r= 𝟏𝟒𝟑𝟕𝟑𝟖𝟎−𝟏𝟑𝟔𝟏𝟑𝟓𝟖 √[𝟏𝟎𝟐𝟕𝟖𝟎𝟎−𝟗𝟏𝟎𝟏𝟏𝟔].[𝟐𝟏𝟑𝟖𝟐𝟔𝟎−𝟐𝟎𝟑𝟔𝟑𝟐𝟗] → r= 𝟕𝟔𝟎𝟐𝟐 √[𝟏𝟏𝟕𝟔𝟖𝟒].[𝟏𝟎𝟏𝟗𝟑𝟏] r= 𝟕𝟔𝟎𝟐𝟐 √𝟏𝟏𝟗𝟗𝟓𝟔𝟒𝟕𝟖𝟎𝟒 → r= 𝟕𝟔𝟎𝟐𝟐 𝟏𝟎𝟗𝟓𝟐𝟒,𝟔𝟒𝟒𝟕 → r= 0,6941// O coeficiente de Pearson é 0,6941 existindo portanto, uma correlação positiva média.// 12 d) Coeficiente de Pearson - sem P= (70,50): n x y x2 y2 (x.y) 1 39 65 1521 4225 2535 2 57 92 3249 8464 5244 3 34 56 1156 3136 1904 4 40 70 1600 4900 2800 5 43 78 1849 6084 3354 6 47 89 2209 7921 4183 7 52 75 2704 5625 3900 8 21 52 441 2704 1092 9 28 73 784 5329 2044 10 35 50 1225 2500 1750 11 80 90 6400 8100 7200 12 64 82 4096 6724 5248 13 75 98 5625 9604 7350 14 30 50 900 2500 1500 15 32 58 1024 3364 1856 16 65 88 4225 7744 5720 17 47 71 2209 5041 3337 18 28 52 784 2704 1456 19 67 88 4489 7744 5896 ∑ 884 1377 46490 104413 68369 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟗.(𝟔𝟖𝟑𝟔𝟗)–(𝟖𝟖𝟒).(𝟏𝟑𝟕𝟕) √[𝟏𝟗.(𝟒𝟔𝟒𝟗𝟎)−(𝟖𝟖𝟒)𝟐].[𝟏𝟗.(𝟏𝟎𝟒𝟒𝟏𝟑)−(𝟏𝟑𝟕𝟕)𝟐] r= 𝟏𝟐𝟗𝟗𝟎𝟏𝟏−𝟏𝟐𝟏𝟕𝟐𝟔𝟖 √[𝟖𝟖𝟑𝟑𝟏𝟎−𝟕𝟖𝟏𝟒𝟓𝟔].[𝟏𝟗𝟖𝟑𝟖𝟒𝟕−𝟏𝟖𝟗𝟔𝟏𝟐𝟗] → r= 𝟖𝟏𝟕𝟒𝟑 √[𝟏𝟎𝟏𝟖𝟓𝟒].[𝟖𝟕𝟕𝟏𝟖] r= 𝟖𝟏𝟕𝟒𝟑 √𝟖𝟗𝟑𝟒𝟒𝟐𝟗𝟏𝟕𝟐 → r= 𝟖𝟏𝟕𝟒𝟑 𝟗𝟒𝟓𝟐𝟐,𝟏𝟎𝟗𝟒𝟑 → r= 0,8648// O coeficiente de Pearson é 0,8648 existindo portanto, uma correlação positiva forte. Há uma tendência entre esses pontos de que a nota na disciplina de cálculo seja sempre superior a nota no vestibular de matemática. Quando tirou-se o ponto discrepante (70,50), onde a nota no vestibular havia sido superior a nota na disciplina de cálculo, houve um aumento da correlação entre as notas.// 13 4. Com o objetivo de verificar se existe correlação positiva entre a aptidão em matemática e a aptidão em música, foi selecionado um grupo de crianças de 8 a 10 anos de idade, que foram submetidas a dois testes de aptidão; um de matemática e outro de música. A ordem de aplicação dos testes em cada criança foi aleatória. Os dados estão relacionados abaixo: Quadro 2- Teste de aptidão em crianças criança valores de aptidão em criança valores de aptidão em matemática música matemática música 1 60 80 7 48 79 2 58 62 8 72 88 3 73 70 9 75 54 4 51 83 10 83 82 5 54 62 11 62 64 6 75 92 12 52 69 Calcule o coeficiente r e confira o resultado encontrado. Resolução:criança valores de aptidão em matemática (x) música (y) x2 y2 (x.y) 1 60 80 3600 6400 4800 2 58 62 3364 3844 3596 3 73 70 5329 4900 5110 4 51 83 2601 6889 4233 5 54 62 2916 3844 3348 6 75 92 5625 8464 6900 7 48 79 2304 6241 3792 8 72 88 5184 7744 6336 9 75 54 5625 2916 4050 10 83 82 6889 6724 6806 11 62 64 3844 4096 3968 12 52 69 2704 4761 3588 ∑ 763 885 49985 66823 56527 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟐.(𝟓𝟔𝟓𝟐𝟕)–(𝟕𝟔𝟑).(𝟖𝟖𝟓) √[𝟏𝟐.(𝟒𝟗𝟗𝟖𝟓)−(𝟕𝟔𝟑)𝟐].[𝟏𝟐.(𝟔𝟔𝟖𝟐𝟑)−(𝟖𝟖𝟓)𝟐] r= 𝟔𝟕𝟖𝟑𝟐𝟒−𝟔𝟕𝟓𝟐𝟓𝟓 √[𝟓𝟗𝟗𝟖𝟐𝟎−𝟓𝟖𝟐𝟏𝟔𝟗].[𝟖𝟎𝟏𝟖𝟕𝟔−𝟕𝟖𝟑𝟐𝟐𝟓] → r= 𝟑𝟎𝟔𝟗 √[𝟏𝟕𝟔𝟓𝟏].[𝟏𝟖𝟔𝟓𝟏] 14 r= 𝟑𝟎𝟔𝟗 √𝟑𝟐𝟗𝟐𝟎𝟖𝟖𝟎𝟏 → r= 𝟑𝟎𝟔𝟗 𝟏𝟖𝟏𝟒𝟒,𝟏𝟏𝟐𝟎𝟐 → r= 0,1691// O coeficiente de Pearson é 0,1691 existindo portanto, uma correlação positiva fraca.// 5. Com respeito aos 23 alunos de uma turma de estatística, foram observadas as seguintes variáveis: número de faltas e nota da disciplina. Estes dados acusaram a seguinte correlação, descrita pelo coeficiente de correlação de Pearson; r= -0,56. Comente as seguintes frases relativas à turma em estudo e ao coeficiente obtido. a) “Como r= -0,56 (correlação relativa moderada), nenhum aluno com grande número de faltas tirou nota alta” b) “Como as duas variáveis são correlacionadas, bastaria usar uma delas como critério de avaliação, pois uma acarreta a outra” c) “Os dados observados mostraram uma leve tendência de a nota final se relacionar inversamente com o número de faltas, então os alunos freqüentadores tiveram em geral, melhor desempenho nas avaliações, do que os alunos que faltaram muito” Resolução: a) Afirmativa falsa, como a correlação é moderada pode ser que algum aluno esteja fora do padrão e tenha obtido nota alta mesmo com grande número de faltas.// b) Afirmativa falsa, para se determinar a correlação de Pearson necessita-se das duas variáveis, ou não haveria como comparar.// c) Afirmativa verdadeira, em geral, é possível afirmar que grande parte dos alunos que freqüentam mais às aulas obtiveram notas maiores, estando um aluno ou outro fora do padrão, diminuindo assim, o coeficiente de correlação.// 15 6. Numa amostra aleatória de n=12 livros da Biblioteca Central, encontramos r= 0,207 entre a idade da edição e o número de páginas do livro. a) O que se pode dizer com base no valor deste coeficiente de correlação? b) Esta correlação pode ser explicada meramente por fatores casuais? Resolução: a) Que há uma correlação fraca entre a idade da edição e o número de páginas do livro.// b) Sim, pode. O número de páginas de um livro não se determina pela idade da edição, se houver correlação forte em determinada amostra envolvendo estes fatores será mera “coincidência” ou pura manipulação de dados.// 7. Nos últimos anos, em várias regiões, houve um movimento migratório que fez crescer bastante a população urbana nos municípios médios e grandes. Neste contexto, vamos tentar explicar o crescimento demográfico de um município em função de sua população urbana, para os municípios do Quadro 1. a) Qual deve ser a variável dependente e a independente? b) Estabeleça a equação de regressão. c) Faça um gráfico com os pontos observados e a reta de regressão estimada. d) Qual é a taxa de crescimento demográfico, predita pela equação de regressão, para um município de 300 mil habitantes? e) Calcule o coeficiente r2. f) Quais são as principais informações que podem ser obtidas pela presente análise? Resolução: a) o crescimento demográfico deve ser a variável dependente e a população urbana a variável independente.// b) Equação da regressão: b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔) 𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)𝟐 ~ ~ ~ 16 b= 𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐𝟑𝟔,𝟗𝟗𝟔(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔) 𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟔𝟐𝟔,𝟏𝟎) → b= 𝟒𝟗𝟗𝟎,𝟔𝟖−𝟒𝟎𝟓𝟎,𝟏𝟑𝟎𝟐𝟒𝟓 𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐𝟕𝟓𝟏𝟑,𝟐𝟎 b= 𝟗𝟒𝟎,𝟓𝟓 𝟕𝟒𝟕𝟓𝟗,𝟖 → b= 0,01258// a= 3,274- 0,01258(103,083) → a= 3,274-1,2967 → a= 1,9773// Equação da Regressão y= 1,9773 + 0,0126x// n população urbana (x) taxa de cresc. Demográfico (y) x2 y2 (x.y) 1 94 3,19 8836 10,1761 299,86 2 181 4,6 32761 21,16 832,6 3 39 2,78 1521 7,7284 108,42 4 292 6,46 85264 41,7316 1886,32 5 32 1,99 1024 3,9601 63,68 6 126 1,89 15876 3,5721 238,14 7 36 2,92 1296 8,5264 105,12 8 77 5,32 5929 28,3024 409,64 9 25 2,71 625 7,3441 67,75 10 186 3,11 34596 9,6721 578,46 11 116 3,11 13456 9,6721 360,76 12 33 1,21 1089 1,4641 39,93 ∑ 1237 39,29 202273 153,3095 4990,68 Temos que: média x = 103,083, média y= 3,274166 17 c) Gráfico: d) Sendo x = 300 (mil), temos: y=1,9773 + 0,0126(300) y=1,9773 + 3,78 y=5,7573// A taxa de crescimento demográfico predita para um município d 300 mil habitantes será de 5,7573// e) Coeficiente de Correlação: r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] →r= 𝟏𝟐.(𝟒𝟗𝟗𝟎,𝟔𝟖)–(𝟏𝟐𝟑𝟕).(𝟑𝟗,𝟐𝟗) √[𝟏𝟐.(𝟐𝟎𝟐𝟐𝟕𝟑)−(𝟏𝟐𝟑𝟕)𝟐].[𝟏𝟐.(𝟏𝟓𝟑,𝟑𝟎𝟗𝟓)−(𝟑𝟗,𝟐𝟗)𝟐] r= 𝟓𝟗𝟖𝟖𝟖,𝟏𝟔−𝟒𝟖𝟔𝟎𝟏,𝟕𝟑 √[𝟐𝟒𝟐𝟕𝟐𝟕𝟔−𝟏𝟓𝟑𝟎𝟏𝟔𝟗].[𝟏𝟖𝟑𝟗,𝟕𝟏𝟒−𝟏𝟓𝟒𝟑,𝟕𝟎𝟒𝟏] → r= 𝟏𝟏𝟐𝟖𝟔,𝟒𝟑 √[𝟖𝟗𝟕𝟏𝟎𝟕].[𝟐𝟗𝟔,𝟎𝟑𝟔𝟗] r= 𝟏𝟏𝟐𝟖𝟔,𝟒𝟑 √𝟐𝟔𝟓𝟓𝟕𝟔𝟕𝟕𝟓,𝟐 → r= 𝟏𝟏𝟐𝟖𝟔,𝟒𝟑 𝟏𝟔𝟐𝟗𝟔,𝟓𝟐𝟔𝟒𝟖 → r= 0,6925// r2=0,4797// y = 0,0126x + 1,9773 0 1 2 3 4 5 6 7 0 100 200 300 400 Série1 Linear (Série1) 18 O coeficiente de correlação é 0,69, existindo portanto uma correlação positiva média.// f) Os principais dados que podem ser obtidos: qual a taxa de crescimento demográfico em relação à população urbana, obtendo-se os resultados através da equação de regressão e a média correlação existente entre esses dois fatores.// 9. Dados o tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui, verifique se existe uma associação entre estas variáveis; ano de serviço (x) 2 3 4 5 4 6 7 8 8 10 Nº de clientes (y) 48 50 56 52 43 60 62 58 64 72 a) Calcule as medidas descritivas destas duas variáveis; b) Construa o diagrama de dispersão e anote os valores mínimos e máximos de x e y que aparecem no gráfico; c) Trace no diagrama de dispersão as retas y= X e x=Y e analise o gráfico; d) Calcule e interprete o coeficiente de correlação. Resolução: n ano de serviço (x) Nº de clientes (y) 1 2 48 2 3 50 3 4 56 4 5 52 5 4 43 6 6 60 7 7 62 8 8 58 9 8 64 10 10 72 ∑ 57 565 19 a) Medidas Descritivas: * Média: x= 5,7// y=56,5// *Desvio Padrão: n Nº de clientes (y) (y-média y)2 n ano de serviço (x) (x-média x)2 1 48 72,25 1 2 13,69 2 50 42,25 2 3 7,29 3 56 0,25 3 4 2,89 4 52 20,25 4 5 0,49 5 43 182,25 5 4 2,89 6 60 12,25 6 6 0,09 7 62 30,25 7 7 1,69 8 58 2,25 8 8 5,29 9 64 56,25 9 8 5,29 10 72 240,25 10 10 18,49 ∑ 565 658,5 ∑ 57 58,1 Desvio Padrão x: √ 𝟓𝟖,𝟏 𝟗 →Desvio padrão x= 2,5407// Desvio Padrão y: √ 𝟔𝟓𝟖,𝟓 𝟗 →Desvio padrão y= 8,5553// b) Diagrama de Dispersão: x mínimo= 2, y mínimo= 43. x máximo= 10, y máximo=72// 2;48 3; 50 4; 56 5; 52 4; 43 6; 60 7; 62 8; 58 8; 64 10; 72 0 10 20 30 40 50 60 70 80 0 2 4 6 8 10 12 Série1 20 c) Representação da Reta no gráfico: Através do gráfico nota-se uma forte correlação entre os dados. *Equação da Regressão: b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟑𝟑𝟗𝟐−𝟏𝟎(𝟓,𝟕)(𝟓𝟔,𝟓) 𝟑𝟖𝟑−𝟏𝟎(𝟓,𝟕)𝟐 b= 𝟑𝟑𝟗𝟐−𝟑𝟐𝟐𝟎,𝟓 𝟑𝟖𝟑−𝟑𝟐𝟒,𝟗 → b= 𝟏𝟕𝟏,𝟓 𝟓𝟖,𝟏 →b=2,9518// a= 56,5 - 2,9518(5,7) a= 56,5- 16,825 a= 39,675 Equação da Regressão: y= 39,675+ 2,9518x// y = 2,9518x + 39,675 R² = 0,7688 0 10 20 30 40 50 60 70 80 0 2 4 6 8 10 12 Série1 Linear (Série1) ~ ~ ~ 21 d) Coeficiente de Correlação: n ano de serviço (x) Nº de clientes (y) x2 y2 (x.y) 1 2 48 4 2304 96 2 3 50 9 2500 150 3 4 56 16 3136 224 4 5 52 25 2704 260 5 4 43 16 1849 172 6 6 60 36 3600 360 7 7 62 49 3844 434 8 8 58 64 3364 464 9 8 64 64 4096 512 10 10 72 100 5184 720 ∑ 57 565 383 32581 3392 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] →r= 𝟏𝟎.(𝟑𝟑𝟗𝟐)–(𝟓𝟕).(𝟓𝟔𝟓) √[𝟏𝟎.(𝟑𝟖𝟑)−(𝟓𝟕)𝟐].[𝟏𝟎.(𝟑𝟐𝟓𝟖𝟏)−(𝟓𝟔𝟓)𝟐] r= 𝟑𝟑𝟗𝟐𝟎−𝟑𝟐𝟐𝟎𝟓 √[𝟑𝟖𝟑𝟎−𝟑𝟐𝟒𝟗].[𝟑𝟐𝟓𝟖𝟏𝟎−𝟑𝟏𝟗𝟐𝟐𝟓] → r= 𝟏𝟕𝟏𝟓 √[𝟓𝟖𝟏].[𝟔𝟓𝟖𝟓] r= 𝟏𝟕𝟏𝟓 √𝟑𝟖𝟐𝟓𝟖𝟖𝟓 → r= 𝟏𝟕𝟏𝟓 𝟏𝟗𝟓𝟓,𝟗𝟖 → r= 0,8768// O coeficiente de Pearson é 0,8768, existindo portanto uma correlação forte positiva.// 22 10. Numa pesquisa feita com 10 famílias com renda bruta mensal entre 10 e 60 salários mínimos, mediram-se: X: renda bruta mensal (expressa em números de salários mínimos) e Y: a porcentagem de renda bruta anual gasta com assistência médica. x 12 16 18 20 28 30 40 48 50 54 y 7,2 7,4 7 6,5 6,6 6,7 6 5,6 6 5,5 a) Escolha adequadamente X e Y. b) Construa o diagrama de dispersão c) Calcule o coeficiente de correlação. Resolução: n x y x2 y2 (x.y) 1 12 7,2 144 51,84 86,4 2 16 7,4 256 54,76 118,4 3 18 7 324 49 126 4 20 6,5 400 42,25 130 5 28 6,6 784 43,56 184,8 6 30 6,7 900 44,89 201 7 40 6 1600 36 240 8 48 5,6 2304 31,36 268,8 9 50 6 2500 36 300 10 54 5,5 2916 30,25 297 ∑ 316 64,5 12128 419,91 1952,4 a) x (renda bruta mensal) é a variável independente e y (% de renda bruta anual gasta com assistência médica) é a variável dependente.// *Equação da Regressão: Temos que : média x= 31,6 e média y=6,45 b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟏𝟗𝟓𝟐,𝟒−𝟏𝟎(𝟑𝟏,𝟔)(𝟔,𝟒𝟓) 𝟏𝟐𝟏𝟐𝟖−𝟏𝟎(𝟑𝟏,𝟔)𝟐 ~ ~ ~ 23 b= 𝟏𝟗𝟓𝟐,𝟒−𝟐𝟎𝟑𝟖,𝟐 𝟏𝟐𝟏𝟐𝟖−𝟗𝟗𝟖𝟓,𝟔 → b= −𝟖𝟓,𝟖 𝟐𝟏𝟒𝟐,𝟒 → b= -0,04// a= 6,45-(-0,04)(31,6) → a= 6,45+1,2655 → a= 7,7155 Equação da Regressão y= 7,7155 – 0,04x// b) Diagrama de Dispersão: c) Coeficiente de Correlação: r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] →r= 𝟏𝟎.(𝟏𝟗𝟓𝟐,𝟒)–(𝟑𝟏𝟔).(𝟔𝟒,𝟓) √[𝟏𝟎.(𝟏𝟐𝟏𝟐𝟖)−(𝟑𝟏𝟔)𝟐].[𝟏𝟎.(𝟒𝟏𝟗,𝟗𝟏)−(𝟔𝟒,𝟓)𝟐] r= 𝟏𝟗𝟓𝟐𝟒−𝟐𝟎𝟑𝟖𝟐 √[𝟏𝟐𝟏𝟐𝟖𝟎−𝟗𝟗𝟖𝟓𝟔].[𝟒𝟏𝟗𝟗,𝟏−𝟒𝟏𝟔𝟎,𝟐𝟓] → r= −𝟖𝟓𝟖 √[𝟐𝟏𝟒𝟐𝟒].[𝟑𝟖,𝟖𝟓] r= −𝟖𝟓𝟖 √𝟖𝟑𝟐𝟑𝟐𝟐,𝟒 → r= −𝟖𝟓𝟖 𝟗𝟏𝟐,𝟑𝟏𝟕𝟎𝟓𝟎𝟐 → r= -0,9404// O coeficiente de Pearson é 0,9404; existindo portanto uma correlação forte negativa.// 0 1 2 3 4 5 6 7 8 0 10 20 30 40 50 60 24 11. Os quatro conjuntos de dados a seguir foram preparados pelo estatístico F.J Anscombe e são usados com freqüência em aulas sobre correlação. Conjunto 1 Conjunto 2 Conjunto 3 Conjunto 4 x y x y x y x y 10 8,04 10 9,14 10 7,46 8 6,58 8 6,95 8 8,14 8 6,77 8 5,76 13 7,58 13 8,74 13 12,74 8 7,71 9 8,81 9 8,77 9 7,11 8 8,84 11 8,33 11 9,26 11 7,81 8 8,47 14 9,96 14 8,1 14 8,84 8 7,04 6 7,24 6 6,13 6 6,08 8 5,25 4 4,26 4 3,1 4 5,39 19 12,5 12 10,84 12 9,13 12 8,15 8 5,56 7 4,82 7 7,26 7 6,42 8 7,91 5 5,68 5 4,74 5 5,73 8 6,89 a) Calcule a média e o desvio padrão para cada conjunto de dados. b) Calcule o coeficiente de correlação para cada conjunto de dados. c) Construa o diagrama de Dispersão para cada conjunto de dados. d) Analise os resultados. 25 Resolução: a) ** Para o conjunto 1 ** Temos que a média de x = 9// e média de y= 7,5// n Conjunto 1 (x-média x) 2 (y-média y)2 x2 y2 (x.y) x y 1 10 8,04 1 0,2916 100 64,6416 80,4 2 8 6,95 1 0,3025 64 48,3025 55,6 3 13 7,58 16 0,0064 169 57,4564 98,54 4 9 8,81 0 1,7161 81 77,6161 79,29 5 11 8,33 4 0,6889 121 69,3889 91,63 6 14 9,96 25 6,0516 196 99,2016 139,44 7 6 7,24 9 0,0676 36 52,4176 43,44 8 4 4,26 25 10,4976 16 18,1476 17,04 9 12 10,84 9 11,1556 144 117,5056 130,08 10 7 4,82 4 7,1824 49 23,2324 33,74 11 5 5,68 16 3,3124 25 32,2624 28,4 ∑ 99 82,51 110 41,2727 1001 660,1727 797,6 Desvio Padrão x: √ 𝟏𝟏𝟎 𝟏𝟎 →Desvio padrão x= 3,3166// Desvio Padrão y: √ 𝟒𝟏,𝟐𝟕𝟐𝟕 𝟏𝟎 →Desvio padrão y= 2,0315// 26 ** Para o conjunto 2 ** Temos que a média de x = 9// e média de y= 7,5// n Conjunto 2 (x-média x)2 (y-média y)2 x2 y2 (x.y) x y 1 10 9,14 1 2,6896 100 83,5396 91,4 2 8 8,14 1 0,4096 64 66,2596 65,12 3 13 8,74 16 1,5376 169 76,3876 113,62 4 9 8,77 0 1,6129 81 76,9129 78,93 5 11 9,26 4 3,0976 121 85,7476 101,86 6 14 8,1 25 0,36 196 65,61 113,4 7 6 6,13 9 1,8769 36 37,5769 36,78 8 4 3,1 25 19,36 16 9,61 12,4 9 12 9,13 9 2,6569 144 83,3569 109,56 10 7 7,26 4 0,0576 49 52,7076 50,82 11 5 4,74 16 7,6176 25 22,4676 23,7 ∑ 99 82,51 110 41,2763 1001 660,1763 797,59 Desvio Padrão x: √ 𝟏𝟏𝟎 𝟏𝟎 →Desvio padrão x= 3,3166// Desvio Padrão y: √ 𝟒𝟏,𝟐𝟕𝟔𝟑 𝟏𝟎 →Desvio padrão y= 2,0316// ** Para o conjunto 3 ** Temos que a média de x = 9// e média de y= 7,5// n Conjunto 3 (x-média x)2 (y-média y)2 x2 y2 (x.y) x y 1 10 7,46 1 0,0016 100 55,6516 74,6 2 8 6,77 1 0,5329 64 45,8329 54,16 3 13 12,74 16 27,4576 169 162,3076 165,62 4 9 7,11 0 0,1521 81 50,5521 63,99 5 11 7,81 4 0,0961 121 60,9961 85,91 6 14 8,84 25 1,7956 196 78,1456 123,76 7 6 6,08 9 2,0164 36 36,9664 36,48 8 4 5,39 25 4,4521 16 29,0521 21,56 9 12 8,15 9 0,4225 144 66,4225 97,8 10 7 6,42 4 1,1664 49 41,2164 44,94 11 5 5,73 16 3,1329 25 32,8329 28,65 ∑ 99 82,5 110 41,2262 1001 659,9762 797,47 27 Desvio Padrão x: √ 𝟏𝟏𝟎 𝟏𝟎 →Desvio padrão x= 3,3166// Desvio Padrão y: √ 𝟒𝟏,𝟐𝟐𝟔𝟐 𝟏𝟎 →Desvio padrão y= 2,0304// ** Para o conjunto 4 ** Temos que a média de x = 9// e média de y= 7,5// n Conjunto 4 (x-média x)2 (y-média y)2 x2 y2 (x.y) x y 1 8 6,58 1 0,8464 64 43,2964 52,64 2 8 5,76 1 3,0276 64 33,1776 46,08 3 8 7,71 1 0,0441 64 59,4441 61,68 4 8 8,84 1 1,7956 64 78,1456 70,72 5 8 8,47 1 0,9409 64 71,7409 67,76 6 8 7,04 1 0,2116 64 49,5616 56,32 7 8 5,25 1 5,0625 64 27,5625 42 8 19 12,5 100 25 361 156,25 237,5 9 8 5,56 1 3,7636 64 30,9136 44,48 10 8 7,91 1 0,1681 64 62,5681 63,28 11 8 6,89 1 0,3721 64 47,4721 55,12 ∑ 99 82,51 110 41,2325 1001 660,1325 797,58 Desvio Padrão x: √ 𝟏𝟏𝟎 𝟏𝟎 →Desvio padrão x= 3,3166// Desvio Padrão y: √ 𝟒𝟏,𝟐𝟑𝟐𝟓 𝟏𝟎 →Desvio padrão y= 2,0305// b) Coeficiente de Correlação:** Para o conjunto 1 ** r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟏.(𝟕𝟗𝟕,𝟔)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏) √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟐𝟕)−(𝟖𝟐,𝟓𝟏)𝟐] r= 𝟖𝟕𝟕𝟑,𝟔−𝟖𝟏𝟔𝟖,𝟒𝟗 √[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟖𝟗𝟗𝟕−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] → r= 𝟔𝟎𝟓,𝟏𝟏 √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟗𝟗𝟗𝟔] 28 r= 𝟔𝟎𝟓,𝟏𝟏 √𝟓𝟒𝟗𝟑𝟑𝟗,𝟓𝟏𝟔 → r= 𝟔𝟎𝟓,𝟏𝟏 𝟕𝟒𝟏,𝟏𝟕𝟒𝟒𝟏𝟔𝟕 → r= 0,8164// O coeficiente de Pearson é 0,8164 existindo portanto, uma correlação positiva forte.// ** Para o conjunto 2 ** r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟗)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏) √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟔𝟑)−(𝟖𝟐,𝟓𝟏)𝟐] r= 𝟖𝟕𝟕𝟑,𝟒𝟗−𝟖𝟏𝟔𝟖,𝟒𝟗 √[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟗𝟑𝟗𝟑−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] → r= 𝟔𝟎𝟓 √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟒,𝟎𝟑𝟗𝟐] r= 𝟔𝟎𝟓 √𝟓𝟒𝟗𝟑𝟖𝟕,𝟒𝟑𝟐 → r= 𝟔𝟎𝟓 𝟕𝟒𝟏,𝟐𝟎𝟔𝟕𝟒𝟎𝟒 → r= 0,8162// O coeficiente de Pearson é 0,8162 existindo portanto, uma correlação positiva forte.// ** Para o conjunto 3 ** r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟏.(𝟕𝟗𝟕,𝟒𝟕)–(𝟗𝟗).(𝟖𝟐,𝟓) √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟓𝟗,𝟗𝟕𝟔𝟐)−(𝟖𝟐,𝟓)𝟐] r= 𝟖𝟕𝟕𝟐,𝟏𝟕−𝟖𝟏𝟔𝟕,𝟓 √[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟓𝟗,𝟕𝟑𝟖𝟐−𝟔𝟖𝟎𝟔,𝟐𝟓] → r= 𝟔𝟎𝟒,𝟔𝟕 √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟒𝟖𝟖𝟐] r= 𝟔𝟎𝟒,𝟔𝟕 √𝟓𝟒𝟖𝟕𝟐𝟎,𝟕𝟐𝟐 → r= 𝟔𝟎𝟒,𝟔𝟕 𝟕𝟒𝟎,𝟕𝟓𝟔𝟖𝟓𝟖 → r= 0,8162// O coeficiente de Pearson é 0,8162 existindo portanto, uma correlação positiva forte.// 29 ** Para o conjunto 4 ** r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟖)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏) √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟑𝟐𝟓)−(𝟖𝟐,𝟓𝟏)𝟐] r= 𝟖𝟕𝟕𝟑,𝟑𝟖−𝟖𝟏𝟔𝟖,𝟒𝟗 √[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟒𝟓𝟕𝟓−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] → r= 𝟔𝟎𝟒,𝟖𝟗 √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟓𝟓𝟕𝟒] r= 𝟔𝟎𝟒,𝟖𝟗 √𝟓𝟒𝟖𝟖𝟎𝟒,𝟒𝟓𝟒 → r= 𝟔𝟎𝟒,𝟖𝟗 𝟕𝟒𝟎,𝟖𝟏𝟑𝟑𝟕𝟑 → r= 0,8165// O coeficiente de Pearson é 0,8165 existindo portanto, uma correlação positiva forte.// c) Diagrama de Dispersão: ** Para o conjunto 1 ** 0 2 4 6 8 10 12 0 5 10 15 Série1 30 ** Para o conjunto 2 ** ** Para o conjunto 3 ** 0 1 2 3 4 5 6 7 8 9 10 0 5 10 15 Série1 0 2 4 6 8 10 12 14 0 5 10 15 Série1 31 ** Para o conjunto 4 ** d) Análise: Os resultados foram praticamente os mesmos, com pequenas diferenças de arredondamento, possuem a mesma média para todos e coeficiente de variação quase iguais, todos com correlação forte positiva entre os dados.// 0 2 4 6 8 10 12 14 0 5 10 15 20 Série1 32 12. Uma empresa que produz bens de alta tecnologia está preocupada com a produtividade de funcionários que exercem funções repetitivas e procura descobrir como algumas variáveis podem influenciar no rendimento dessas pessoas. Para isso implementa em cada uma de suas três fábricas um programa específico: alimentação especial sugerida pelos nutricionistas; intervalos para exercícios de relaxamento sugerido pelos fisioterapeutas; rodízio de funções sugerido pelos psicólogos. O quadro a seguir mostra o resultado da produtividade para diversos níveis implementados no programa. Produtividade (menor = 100%) 100 102 105 108 112 120 Alimentação (frequência semanal) 4 5 1 3 6 2 Exercícios (frequência semanal) 1 3 2 4 5 6 Rodízio (frequência semanal) 3 1 2 6 4 5 a) Construa o diagrama de dispersão da produtividade contra cada uma das variáveis explicativas. Qual variável parece manter melhor correlação com a produtividade? b) Calcule o coeficiente de correlação linear de Pearson nos 3 casos. O coeficiente confirma a impressão visual dos diagramas? Resolução: a) Diagrama de Dispersão: ** Para Produtividade x Alimentação (freqüência semanal) ** 0 1 2 3 4 5 6 7 95 100 105 110 115 120 125 Série1 33 ** Para Produtividade x Exercícios (freqüência semanal) ** ** Para Produtividade x Rodízio (freqüência semanal) ** Analisando os gráficos a variável que representa ter maior correlação com a produtividade é a variável “Exercícios”. 0 1 2 3 4 5 6 7 95 100 105 110 115 120 125 Série1 0 1 2 3 4 5 6 7 95 100 105 110 115 120 125 Série1 34 b) Coeficiente de Correlação; ** Para Produtividade x Alimentação (freqüência semanal) ** n Produtividade (menor = 100%) Alimentação (frequência semanal) x2 y2 (x.y) 1 100 4 10000 16 400 2 102 5 10404 25 510 3 105 1 11025 1 105 4 108 3 11664 9 324 5 112 6 12544 36 672 6 120 2 14400 4 240 ∑ 647 21 70037 91 2251 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟔.(𝟐𝟐𝟓𝟏)–(𝟔𝟒𝟕).(𝟐𝟏) √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐] r= 𝟏𝟑𝟓𝟎𝟔−𝟏𝟑𝟓𝟖𝟕 √[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] → r= −𝟖𝟏 √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓] r= −𝟖𝟏 √𝟏𝟔𝟗𝟑𝟔𝟓 → r= −𝟖𝟏 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕 → r= -0,1968// O coeficiente de Pearson é -0,1968 existindo portanto, uma correlação negativa fraca.// 35 ** Para Produtividade x Exercícios (freqüência semanal) ** n Produtividade (menor = 100%) Exercícios (frequência semanal) x2 y2 (x.y) 1 100 1 10000 1 100 2 102 3 10404 9 306 3 105 2 11025 4 210 4 108 4 11664 16 432 5 112 5 12544 25 560 6 120 6 14400 36 720 ∑ 647 21 70037 91 2328 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟔.(𝟐𝟑𝟐𝟖)–(𝟔𝟒𝟕).(𝟐𝟏) √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐] r= 𝟏𝟑𝟗𝟔𝟖−𝟏𝟑𝟓𝟖𝟕 √[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] → r= 𝟑𝟖𝟏 √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓] r= 𝟑𝟖𝟏 √𝟏𝟔𝟗𝟑𝟔𝟓 → r= 𝟑𝟖𝟏 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕 → r= 0,9257// O coeficiente de Pearson é 0,9257 existindo portanto, uma correlação positiva forte.// 36 ** Para Produtividade x Rodízio (freqüência semanal) ** n Produtividade (menor = 100%) Rodízio (frequência semanal) x2 y2 (x.y) 1 100 3 10000 9 300 2 102 1 10404 1 102 3 105 2 11025 4 210 4 108 6 11664 36 648 5 112 4 12544 16 448 6 120 5 14400 25 600 ∑ 647 21 70037 91 2308 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟔.(𝟐𝟑𝟎𝟖)–(𝟔𝟒𝟕).(𝟐𝟏) √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐] r= 𝟏𝟑𝟖𝟒𝟖−𝟏𝟑𝟓𝟖𝟕 √[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] → r= 𝟐𝟔𝟏 √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓] r= 𝟐𝟔𝟏 √𝟏𝟔𝟗𝟑𝟔𝟓 → r= 𝟐𝟔𝟏 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕 → r= 0,6341// O coeficiente de Pearson é 0,6341 existindo portanto, uma correlação positiva média.// O coeficiente calculado confirma a impressão observada no gráfico, de que o fator que apresenta maior correlação com a produtividade é o fator exercícios. Em seguida o fator “rodízio” apresenta média correlação, e o que apresenta menor correlação é o fator alimentação. 37 13. Use as informações de poupança agregada e renda (bilhõesde reais) em um país X no período de 1990 a 1999 (dados fictícios), para estimar a influência do nível de renda sobre a poupança. a) Construa o diagrama de dispersão e trace a reta de regressão da poupança em função da renda. Interprete os coeficientes. b) Diga qual é o acréscimo na poupança agregada para cada bilhão a mais na renda. c) Estime a poupança para uma renda de R$469 400 000 000,00. Quanto seria o consumo agregado das famílias? (consumo+poupança=renda). d) Calcule e interprete o coeficiente de correlação e) Calcule e interprete o coeficiente de determinação f) Construa o diagrama de dispersão considerando o consumo como variável resposta e a renda como variável explicativa(preditora). Estime a reta de regressão e compare com o resultado do item a. Resolução: OBSERVAÇÃO: Dados baseados no PIB, renda e poupança do Brasil nos anos de 1990 a 1999 (dados modificados devido a conversão para reais supondo-se um dólar de R$ 2,30). Quadro - Renda X Poupança: Brasil 1990-1999 Ano Renda em bi(R$) (x) Poupança em bi (R$)(y) 1990 397,7 85,5 1991 454,7 89,6 1992 516,8 92,7 1993 571 100,6 1994 575,8 98,8 1995 593,9 94,5 1996 678,5 121,3 1997 727,4 125,9 1998 892,1 170,6 1999 988,6 207,9 38 a) Diagrama de Dispersão: Através do diagrama observa-se uma correlação forte positiva, para variações unitárias de x haveria decréscimo em y, conforme observado na equação dada. b) Equação da Regressão: Temos que média x=639,65 e média y= 118,74 b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)(𝟏𝟏𝟖,𝟕𝟒) 𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)𝟐 b= 𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−(𝟕𝟓𝟗𝟓𝟐𝟎,𝟒𝟏) 𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟒𝟎𝟗𝟏𝟓𝟐𝟏,𝟐𝟐𝟓 → b= 𝟔𝟓𝟏𝟗𝟎,𝟒𝟗 𝟑𝟏𝟑𝟒𝟐𝟕,𝟕𝟖 → b= 0,208/ a= 118,74-(0,208)(639,65) → a= 118,74-133,0472 → a= -14,302 Equação da Regressão: y= -14,302+0,208x y = 0,208x - 14,302 R² = 0,926 0 50 100 150 200 250 0 500 1000 1500 Série1 Linear (Série1) ~ ~ ~ 39 Acréscimo na poupança agregada para cada bilhão a mais na renda Resposta 1 : y= -14,302+0,208x// Resposta 2: Observação: conforme a equação da regressão obtida com base nos dados criados o aumento unitário (de 1 bilhão na renda não seria suficiente para gerar acréscimo na poupança, devida a disparidade entre o nível de consumo e poupança, a população do país em questão tende a consumir mais e poupar menos). Portanto para a variação de um bilhão na renda teremos: y= -14,302+0,208 y=-14,094 Teremos um decréscimo de -14,094 (partindo do pressuposto renda inicial zero) Para o acréscimo na poupança o nível de renda deverá ser no mínimo de 68,76 bilhões. Partindo deste ponto onde o nível de poupança será zero, o acréscimo de um bilhão na renda acarretará em um acréscimo na poupança de: y=-14,302+0,208(68,76) y=0 y=-14,302+0,208(68,76+1) y=-14,302+14,51 y=0,20808 Portanto o acréscimo inicial na poupança será de 0,20808// c) Poupança para uma renda de 469,4 bilhões y=-14,302+0,208(469,4) y=-14,302+97,6352 y=83,3332 40 Consumo Agregado das Famílias C+S=Y → C +83,3332= 469,4 → C= 469,4 – 83,3332 C= 386,0668 O consumo agregado das famílias seria de aproximadamente 386,07 bilhões de reais.// d) Ano Renda em bi(R$) (x) Poupança em bi (R$)(y) x2 y2 (x.y) 1990 397,7 85,5 158165,3 7310,25 34003,35 1991 454,7 89,6 206752,1 8028,16 40741,12 1992 516,8 92,7 267082,2 8593,29 47907,36 1993 571 100,6 326041 10120,36 57442,6 1994 575,8 98,8 331545,6 9761,44 56889,04 1995 593,9 94,5 352717,2 8930,25 56123,55 1996 678,5 121,3 460362,3 14713,69 82302,05 1997 727,4 125,9 529110,8 15850,81 91579,66 1998 892,1 170,6 795842,4 29104,36 152192,3 1999 988,6 207,9 977330 43222,41 205529,9 ∑ 6396,5 1187,4 4404949 155635 824710,9 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟖𝟐𝟒𝟕𝟏𝟎,𝟗𝟑)–(𝟔𝟑𝟗𝟔,𝟓).(𝟏𝟏𝟖𝟕,𝟒) √[𝟏𝟎.(𝟒𝟒𝟎𝟒𝟗𝟒𝟖,𝟖𝟓)−(𝟔𝟑𝟗𝟔,𝟓)𝟐].[𝟏𝟎.(𝟏𝟓𝟓𝟔𝟑𝟓,𝟎𝟐)−(𝟏𝟏𝟖𝟕,𝟒)𝟐] r= 𝟖𝟐𝟒𝟕𝟏𝟎𝟗,𝟑𝟎−𝟕𝟓𝟗𝟓𝟐𝟎𝟒,𝟏𝟎 √[𝟒𝟒𝟎𝟒𝟗𝟒𝟖𝟖,𝟓−𝟒𝟎𝟗𝟏𝟓𝟐𝟏𝟐,𝟐𝟓].[𝟏𝟓𝟓𝟔𝟑𝟓𝟎,𝟐𝟎−𝟏𝟒𝟎𝟗𝟗𝟏𝟖,𝟕𝟔] → r= 𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎 √[𝟑𝟏𝟑𝟒𝟐𝟕𝟔,𝟐𝟓].[𝟏𝟒𝟔𝟒𝟑𝟏,𝟒𝟒] r= 𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎 √𝟒𝟓𝟖𝟗𝟓𝟔𝟓𝟖𝟒𝟔𝟒𝟓 → r= 𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎 𝟔𝟕𝟕𝟒𝟔𝟑,𝟑𝟒𝟓𝟔𝟎𝟗 → r= 0,9622 O coeficiente de Pearson é 0,9622 existindo portanto, uma correlação positiva forte.// e) Coeficiente de determinação: r2= 0,926// 41 f) Diagrama de Dispersão: **Renda X Consumo Ano Renda em bi(R$) (x) Consumo bi(R$) (x) 1990 397,7 312,2 1991 454,7 365,1 1992 516,8 424,1 1993 571 470,4 1994 575,8 477 1995 593,9 499,4 1996 678,5 557,2 1997 727,4 601,5 1998 892,1 721,5 1999 988,6 780,7 ∑ 6396,5 5209,1 A correlação entre renda e consumo é muito mais forte do que a correlação entre renda e popança, sendo quase perfeita. Enquanto o fato do aumento da renda não acarretar aumento significativo na poupança(podendo causar inclusive decréscimo dependendo do nível de renda), o aumento no nível de renda representa um grande aumento no consumo. (como já dito o país em questão tem maior tendência a consumir e menor tendência a poupar). y = 0,792x + 14,302 R² = 0,9945 0 100 200 300 400 500 600 700 800 900 0 200 400 600 800 1000 1200 Série1 Linear (Série1) 42 14. Suponha os seguintes dados: Despesas com propagandas (milhões R$) Vendas de Certo Produto (mil unidades) 2,5 120 6,5 190 11 240 4 140 8,5 180 14 280 6 150 5 115 10 215 13,5 220 16 320 a) Construa o diagrama de dispersão. b) Ajuste uma reta aos dados e estime a vendas do produto, para um gasto com propaganda de 12 milhões de reais. c) Qual o acréscimo nas vendas para cada milhão a mais gasto com propaganda? d) Trace a reta no diagrama de dispersão. e) Determine o coeficiente de correlação e interprete-o. f) Calcule e interprete o coeficiente de determinação. 43 Resolução: a) Diagrama de Dispersão b) Equação da Regressão: Temos que média x=8,81 e média y= 197,27 b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟐𝟏𝟗𝟎𝟎−𝟏𝟏(𝟖,𝟖𝟏)(𝟏𝟗𝟕,𝟐𝟕) 𝟏𝟎𝟓𝟑−𝟏𝟏(𝟖,𝟖𝟏)𝟐 b= 𝟐𝟏𝟗𝟎𝟎−𝟏𝟗𝟏𝟏𝟕 𝟏𝟎𝟓𝟑−𝟖𝟓𝟑,𝟕𝟕𝟕𝟏 → b= 𝟐𝟕𝟖𝟑 𝟏𝟗𝟗 → b= 13,985// a= 197,27-(13,985)(8,81) → a= 74,06 Equação da Regressão: y= 74,06+13,985x// **Para um gasto com propaganda de 12 milhões temos: y= 74,06+13,985(12) y=74,06+167,82 0 50 100 150 200 250 300 350 0 5 10 15 20 Série1 ~ ~ ~ 44 y=241,88 A venda de produtos será de aproximadamente 241,88 (mil) produtos. c) y= 74,06+13,985x// y=74,06+13,985 y=88,045 O acréscimo nas vendas para cada milhão a mais gasto com propaganda é 88,045. d) Reta de Regressão y = 13,988x + 73,924 R² = 0,8958 0 50 100 150 200 250 300 350 0 5 10 15 20 Série1 Linear (Série1) 45 e) Coeficiente de Correlação: n Despesas com propagandas (milhões R$) Vendas de Certo Produto (mil unidades) x2 y2 (x.y) 1 2,5 120 6,25 14400 300 2 6,5 190 42,25 36100 1235 3 11 240 121 57600 2640 4 4 140 16 19600 560 5 8,5 180 72,2532400 1530 6 14 280 196 78400 3920 7 6 150 36 22500 900 8 5 115 25 13225 575 9 10 215 100 46225 2150 10 13,5 220 182,25 48400 2970 11 16 320 256 102400 5120 ∑ 97 2170 1053 471250 21900 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟏.(𝟐𝟏𝟗𝟎𝟎)–(𝟗𝟕).(𝟐𝟏𝟕𝟎) √[𝟏𝟏.(𝟏𝟎𝟓𝟑)−(𝟗𝟕)𝟐].[𝟏𝟏.(𝟒𝟕𝟏𝟐𝟓𝟎)−(𝟐𝟏𝟕𝟎)𝟐] r= 𝟐𝟒𝟎𝟗𝟎𝟎−𝟐𝟏𝟎𝟒𝟗𝟎 √[𝟏𝟏𝟓𝟖𝟑−𝟗𝟒𝟎𝟗].[𝟓𝟏𝟖𝟑𝟕𝟓𝟎−𝟒𝟕𝟎𝟖𝟗𝟎𝟎] → r= 𝟑𝟎𝟒𝟏𝟎 √[𝟐𝟏𝟕𝟒].[𝟒𝟕𝟎𝟖𝟓𝟎] r= 𝟑𝟎𝟒𝟏𝟎 √𝟏𝟎𝟑𝟐𝟑𝟐𝟑𝟗𝟎𝟎 → r= 𝟑𝟎𝟒𝟏𝟎 𝟑𝟐𝟏𝟐𝟗,𝟕𝟗𝟕𝟔𝟕𝟔𝟗𝟔𝟐 → r= 0,9454// O coeficiente de Pearson é 0,9454 existindo portanto, uma correlação positiva forte.// f) Coeficiente de Determinação: r2= 0,8958 46 15. O quadro abaixo fornece os resultados de uma pesquisa com 10 famílias de determinada região: Famílias Renda (R$100,00) Poupança (R$10,00) nº de filhos média de anos de estudo da família A 10 4 8 3 B 15 7 6 4 C 12 5 5 5 D 70 20 1 12 E 80 20 2 16 F 100 30 2 18 G 20 8 3 8 H 30 8 2 8 I 10 3 6 4 J 60 15 1 8 a) Calcule o coeficiente de correlação entre as variáveis renda e poupança, renda e número de filhos, poupança e número de filhos, média dos anos de estudo e número de filhos e entre as variáveis renda familiar e média de anos de estudo. Retire conclusões. b) Ajuste um modelo linear utilizando as variáveis Renda (x) e Poupança (y). Estime o valor poupado quando a renda for de 2000 reais. 47 Resolução: a) Coeficiente de Correlação: ** Para renda X poupança ** n Renda (R$100,00) Poupança (R$10,00) x2 y2 (x.y) 1 10 4 100 16 40 2 15 7 225 49 105 3 12 5 144 25 60 4 70 20 4900 400 1400 5 80 20 6400 400 1600 6 100 30 10000 900 3000 7 20 8 400 64 160 8 30 8 900 64 240 9 10 3 100 9 30 10 60 15 3600 225 900 ∑ 407 120 26769 2152 7535 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟕𝟓𝟑𝟓)–(𝟒𝟎𝟕).(𝟏𝟐𝟎) √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐].[𝟏𝟎.(𝟐𝟏𝟓𝟏)−(𝟏𝟐𝟎)𝟐] r= 𝟕𝟓𝟑𝟓𝟎−𝟒𝟖𝟖𝟒𝟎 √[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟐𝟏𝟓𝟏𝟎−𝟏𝟒𝟒𝟎𝟎] → r= 𝟐𝟔𝟓𝟏𝟎 √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟕𝟏𝟏𝟎] r= 𝟐𝟔𝟓𝟏𝟎 √𝟕𝟐𝟓𝟓𝟏𝟏𝟓𝟏𝟎 → r= 𝟐𝟔𝟓𝟏𝟎 𝟐𝟔𝟗𝟑𝟓,𝟑𝟐 → r= 0,9835// O coeficiente de Pearson é 0,9835 existindo portanto, uma correlação positiva forte.// 48 ** Para renda X nº de filhos ** n Renda (R$100,00) nº de filhos x2 y2 (x.y) 1 10 8 100 64 80 2 15 6 225 36 90 3 12 5 144 25 60 4 70 1 4900 1 70 5 80 2 6400 4 160 6 100 2 10000 4 200 7 20 3 400 9 60 8 30 2 900 4 60 9 10 6 100 36 60 10 60 1 3600 1 60 ∑ 407 36 26769 184 900 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟗𝟎𝟎)–(𝟒𝟎𝟕).(𝟑𝟔) √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐] r= 𝟗𝟎𝟎𝟎−𝟏𝟒𝟔𝟓𝟐 √[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] → r= −𝟓𝟔𝟓𝟐 √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟓𝟒𝟒] r= −𝟓𝟔𝟐𝟎 √𝟓𝟓𝟓𝟏𝟎𝟑𝟎𝟒 → r= −𝟓𝟔𝟐𝟎 𝟕𝟒𝟓𝟎,𝟓𝟐 → r= -0,7586// O coeficiente de Pearson é -0,7586 existindo portanto, uma correlação negativa forte.// 49 ** Poupança X nº de filhos ** n Poupança (R$10,00) nº de filhos x2 y2 (x.y) 1 4 8 16 64 32 2 7 6 49 36 42 3 5 5 25 25 25 4 20 1 400 1 20 5 20 2 400 4 40 6 30 2 900 4 60 7 8 3 64 9 24 8 8 2 64 4 16 9 3 6 9 36 18 10 15 1 225 1 15 ∑ 120 36 2152 184 292 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟐𝟗𝟐)–(𝟏𝟐𝟎).(𝟑𝟔) √[𝟏𝟎.(𝟐𝟏𝟓𝟐)−(𝟏𝟐𝟎)𝟐].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐] r= 𝟐𝟗𝟐𝟎−𝟒𝟑𝟐𝟎 √[𝟐𝟏𝟓𝟐𝟎−𝟏𝟒𝟒𝟎𝟎].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] → r= −𝟏𝟒𝟎𝟎 √[𝟕𝟏𝟐𝟎].[𝟓𝟒𝟒] r= −𝟏𝟒𝟎𝟎 √𝟑𝟖𝟕𝟑𝟐𝟖𝟎 → r= −𝟏𝟒𝟎𝟎 𝟏𝟗𝟔𝟖,𝟎𝟔𝟓 → r= -0,7113// O coeficiente de Pearson é -0,7113 existindo portanto, uma correlação negativa média.// 50 ** Média anos de estudo X nº de filhos ** n média de anos de estudo da família nº de filhos x2 y2 (x.y) 1 3 8 9 64 24 2 4 6 16 36 24 3 5 5 25 25 25 4 12 1 144 1 12 5 16 2 256 4 32 6 18 2 324 4 36 7 8 3 64 9 24 8 8 2 64 4 16 9 4 6 16 36 24 10 8 1 64 1 8 ∑ 86 36 982 184 225 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟐𝟐𝟓)–(𝟖𝟔).(𝟑𝟔) √[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐] r= 𝟐𝟐𝟓𝟎−𝟑𝟎𝟗𝟔 √[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] → r= −𝟖𝟒𝟔 √[𝟐𝟒𝟐𝟒].[𝟓𝟒𝟒] r= −𝟖𝟒𝟔 √𝟏𝟑𝟏𝟖𝟔𝟓𝟔 → r= −𝟖𝟒𝟔 𝟏𝟏𝟒𝟖,𝟑𝟐 → r= -0,7367// O coeficiente de Pearson é -0,7367 existindo portanto, uma correlação negativa média.// 51 ** Renda familiar X Média anos de estudo ** n Renda (R$100,00) média de anos de estudo da família x2 y2 (x.y) 1 10 3 100 9 30 2 15 4 225 16 60 3 12 5 144 25 60 4 70 12 4900 144 840 5 80 16 6400 256 1280 6 100 18 10000 324 1800 7 20 8 400 64 160 8 30 8 900 64 240 9 10 4 100 16 40 10 60 8 3600 64 480 ∑ 407 86 26769 982 4990 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟒𝟗𝟗𝟎)–(𝟒𝟎𝟕).(𝟖𝟔) √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐].[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐] r= 𝟒𝟗𝟗𝟎𝟎−𝟑𝟓𝟎𝟎𝟐 √[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔] → r= 𝟏𝟒𝟖𝟗𝟖 √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟐𝟒𝟐𝟒] r= 𝟏𝟒𝟖𝟗𝟖 √𝟐𝟒𝟕𝟑𝟒𝟕𝟑𝟖𝟒 → r= 𝟏𝟒𝟖𝟗𝟖 𝟏𝟓𝟕𝟐𝟕,𝟐𝟖 → r= 0,9472// O coeficiente de Pearson é 0,9472 existindo portanto, uma correlação positiva forte.// b) Equação da Regressão (Renda X Poupança): Temos que: Média x= 40,7 e Média y=12 b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟕𝟓𝟑𝟓−𝟏𝟎(𝟒𝟎,𝟕)(𝟏𝟐) 𝟐𝟔𝟕𝟔𝟗−𝟏𝟎(𝟒𝟎,𝟕)𝟐 ~ ~ ~ 52 b= 𝟕𝟓𝟑𝟓−(𝟒𝟖𝟖𝟒) 𝟐𝟔𝟕𝟔𝟗−𝟏𝟔𝟓𝟔𝟒,𝟗 → b= 𝟐𝟔𝟓𝟏 𝟏𝟎𝟐𝟎𝟒,𝟏 → b= 0,2598// a= 12-(0,2598)(40,7) → a= 12-10,5738 → a= 1,4262 Equação da Regressão: y= 1,4262+0,2598x Para renda igual a 2000 reais temos: y= 1,4262+0,2598(2000) y= 1,4262+519,6 y= 521,0262 Para uma renda de R$ 2000,00 a poupança será de aproximadamente R$ 521,02 16. A administração de um banco desejava estabelecer um critério objetivo para avaliar a eficiência de seus gerentes. Para isso, levantou (para cada um dos subdistritos onde possuía agência) dados a respeito do depósito médio mensal por agência e o número de estabelecimentos comerciais existentes nesses subdistritos. Os dados são os seguintes: n Subdistritos nº de estabelecimentos comerciais depósito médio mensal por agência (10000 R$) 1 Nossa Senhora do Ó 16 14 2 Casa Verde 30 16 3 Vila Formosa 35 19 4 Santana 70 30 5 Barra Funda 90 31 6 Jardim Paulista 120 33 7 Santo Amaro 160 35 8 Lapa 237 43 9 Pinheiros 378 50 53 a) Construa o diagrama de dispersão b) Ajuste uma reta aos dados e estime um depósito médio para um número de estabelecimentos comerciais iguais a 350. c) Qual o crescimento nos depósitos médios, para cada estabelecimento a mais no subdistrito?d) Trace a reta no diagrama de Dispersão e) Determine o coeficiente de correlação e interprete-o f) Calcule e interprete o coeficiente de determinação Resolução: a) Diagrama de Dispersão: b) Equação da Regressão: Temos que: Média x= 126,22 e Média y=30,11 b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟒𝟒𝟗𝟏𝟎−𝟗(𝟏𝟐𝟔,𝟐𝟐)(𝟑𝟎,𝟏𝟏) 𝟐𝟓𝟒𝟒𝟑𝟒−𝟗(𝟏𝟐𝟔,𝟐𝟐)𝟐 0 10 20 30 40 50 60 0 100 200 300 400 Série1 ~ ~ ~ 54 b= 𝟒𝟒𝟗𝟏𝟎−(𝟑𝟒𝟐𝟎𝟒,𝟑𝟓𝟕𝟖) 𝟐𝟓𝟒𝟒𝟑𝟒−𝟏𝟒𝟑𝟑𝟖𝟑,𝟑𝟗𝟔 → b= 𝟏𝟎𝟕𝟎𝟓,𝟔𝟒𝟐𝟐 𝟏𝟏𝟏𝟎𝟓𝟎,𝟔𝟎𝟒 → b= 0,0964// a= 30,11-(0,0964)(126,22) → a= 30,11-12,167 → a= 17,944 Equação da Regressão: y= 17,944+0,0964x Para um número de estabelecimentos comerciais igual a 350 temos: y= 17,944+0,0964(350) y= 17,944+33,74 y=51,684// Para 350 estabelecimentos comerciais temos um depósito médio (R$ 10000) de R$ 51,68// c) y= 17,944+0,0964(1) y=18,0404 O acréscimo médio nos depósitos mensais para cada estabelecimento a mais é de R$ 18,0404// 55 d) Reta de Regressão: e) Coeficiente de Correlação: n Subdistritos nº de estabelecimentos comerciais depósito médio mensal por agência (10000 R$) X2 Y2 (X.Y) 1 Nossa Senhora do Ó 16 14 256 196 224 2 Casa Verde 30 16 900 256 480 3 Vila Formosa 35 19 1225 361 665 4 Santana 70 30 4900 900 2100 5 Barra Funda 90 31 8100 961 2790 6 Jardim Paulista 120 33 14400 1089 3960 7 Santo Amaro 160 35 25600 1225 5600 8 Lapa 237 43 56169 1849 10191 9 Pinheiros 378 50 142884 2500 18900 ∑ 1136 271 254434 9337 44910 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟗.(𝟒𝟒𝟗𝟏𝟎)–(𝟏𝟏𝟑𝟔).(𝟐𝟕𝟏) √[𝟗.(𝟐𝟓𝟒𝟒𝟑𝟒)−(𝟏𝟏𝟑𝟔)𝟐].[𝟗.(𝟗𝟑𝟑𝟕)−(𝟐𝟕𝟏)𝟐] r= 𝟒𝟎𝟒𝟏𝟗𝟎−𝟑𝟎𝟕𝟖𝟓𝟔 √[𝟐𝟐𝟖𝟗𝟗𝟎𝟔−𝟏𝟐𝟗𝟎𝟒𝟗𝟔].[𝟖𝟒𝟎𝟑𝟑−𝟕𝟑𝟒𝟒𝟏] → r= 𝟗𝟔𝟑𝟑𝟒 √[𝟗𝟗𝟗𝟒𝟏𝟎].[𝟏𝟎𝟓𝟗𝟐] r= 𝟗𝟔𝟑𝟑𝟒 √𝟏𝟎𝟓𝟖𝟓𝟕𝟓𝟎𝟕𝟐𝟎 → r= 𝟗𝟔𝟑𝟑𝟒 𝟏𝟎𝟐𝟖𝟖𝟕,𝟎𝟕𝟕𝟓 → r= 0,9363// y = 0,0964x + 17,944 R² = 0,8767 0 10 20 30 40 50 60 0 100 200 300 400 Série1 Linear (Série1) 56 O coeficiente de Pearson é 0,9363 existindo portanto, uma correlação positiva forte.// f) Coeficiente de Determinação: R2=0,8767// 17. Com o objetivo de verificar se numa certa região existe correlação entre o nível de escolaridade médio dos pais e o nível de escolaridade dos filhos, observou-se uma amostra aleatória de 8 indivíduos adultos, verificando o número de anos que estes freqüentaram (e tiveram aprovação) em escolas regulares(Y) e o número médio de anos que os seus pais freqüentaram (e tiveram aprovação) em escolas regulares (X). Ao resultados são apresentados no quadro abaixo: x 0 0 2 3 4 4 5 7 y 2 3 2 5 9 8 8 15 a) Calcule o coeficiente de correlação de Pearson b) Em termos do Resultado do item (a) , o que se pode dizer sobre a correlação entre o número de anos que os 8 indivíduos freqüentaram escolas regulares (Y) e o número médio de anos que os seus pais freqüentaram escolas regulares (X)? Resolução: a) Coeficiente de Pearson: n x y x2 y2 (x.y) 1 0 2 0 4 0 2 0 3 0 9 0 3 2 2 4 4 4 4 3 5 9 25 15 5 4 9 16 81 36 6 4 8 16 64 32 7 5 8 25 64 40 8 7 15 49 225 105 ∑ 25 52 119 476 232 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟖.(𝟐𝟑𝟐)–(𝟐𝟓).(𝟓𝟐) √[𝟖.(𝟏𝟏𝟗)−(𝟐𝟓)𝟐].[𝟖.(𝟒𝟕𝟔)−(𝟓𝟐)𝟐] 57 r= 𝟏𝟖𝟓𝟔−𝟏𝟑𝟎𝟎 √[𝟗𝟓𝟐−𝟔𝟐𝟓].[𝟑𝟖𝟎𝟖−𝟐𝟕𝟎𝟒] → r= 𝟓𝟓𝟔 √[𝟑𝟐𝟕].[𝟏𝟏𝟎𝟒] r= 𝟓𝟓𝟔 √𝟑𝟔𝟏𝟎𝟎𝟖 → r= 𝟓𝟓𝟔 𝟔𝟎𝟎,𝟖𝟑𝟗𝟒 → r= 0,9253// O coeficiente de Pearson é 0,9253 existindo portanto, uma correlação positiva forte.// b) Verificou-se que há uma forte correlação entre os dados, estudaram mais os filhos cujos pais freqüentaram (e tiveram aprovação) escolas regulares por mais tempo. 18. A tabela a seguir relaciona os pesos (em centenas de Kg) e as taxas de consumo de combustível em rodovia (km/litro) numa amostra de 10 carros e passeio novos. peso 12 13 14 14 16 18 19 22 24 26 consumo 16 14 14 13 11 12 9 9 8 6 a) Calcule o coeficiente de correlação de Pearson. b) Considerando o resultado do item (a), como você avalia o relacionamento entre o peso e o consumo, na amostra observada? c) Para estabelecer uma reta de regressão, qual deve ser a variável dependente e qual deve ser a variável independente? Justifique a sua resposta. d) Estabeleça a equação de regressão, considerando a resposta do item (c). e) Apresente o diagrama de dispersão e a reta de regressão obtida em (d). f) Você considera adequado o modelo de ajuste de regressão do item (d)? De uma medida desta adequação interpretando-a g) Qual o consumo esperado para um carro de 2000 kg? h) Você considera o seu estudo capaz de predizer o consumo esperado para um carro de 7000 kg? Justifique sua resposta. 58 Resolução: a) Coeficiente de Correlação: n peso consumo x2 y2 (x.y) 1 12 16 144 256 192 2 13 14 169 196 182 3 14 14 196 196 196 4 14 13 196 169 182 5 16 11 256 121 176 6 18 12 324 144 216 7 19 9 361 81 171 8 22 9 484 81 198 9 24 8 576 64 192 10 26 6 676 36 156 ∑ 178 112 3382 1344 1861 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟏𝟖𝟔𝟏)–(𝟏𝟕𝟖).(𝟏𝟏𝟐) √[𝟏𝟎.(𝟑𝟑𝟖𝟐)−(𝟏𝟕𝟖)𝟐].[𝟏𝟎.(𝟏𝟑𝟒𝟒)−(𝟏𝟏𝟐)𝟐] r= 𝟏𝟖𝟔𝟏𝟎−𝟏𝟗𝟗𝟑𝟔 √[𝟑𝟑𝟖𝟐𝟎−𝟑𝟏𝟔𝟖𝟒].[𝟏𝟑𝟒𝟒𝟎−𝟏𝟐𝟓𝟒𝟒] → r= −𝟏𝟑𝟐𝟔 √[𝟐𝟏𝟑𝟔].[𝟖𝟗𝟔] r= −𝟏𝟑𝟐𝟔 √𝟏𝟗𝟏𝟑𝟖𝟓𝟔 → r= −𝟏𝟑𝟐𝟔 𝟏𝟑𝟖𝟑,𝟒𝟐𝟏𝟖 → r= -0,9584// O coeficiente de Pearson é -0,9584 existindo portanto, uma correlação negativa forte.// b) Há uma forte correlação. Quanto maior o peso do veículo, menor será o consumo. c) A variável dependente será o consumo e a variável independente será o peso, analisa-se através dos dados qual a variação do consumo em função do peso do veículo: y(x) 59 d) Equação da Regressão: Temos que: Média x= 17,8 e Média y=11,2 b= ∑𝒙𝒚−𝒏.𝒙.𝒚 ∑𝒙𝟐−𝒏.𝒙𝟐 → b= 𝟏𝟖𝟔𝟏−𝟏𝟎(𝟏𝟕,𝟖)(𝟏𝟏,𝟐) 𝟑𝟑𝟖𝟐−𝟏𝟎(𝟑𝟏𝟔,𝟖𝟒)𝟐 b= 𝟏𝟖𝟔𝟏−(𝟏𝟗𝟗𝟑,𝟔) 𝟑𝟑𝟖𝟐−𝟑𝟏𝟔𝟖,𝟒 → b= −𝟏𝟑𝟐,𝟔 𝟐𝟏𝟑,𝟔 → b= -0,6208// a= 11,2-(-0,6208)(17,8) → a= 11,2+11,05 → a= 22,25 Equação da Regressão: y= 22,25-0,6208x// e) Diagrama de Dispersão: 0 2 4 6 8 10 12 14 16 18 0 10 20 30 Série1 ~ ~ ~ 60 Reta da Regressão e Equação da Regressão: f) Sim, este modelo linear se aplica bem, sendo a correlação quase perfeita. g) Sendo os dados em centenas de Kg o consumo para 2000, será: 2000/100= 20, portanto x=20. y= 22,25-0,6208x y= 22,25-0,6208(20) y= 22,25-12,416 y=9,834 O consumo para um veículo de 2000kg será de aproximadamente 9,8 (km/litro) h) Não, não considero, de acordo com a equação da regressão um carro de 7000 kg ganharia gasolina ao invés de consumir, por km rodado. É um valor exorbitante que foge das previsões. 7000/100= 70, portanto x=70 y= 22,25-0,6208x y= 22,25-0,6208(70) y= 22,25-43,456 y= -0,6208x + 22,25 R² = 0,9187 0 2 4 6 8 10 12 14 16 18 0 10 20 30 Série1 Linear (Série1) 61 y=-21,20 Como o consumo não pode ser negativo (-21,20 km/l), presumimos que para 7000kg não é possível presumir-se o consumo. 19. O administrador de uma grande sorveteria anotou por um longo período de tempo a temperatura média diária em ºC (x), e o volume de vendas diária de sorvete, em kg (y). Com os dados, estabeleceu uma equação de regressão, resultando em: y=0,5 + 1,8x, com R2= 0,80 Pede-se: a) Qual o consumo esperado de sorvete num dia de 27ºC? b) Qual o incremento esperado nas vendas para cada 1ºC de aumento da temperatura? Resolução: a) y= 0,5+1,8(27) → y=0,5+48,60 → y=49,10// O consumo esperado em um dia de 27ºC é de 49,10 Kg.// b) y= 0,5+1,8(1) → y=0,5+1,8 → y=2,30 O incremento esperado nas vendas para cada 1ºC de aumento na temperatura é de 2,30 kg.// 20. Investigaram em que medida partículas de chumbo potencialmente tóxicas emitidas por veículos automotores são absorvidas por ciclistas que participam de competições. A tabela abaixo, construída a partir de um gráfico apresentado em seu artigo, fornece níveis de chumbo no sangue e horas de treinamento de 10 ciclistas. Horas de treinamento 8 10 10 12 15 18 18 21 25 25 chumbo no sangue (mml/L) 0,53 0,25 0,34 0,25 0,29 0,3 0,53 0,53 0,53 0,87 62 Pede-se: a) Faça um gráfico dos dados. Quais suas impressões? b) Verifique se há uma correlação entre níveis de chumbo no sangue e horas de treinamento. c) O ciclista 10 tem níveis muito altos. Nossa evidência de uma relação é proveniente quase que inteiramente desta observação? Repita (b) omitindo o ciclista 10. d) O que fizemos em (c) parece razoável? e) Está claro a partir do gráfico obtido em (a) que há variação nos dados que não é explicada pelas horas de treinamento. (O que nos dá esta informação?). Talvez o efeito de horas de treinamento não apareça tão fortemente como deveria, porque estamos deixando de levar em consideração outras variáveis importantes. Sugira algumas outras variáveis que poderiam ser importantes. Resolução: a) Diagrama de Dispersão: 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 5 10 15 20 25 30 Série1 63 b) Coeficiente de Correlação: n Horas de treinamento chumbo no sangue (mml/L) x2 y2 (x.y) 1 8 0,53 64 0,2809 4,24 2 10 0,25 100 0,0625 2,5 3 10 0,34 100 0,1156 3,4 4 12 0,25 144 0,0625 3 5 15 0,29 225 0,0841 4,35 6 18 0,3 324 0,09 5,4 7 18 0,53 324 0,2809 9,54 8 21 0,53 441 0,2809 11,13 9 25 0,53 625 0,2809 13,25 10 25 0,87 625 0,7569 21,75 ∑ 162 4,42 2972 2,2952 78,56 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟏𝟎.(𝟕𝟖,𝟓𝟔)–(𝟏𝟔𝟐).(𝟒,𝟒𝟐) √[𝟏𝟎.(𝟐𝟗𝟕𝟐)−(𝟏𝟔𝟐)𝟐].[𝟏𝟎.(𝟐,𝟐𝟗𝟓𝟐)−(𝟒,𝟒𝟐)𝟐] r= 𝟕𝟖𝟓,𝟔−𝟕𝟏𝟔,𝟎𝟒 √[𝟐𝟗𝟕𝟐𝟎−𝟐𝟔𝟐𝟒𝟏].[𝟐𝟐,𝟗𝟓−𝟏𝟗,𝟓𝟑] → r= 𝟔𝟗,𝟓𝟔 √[𝟑𝟒𝟕𝟗].[𝟑,𝟒𝟐] r= 𝟔𝟗,𝟓𝟔 √𝟏𝟏𝟖𝟗𝟖,𝟏𝟖 → r= 𝟔𝟗,𝟓𝟔 𝟏𝟎𝟗,𝟎𝟕𝟐𝟕 → r= 0,6385// O coeficiente de Pearson é 0,6385 existindo portanto, uma correlação positiva moderada.// 64 c) Coeficiente de Correlação (Omitindo o décimo ciclista): n Horas de treinamento chumbo no sangue (mml/L) x2 y2 (x.y) 1 8 0,53 64 0,2809 4,24 2 10 0,25 100 0,0625 2,5 3 10 0,34 100 0,1156 3,4 4 12 0,25 144 0,0625 3 5 15 0,29 225 0,0841 4,35 6 18 0,3 324 0,09 5,4 7 18 0,53 324 0,2809 9,54 8 21 0,53 441 0,2809 11,13 9 25 0,53 625 0,2809 13,25 ∑ 137 3,55 2347 1,5383 56,81 r= 𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 √[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐] → r= 𝟗.(𝟓𝟔,𝟖𝟏)–(𝟏𝟑𝟕).(𝟑,𝟓𝟓) √[𝟗.(𝟐𝟑𝟒𝟕)−(𝟏𝟑𝟕)𝟐].[𝟗.(𝟏,𝟓𝟑𝟖𝟑)−(𝟑,𝟓𝟓)𝟐] r= 𝟓𝟏𝟏,𝟐𝟗−𝟒𝟖𝟔,𝟑𝟓 √[𝟐𝟏𝟏𝟐𝟑−𝟏𝟖𝟕𝟔𝟗].[𝟏𝟑,𝟖𝟒𝟒𝟕−𝟏𝟐,𝟔𝟎𝟐𝟓] → r= 𝟐𝟒,𝟗𝟒 √[𝟐𝟑𝟓𝟒].[𝟏,𝟐𝟒𝟐𝟐] r= 𝟐𝟒,𝟗𝟒 √𝟐𝟗𝟐𝟒,𝟏𝟑𝟖𝟖 → r= 𝟐𝟒,𝟗𝟒 𝟓𝟒,𝟎𝟕𝟓𝟑𝟎𝟔𝟕 → r= 0,4612// O coeficiente de Pearson é 0,4612 existindo portanto, uma correlação positiva fraca.// d) Sim, parece razoável, a retirada do décimo ciclista gerou uma mudança razoável na correlação. e) Sim, os dados estão bastante dispersos, poderíamos considerar como outros fatores a alimentação e horas de sono.
Compartilhar