Buscar

TRABALHO DE ESTATÍSTICA - Correlação e Regressão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
 
 
 
 
 
 
TRABALHO DE ESTATÍSTICA 
EXERCÍCIOS - CORRELAÇÃO E REGRESSÃO 
 
 
 
 
 
 
 
 
CURITIBA 
2010 
2 
 
DANIELE FERREIRA 
 
 
 
TRABALHO DE ESTATÍSTICA 
EXERCÍCIOS - CORRELAÇÃO E REGRESSÃO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
CURITIBA 
2010 
Trabalho apresentado à ESIC - Business & 
Marketing School, como requisito para obtenção 
de nota parcial na disciplina de Estatística 
dedutiva, turma 3F1D. Sob orientação do prof o 
Gilmar Bornatto. 
3 
 
 
 
SUMÁRIO 
 
1. EXERCÍCIO .......................................................................................................... 7 
 RESOLUÇÃO .......................................................................................................... 8 
 Item (a) – diagrama de dispersão .......................................................................... 8 
 Item (b) – Coeficiente de Pearson ......................................................................... 9 
 
2. EXERCÍCIO .......................................................................................................... 9 
 RESOLUÇÃO ........................................................................................................ 10 
 Item (a) – diagrama de dispersão ........................................................................ 10 
 Item (b) – Ponto Discrepante ............................................................................... 11 
 Item (c) – Coeficiente de Pearson ........................................................................ 11 
 Item (d) – Coeficiente de Pearson – sem ponto discrepante ............................. 12 
 
4. EXERCÍCIO ........................................................................................................ 13 
 RESOLUÇÃO ........................................................................................................ 13 
 Item (a) – Coeficiente de Pearson ........................................................................ 13 
 
5. EXERCÍCIO ........................................................................................................ 14 
 RESOLUÇÃO ........................................................................................................ 14 
 Item (a) – Interpretação ....................................................................................... 14 
 Item (b) – Interpretação ....................................................................................... 14 
 Item (c) – Interpretação ....................................................................................... 14 
 
6. EXERCÍCIO ........................................................................................................ 15 
 RESOLUÇÃO .......................................................................................................... 5 
 Item (a) – Interpretação ....................................................................................... 15 
 Item (b) – Interpretação ....................................................................................... 15 
 
7. EXERCÍCIO ........................................................................................................ 15 
 RESOLUÇÃO ........................................................................................................ 15 
 Item (a) – Interpretação ....................................................................................... 15 
 Item (b) – Equação da regressão ......................................................................... 15 
 Item (c) – Gráfico .................................................................................................. 17 
 Item (d) – Interpretação ....................................................................................... 17 
 Item (e) – Coeficiente de Determinação .............................................................. 17 
 Item (f) – Interpretação ........................................................................................ 18 
4 
 
 
9. EXERCÍCIO ........................................................................................................ 18 
 RESOLUÇÃO ........................................................................................................ 18 
 Item (a) – Média e Desvio Padrão ....................................................................... 19 
 Item (b) – Diagrama de Dispersão ...................................................................... 19 
 Item (c) – Reta de Regressão ............................................................................... 20 
 Item (d) – Coeficiente de Correlação .................................................................. 21 
 
10. EXERCÍCIO ........................................................................................................ 22 
 RESOLUÇÃO ........................................................................................................ 22 
 Item (a) – Interpretação ....................................................................................... 22 
 Item (b) – Diagrama de Dispersão ...................................................................... 23 
 Item (c) – Coeficiente de Correlação ................................................................... 23 
 
11. EXERCÍCIO ........................................................................................................ 24 
 RESOLUÇÃO ........................................................................................................ 25 
 Item (a) – Média e Desvio Padrão ....................................................................... 25 
1. Conjunto 1 ........................................................................................................ 25 
2. Conjunto 2 ......................................................................................................... 26 
3. Conjunto 3 ........................................................................................................ 26 
4. Conjunto 4 ........................................................................................................ 27 
 Item (b) – Coeficiente de Correlação .................................................................. 27 
1. Conjunto 1 ........................................................................................................ 27 
2. Conjunto 2 ......................................................................................................... 28 
3. Conjunto 3 ........................................................................................................ 28 
4. Conjunto 4 ........................................................................................................ 29 
 Item (c) – Diagrama de Dispersão ....................................................................... 29 
1. Conjunto 1 ........................................................................................................ 29 
2. Conjunto 2 ......................................................................................................... 30 
3. Conjunto 3 ........................................................................................................30 
4. Conjunto 4 ........................................................................................................ 31 
 Item (d) – Interpretação ....................................................................................... 31 
 
12. EXERCÍCIO ........................................................................................................ 32 
 RESOLUÇÃO ........................................................................................................ 32 
 Item (a) – Diagrama de Dispersão ....................................................................... 32 
1. Produtividade X Alimentação .......................................................................... 32 
2. Produtividade X Exercícios ............................................................................... 33 
3. Produtividade X Rodízio .................................................................................. 33 
 Item (b) – Coeficiente de Correlação .................................................................. 34 
1. Produtividade X Alimentação .......................................................................... 34 
5 
 
2. Produtividade X Exercícios ............................................................................... 35 
3. Produtividade X Rodízio .................................................................................. 36 
 
13. EXERCÍCIO ........................................................................................................ 37 
 RESOLUÇÃO ........................................................................................................ 37 
 Item (a) – Diagrama de Dispersão (Renda e Poupança) ................................... 38 
 Item (b) – Equação da regressão e Interpretação .............................................. 38 
 Item (c) – Interpretação ....................................................................................... 39 
 Item (d) – Coeficiente de Correlação .................................................................. 40 
 Item (e) – Coeficiente de Determinação .............................................................. 40 
 Item (f) – Diagrama de Dispersão (Renda e Consumo) .................................... 41 
 
14. EXERCÍCIO ........................................................................................................ 42 
 RESOLUÇÃO ........................................................................................................ 43 
 Item (a) – Diagrama de Dispersão ....................................................................... 43 
 Item (b) – Equação da regressão e Interpretação .............................................. 43 
 Item (c) – Interpretação ....................................................................................... 44 
 Item (d) – Reta de Regressão ............................................................................... 44 
 Item (e) – Coeficiente de Correlação ................................................................... 45 
 Item (f) – Coeficiente de Determinação .............................................................. 45 
 
15. EXERCÍCIO ........................................................................................................ 46 
 RESOLUÇÃO ........................................................................................................ 47 
 Item (a) – Coeficiente de Correlação .................................................................. 47 
1. Renda e Poupança ............................................................................................. 47 
2. Renda e número de Filhos ................................................................................. 48 
3. Poupança e número de Filhos ........................................................................... 49 
4. Média dos anos de estudo e número de Filhos ................................................. 50 
5. Renda Familiar e média dos anos de estudo ..................................................... 51 
 Item (b) – Equação da regressão e Interpretação ............................................... 51 
 
16. EXERCÍCIO ........................................................................................................ 52 
 RESOLUÇÃO ........................................................................................................ 53 
 Item (a) – Diagrama de Dispersão ....................................................................... 53 
 Item (b) – Equação da regressão e Interpretação .............................................. 53 
 Item (c) – Interpretação ....................................................................................... 54 
 Item (d) – Reta de Regressão ............................................................................... 55 
 Item (e) – Coeficiente de Correlação ................................................................... 55 
 Item (d) – Coeficiente de Determinação ............................................................. 56 
 
6 
 
17. EXERCÍCIO ........................................................................................................ 56 
 RESOLUÇÃO ........................................................................................................ 56 
 Item (a) – Coeficiente de Correlação .................................................................. 56 
 Item (b) – Interpretação ....................................................................................... 57 
 
18. EXERCÍCIO ........................................................................................................ 57 
 RESOLUÇÃO ........................................................................................................ 58 
 Item (a) – Coeficiente de Correlação .................................................................. 58 
 Item (b) – Interpretação ....................................................................................... 58 
 Item (c) – Interpretação ....................................................................................... 58 
 Item (d) – Equação da Regressão ........................................................................ 59 
 Item (e) – Diagrama de Dispersão e reta de Regressão ..................................... 59 
 Item (f) – Interpretação ........................................................................................ 60 
 Item (g) – Interpretação ....................................................................................... 60 
 Item (h) – Interpretação ....................................................................................... 60 
 
19. EXERCÍCIO ........................................................................................................ 61 
 RESOLUÇÃO ........................................................................................................ 61 
 Item (a) – Interpretação ....................................................................................... 61 
 Item (b) – Interpretação ....................................................................................... 61 
 
20. EXERCÍCIO ........................................................................................................ 61 
 RESOLUÇÃO ........................................................................................................62 
 Item (a) – Diagrama de Dispersão ....................................................................... 62 
 Item (b) – Coeficiente de Correlação .................................................................. 63 
 Item (c) – Interpretação e Coeficiente de Correlação ....................................... 64 
 Item (d) – Interpretação ....................................................................................... 64 
 Item (e) – Interpretação ....................................................................................... 64 
 
 
 
 
 
 
 
 
7 
 
Correlação e Regressão- Lista De Exercícios 
 
1. Considerando os dados do Quadro 1: 
a) Construir um diagrama de dispersão para as variáveis taxa de alfabetização e taxa de 
mortalidade infantil. Quais as informações observadas no gráfico? 
b) Calcule o coeficiente de correlação de Pearson entre as variáveis taxa de 
alfabetização e taxa de mortalidade infantil. Interprete o resultado obtido. 
 
Quadro 1 - Alguns dados de doze importantes municípios catarinenses 
município 
população 
(em 1000 
hab.) 
população 
urbana 
% população 
urbana 
taxa de cresc. 
Demográfico 
taxa mortalidade 
infantil 
taxa de 
alfabetização 
Itajaí 101 94 93 3,19 37 85 
Blumenau 193 181 94 4,6 27 90 
Rio do Sul 42 39 94 2,78 38 85 
Joinville 304 292 96 6,46 25 87 
Curitibanos 42 32 76 1,99 67 75 
Lages 152 126 83 1,89 63 78 
Canoinhas 55 36 66 2,92 41 81 
Chapecó 105 77 73 5,32 13 75 
Concórdia 68 25 37 2,71 28 84 
Floripa 219 186 85 3,11 17 87 
Criciúma 129 116 90 3,11 32 85 
Laguna 42 33 78 1,21 32 77 
 
 
 
 
 
 
 
 
 
 
8 
 
Resolução: 
n taxa de 
mortalidade (x) 
taxa de 
alfabetização (y) 
x2 y2 (x.y) 
1 37 85 1369 7225 3145 
2 27 90 729 8100 2430 
3 38 85 1444 7225 3230 
4 25 87 625 7569 2175 
5 67 75 4489 5625 5025 
6 63 78 3969 6084 4914 
7 41 81 1681 6561 3321 
8 13 75 169 5625 975 
9 28 84 784 7056 2352 
10 17 87 289 7569 1479 
11 32 85 1024 7225 2720 
12 32 77 1024 5929 2464 
∑ 420 989 17596 81793 34230 
 
 
a) Diagrama de Dispersão: 
 
 
Observa-se que os pontos estão bastante dispersos, poderá, provavelmente, haver 
fraca ou média correlação.// 
 
 
 
74
76
78
80
82
84
86
88
90
92
0 20 40 60 80
9 
 
b) Coeficiente de Pearson 
 r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟐.(𝟑𝟒𝟐𝟑𝟎)–(𝟒𝟐𝟎).(𝟗𝟖𝟗)
√[𝟏𝟐.(𝟏𝟕𝟓𝟗𝟔)−(𝟒𝟐𝟎)𝟐].[𝟏𝟐.(𝟖𝟏𝟕𝟗𝟑)−(𝟗𝟖𝟗)𝟐]
 
 
r= 
𝟒𝟏𝟎𝟕𝟔𝟎−𝟒𝟏𝟓𝟑𝟖𝟎
√[𝟐𝟏𝟏𝟏𝟓𝟐−𝟏𝟕𝟔𝟒𝟎𝟎].[𝟗𝟖𝟏𝟓𝟏𝟔−𝟗𝟕𝟖𝟏𝟐𝟏]
 → r= 
−𝟒𝟔𝟐𝟎
√[𝟑𝟒𝟕𝟓𝟐].[𝟑𝟑𝟗𝟓]
 
 
r= 
−𝟒𝟔𝟐𝟎
√𝟏𝟏𝟕𝟗𝟖𝟑𝟎𝟒𝟎
 → r= 
−𝟒𝟔𝟐𝟎
𝟏𝟎𝟖𝟔𝟏,𝟗𝟗𝟗𝟖𝟐
 → r= -0,42533604// 
 
O coeficiente de Pearson é -0,4253 existindo portanto, uma correlação negativa 
fraca.// 
 
2. Sendo X= nota na prova do vestibular de matemática e Y= nota final na disciplina de 
cálculo. Estas variáveis foram observadas em 20 alunos, ao final do primeiro período 
letivo de um curso de engenharia. Os dados são apresentados a seguir: 
 
x y x y x y x y x y 
39 65 43 78 21 52 64 82 65 88 
57 92 47 89 28 73 75 98 47 71 
34 56 52 75 35 50 30 50 28 52 
40 70 70 50 80 90 32 58 67 88 
 
a) Construa um diagrama de dispersão e verifique se existe correlação entre os dados 
observados destas duas variáveis. 
b) Existe algum aluno que foge ao geral dos demais (ponto discrepante)? 
c) Calcule a correlação entre a nota no vestibular de matemática e a nota na disciplina 
de cálculo 
d) Retire o valor discrepante detectado e calcule novamente o coeficiente r . Interprete. 
 
 
 
10 
 
Resolução: 
 
n x y x2 y2 (x.y) 
1 39 65 1521 4225 2535 
2 57 92 3249 8464 5244 
3 34 56 1156 3136 1904 
4 40 70 1600 4900 2800 
5 43 78 1849 6084 3354 
6 47 89 2209 7921 4183 
7 52 75 2704 5625 3900 
8 70 50 4900 2500 3500 
9 21 52 441 2704 1092 
10 28 73 784 5329 2044 
11 35 50 1225 2500 1750 
12 80 90 6400 8100 7200 
13 64 82 4096 6724 5248 
14 75 98 5625 9604 7350 
15 30 50 900 2500 1500 
16 32 58 1024 3364 1856 
17 65 88 4225 7744 5720 
18 47 71 2209 5041 3337 
19 28 52 784 2704 1456 
20 67 88 4489 7744 5896 
∑ 954 1427 51390 106913 71869 
 
a) Diagrama de Dispersão: 
 
Observa-se no gráfico a existência de uma correlação média entre os dados.// 
0
20
40
60
80
100
120
0 20 40 60 80 100
11 
 
b) Sim, o ponto em questão é P= (70,50) a tendência é que a nota na disciplina de 
cálculo seja sempre maior que a nota obtida no vestibular de matemática, este 
aluno foi o único que obteve nota no vestibular superior a nota na disciplina de 
cálculo.// 
c) Coeficiente de Pearson: 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟐𝟎.(𝟕𝟏𝟖𝟔𝟗)–(𝟗𝟓𝟒).(𝟏𝟒𝟐𝟕)
√[𝟐𝟎.(𝟓𝟏𝟑𝟗𝟎)−(𝟗𝟓𝟒)𝟐].[𝟐𝟎.(𝟏𝟎𝟔𝟗𝟏𝟑)−(𝟏𝟒𝟐𝟕)𝟐]
 
 
r= 
𝟏𝟒𝟑𝟕𝟑𝟖𝟎−𝟏𝟑𝟔𝟏𝟑𝟓𝟖
√[𝟏𝟎𝟐𝟕𝟖𝟎𝟎−𝟗𝟏𝟎𝟏𝟏𝟔].[𝟐𝟏𝟑𝟖𝟐𝟔𝟎−𝟐𝟎𝟑𝟔𝟑𝟐𝟗]
 → r= 
𝟕𝟔𝟎𝟐𝟐
√[𝟏𝟏𝟕𝟔𝟖𝟒].[𝟏𝟎𝟏𝟗𝟑𝟏]
 
 
r= 
𝟕𝟔𝟎𝟐𝟐
√𝟏𝟏𝟗𝟗𝟓𝟔𝟒𝟕𝟖𝟎𝟒
 → r= 
𝟕𝟔𝟎𝟐𝟐
𝟏𝟎𝟗𝟓𝟐𝟒,𝟔𝟒𝟒𝟕
 → r= 0,6941// 
 
O coeficiente de Pearson é 0,6941 existindo portanto, uma correlação positiva 
média.// 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
12 
 
d) Coeficiente de Pearson - sem P= (70,50): 
n x y x2 y2 (x.y) 
1 39 65 1521 4225 2535 
2 57 92 3249 8464 5244 
3 34 56 1156 3136 1904 
4 40 70 1600 4900 2800 
5 43 78 1849 6084 3354 
6 47 89 2209 7921 4183 
7 52 75 2704 5625 3900 
8 21 52 441 2704 1092 
9 28 73 784 5329 2044 
10 35 50 1225 2500 1750 
11 80 90 6400 8100 7200 
12 64 82 4096 6724 5248 
13 75 98 5625 9604 7350 
14 30 50 900 2500 1500 
15 32 58 1024 3364 1856 
16 65 88 4225 7744 5720 
17 47 71 2209 5041 3337 
18 28 52 784 2704 1456 
19 67 88 4489 7744 5896 
∑ 884 1377 46490 104413 68369 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟗.(𝟔𝟖𝟑𝟔𝟗)–(𝟖𝟖𝟒).(𝟏𝟑𝟕𝟕)
√[𝟏𝟗.(𝟒𝟔𝟒𝟗𝟎)−(𝟖𝟖𝟒)𝟐].[𝟏𝟗.(𝟏𝟎𝟒𝟒𝟏𝟑)−(𝟏𝟑𝟕𝟕)𝟐]
 
 
r= 
𝟏𝟐𝟗𝟗𝟎𝟏𝟏−𝟏𝟐𝟏𝟕𝟐𝟔𝟖
√[𝟖𝟖𝟑𝟑𝟏𝟎−𝟕𝟖𝟏𝟒𝟓𝟔].[𝟏𝟗𝟖𝟑𝟖𝟒𝟕−𝟏𝟖𝟗𝟔𝟏𝟐𝟗]
 → r= 
𝟖𝟏𝟕𝟒𝟑
√[𝟏𝟎𝟏𝟖𝟓𝟒].[𝟖𝟕𝟕𝟏𝟖]
 
 
r= 
𝟖𝟏𝟕𝟒𝟑
√𝟖𝟗𝟑𝟒𝟒𝟐𝟗𝟏𝟕𝟐
 → r= 
𝟖𝟏𝟕𝟒𝟑
𝟗𝟒𝟓𝟐𝟐,𝟏𝟎𝟗𝟒𝟑
 → r= 0,8648// 
 
O coeficiente de Pearson é 0,8648 existindo portanto, uma correlação positiva 
forte. Há uma tendência entre esses pontos de que a nota na disciplina de cálculo 
seja sempre superior a nota no vestibular de matemática. Quando tirou-se o ponto 
discrepante (70,50), onde a nota no vestibular havia sido superior a nota na 
disciplina de cálculo, houve um aumento da correlação entre as notas.// 
 
13 
 
4. Com o objetivo de verificar se existe correlação positiva entre a aptidão em 
matemática e a aptidão em música, foi selecionado um grupo de crianças de 8 a 10 anos 
de idade, que foram submetidas a dois testes de aptidão; um de matemática e outro de 
música. A ordem de aplicação dos testes em cada criança foi aleatória. Os dados estão 
relacionados abaixo: 
 
Quadro 2- Teste de aptidão em crianças 
criança 
valores de aptidão em 
criança 
valores de aptidão em 
matemática música matemática música 
1 60 80 7 48 79 
2 58 62 8 72 88 
3 73 70 9 75 54 
4 51 83 10 83 82 
5 54 62 11 62 64 
6 75 92 12 52 69 
Calcule o coeficiente r e confira o resultado encontrado. 
Resolução:criança 
valores de aptidão em 
matemática (x) música (y) x2 y2 (x.y) 
1 60 80 3600 6400 4800 
2 58 62 3364 3844 3596 
3 73 70 5329 4900 5110 
4 51 83 2601 6889 4233 
5 54 62 2916 3844 3348 
6 75 92 5625 8464 6900 
7 48 79 2304 6241 3792 
8 72 88 5184 7744 6336 
9 75 54 5625 2916 4050 
10 83 82 6889 6724 6806 
11 62 64 3844 4096 3968 
12 52 69 2704 4761 3588 
∑ 763 885 49985 66823 56527 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟐.(𝟓𝟔𝟓𝟐𝟕)–(𝟕𝟔𝟑).(𝟖𝟖𝟓)
√[𝟏𝟐.(𝟒𝟗𝟗𝟖𝟓)−(𝟕𝟔𝟑)𝟐].[𝟏𝟐.(𝟔𝟔𝟖𝟐𝟑)−(𝟖𝟖𝟓)𝟐]
 
 
r= 
𝟔𝟕𝟖𝟑𝟐𝟒−𝟔𝟕𝟓𝟐𝟓𝟓
√[𝟓𝟗𝟗𝟖𝟐𝟎−𝟓𝟖𝟐𝟏𝟔𝟗].[𝟖𝟎𝟏𝟖𝟕𝟔−𝟕𝟖𝟑𝟐𝟐𝟓]
 → r= 
𝟑𝟎𝟔𝟗
√[𝟏𝟕𝟔𝟓𝟏].[𝟏𝟖𝟔𝟓𝟏]
 
14 
 
 
r= 
𝟑𝟎𝟔𝟗
√𝟑𝟐𝟗𝟐𝟎𝟖𝟖𝟎𝟏
 → r= 
𝟑𝟎𝟔𝟗
𝟏𝟖𝟏𝟒𝟒,𝟏𝟏𝟐𝟎𝟐
 → r= 0,1691// 
 
O coeficiente de Pearson é 0,1691 existindo portanto, uma correlação positiva 
fraca.// 
 
5. Com respeito aos 23 alunos de uma turma de estatística, foram observadas as 
seguintes variáveis: número de faltas e nota da disciplina. Estes dados acusaram a 
seguinte correlação, descrita pelo coeficiente de correlação de Pearson; r= -0,56. 
Comente as seguintes frases relativas à turma em estudo e ao coeficiente obtido. 
a) “Como r= -0,56 (correlação relativa moderada), nenhum aluno com grande número 
de faltas tirou nota alta” 
b) “Como as duas variáveis são correlacionadas, bastaria usar uma delas como critério 
de avaliação, pois uma acarreta a outra” 
c) “Os dados observados mostraram uma leve tendência de a nota final se relacionar 
inversamente com o número de faltas, então os alunos freqüentadores tiveram em geral, 
melhor desempenho nas avaliações, do que os alunos que faltaram muito” 
 
Resolução: 
a) Afirmativa falsa, como a correlação é moderada pode ser que algum aluno 
esteja fora do padrão e tenha obtido nota alta mesmo com grande número de 
faltas.// 
b) Afirmativa falsa, para se determinar a correlação de Pearson necessita-se das 
duas variáveis, ou não haveria como comparar.// 
c) Afirmativa verdadeira, em geral, é possível afirmar que grande parte dos alunos 
que freqüentam mais às aulas obtiveram notas maiores, estando um aluno ou outro 
fora do padrão, diminuindo assim, o coeficiente de correlação.// 
 
 
 
 
15 
 
6. Numa amostra aleatória de n=12 livros da Biblioteca Central, encontramos r= 0,207 
entre a idade da edição e o número de páginas do livro. 
a) O que se pode dizer com base no valor deste coeficiente de correlação? 
b) Esta correlação pode ser explicada meramente por fatores casuais? 
 
Resolução: 
a) Que há uma correlação fraca entre a idade da edição e o número de páginas do 
livro.// 
b) Sim, pode. O número de páginas de um livro não se determina pela idade da 
edição, se houver correlação forte em determinada amostra envolvendo estes 
fatores será mera “coincidência” ou pura manipulação de dados.// 
 
7. Nos últimos anos, em várias regiões, houve um movimento migratório que fez 
crescer bastante a população urbana nos municípios médios e grandes. Neste contexto, 
vamos tentar explicar o crescimento demográfico de um município em função de sua 
população urbana, para os municípios do Quadro 1. 
a) Qual deve ser a variável dependente e a independente? 
b) Estabeleça a equação de regressão. 
c) Faça um gráfico com os pontos observados e a reta de regressão estimada. 
d) Qual é a taxa de crescimento demográfico, predita pela equação de regressão, para 
um município de 300 mil habitantes? 
e) Calcule o coeficiente r2. 
f) Quais são as principais informações que podem ser obtidas pela presente análise? 
 
Resolução: 
a) o crescimento demográfico deve ser a variável dependente e a população urbana 
a variável independente.// 
b) Equação da regressão: 
 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔)
𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)𝟐
 
~ ~ 
~ 
16 
 
 
b= 
𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐𝟑𝟔,𝟗𝟗𝟔(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔)
𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟔𝟐𝟔,𝟏𝟎)
 → b= 
𝟒𝟗𝟗𝟎,𝟔𝟖−𝟒𝟎𝟓𝟎,𝟏𝟑𝟎𝟐𝟒𝟓
𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐𝟕𝟓𝟏𝟑,𝟐𝟎
 
 
 
b= 
𝟗𝟒𝟎,𝟓𝟓
𝟕𝟒𝟕𝟓𝟗,𝟖
 → b= 0,01258// 
a= 3,274- 0,01258(103,083) → a= 3,274-1,2967 → a= 1,9773// 
 
Equação da Regressão y= 1,9773 + 0,0126x// 
 
n população 
urbana (x) 
taxa de cresc. 
Demográfico (y) 
x2 y2 (x.y) 
1 94 3,19 8836 10,1761 299,86 
2 181 4,6 32761 21,16 832,6 
3 39 2,78 1521 7,7284 108,42 
4 292 6,46 85264 41,7316 1886,32 
5 32 1,99 1024 3,9601 63,68 
6 126 1,89 15876 3,5721 238,14 
7 36 2,92 1296 8,5264 105,12 
8 77 5,32 5929 28,3024 409,64 
9 25 2,71 625 7,3441 67,75 
10 186 3,11 34596 9,6721 578,46 
11 116 3,11 13456 9,6721 360,76 
12 33 1,21 1089 1,4641 39,93 
∑ 1237 39,29 202273 153,3095 4990,68 
 
Temos que: média x = 103,083, média y= 3,274166 
 
 
 
 
 
17 
 
c) Gráfico: 
 
d) Sendo x = 300 (mil), temos: 
y=1,9773 + 0,0126(300) 
y=1,9773 + 3,78 
y=5,7573// 
 
A taxa de crescimento demográfico predita para um município d 300 mil 
habitantes será de 5,7573// 
 
e) Coeficiente de Correlação: 
r=
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 →r= 
𝟏𝟐.(𝟒𝟗𝟗𝟎,𝟔𝟖)–(𝟏𝟐𝟑𝟕).(𝟑𝟗,𝟐𝟗)
√[𝟏𝟐.(𝟐𝟎𝟐𝟐𝟕𝟑)−(𝟏𝟐𝟑𝟕)𝟐].[𝟏𝟐.(𝟏𝟓𝟑,𝟑𝟎𝟗𝟓)−(𝟑𝟗,𝟐𝟗)𝟐]
 
 
r= 
𝟓𝟗𝟖𝟖𝟖,𝟏𝟔−𝟒𝟖𝟔𝟎𝟏,𝟕𝟑
√[𝟐𝟒𝟐𝟕𝟐𝟕𝟔−𝟏𝟓𝟑𝟎𝟏𝟔𝟗].[𝟏𝟖𝟑𝟗,𝟕𝟏𝟒−𝟏𝟓𝟒𝟑,𝟕𝟎𝟒𝟏]
 → r= 
𝟏𝟏𝟐𝟖𝟔,𝟒𝟑
√[𝟖𝟗𝟕𝟏𝟎𝟕].[𝟐𝟗𝟔,𝟎𝟑𝟔𝟗]
 
 
r= 
𝟏𝟏𝟐𝟖𝟔,𝟒𝟑
√𝟐𝟔𝟓𝟓𝟕𝟔𝟕𝟕𝟓,𝟐
 → r= 
𝟏𝟏𝟐𝟖𝟔,𝟒𝟑
𝟏𝟔𝟐𝟗𝟔,𝟓𝟐𝟔𝟒𝟖
 → r= 0,6925// r2=0,4797// 
 
y = 0,0126x + 1,9773
0
1
2
3
4
5
6
7
0 100 200 300 400
Série1
Linear (Série1)
18 
 
O coeficiente de correlação é 0,69, existindo portanto uma correlação positiva 
média.// 
 
f) Os principais dados que podem ser obtidos: qual a taxa de crescimento 
demográfico em relação à população urbana, obtendo-se os resultados através da 
equação de regressão e a média correlação existente entre esses dois fatores.// 
 
9. Dados o tempo de serviço de 10 funcionários de uma companhia de seguros e o 
número de clientes que cada um possui, verifique se existe uma associação entre estas 
variáveis; 
ano de serviço (x) 2 3 4 5 4 6 7 8 8 10 
Nº de clientes (y) 48 50 56 52 43 60 62 58 64 72 
 
a) Calcule as medidas descritivas destas duas variáveis; 
b) Construa o diagrama de dispersão e anote os valores mínimos e máximos de x e y 
que aparecem no gráfico; 
c) Trace no diagrama de dispersão as retas y= X e x=Y e analise o gráfico; 
d) Calcule e interprete o coeficiente de correlação. 
 
Resolução: 
n ano de serviço (x) Nº de clientes (y) 
1 2 48 
2 3 50 
3 4 56 
4 5 52 
5 4 43 
6 6 60 
7 7 62 
8 8 58 
9 8 64 
10 10 72 
∑ 57 565 
 
 
 
19 
 
a) Medidas Descritivas: 
* Média: x= 5,7// y=56,5// 
*Desvio Padrão: 
n Nº de clientes (y) (y-média y)2 
 
n ano de serviço (x) (x-média x)2 
1 48 72,25 
 
1 2 13,69 
2 50 42,25 
 
2 3 7,29 
3 56 0,25 
 
3 4 2,89 
4 52 20,25 
 
4 5 0,49 
5 43 182,25 
 
5 4 2,89 
6 60 12,25 
 
6 6 0,09 
7 62 30,25 
 
7 7 1,69 
8 58 2,25 
 
8 8 5,29 
9 64 56,25 
 
9 8 5,29 
10 72 240,25 
 
10 10 18,49 
∑ 565 658,5 
 
∑ 57 58,1 
 
Desvio Padrão x: √
𝟓𝟖,𝟏
𝟗
 →Desvio padrão x= 2,5407// 
Desvio Padrão y: √
𝟔𝟓𝟖,𝟓
𝟗
 →Desvio padrão y= 8,5553// 
b) Diagrama de Dispersão: 
 
x mínimo= 2, y mínimo= 43. x máximo= 10, y máximo=72// 
 
 
2;48
3; 50
4; 56
5; 52
4; 43
6; 60
7; 62 8; 58
8; 64
10; 72
0
10
20
30
40
50
60
70
80
0 2 4 6 8 10 12
Série1
20 
 
c) Representação da Reta no gráfico: 
 
Através do gráfico nota-se uma forte correlação entre os dados. 
 
*Equação da Regressão: 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟑𝟑𝟗𝟐−𝟏𝟎(𝟓,𝟕)(𝟓𝟔,𝟓)
𝟑𝟖𝟑−𝟏𝟎(𝟓,𝟕)𝟐
 
 
b= 
𝟑𝟑𝟗𝟐−𝟑𝟐𝟐𝟎,𝟓
𝟑𝟖𝟑−𝟑𝟐𝟒,𝟗
 → b= 
𝟏𝟕𝟏,𝟓
𝟓𝟖,𝟏
 →b=2,9518// 
a= 56,5 - 2,9518(5,7) 
a= 56,5- 16,825 
a= 39,675 
 
Equação da Regressão: y= 39,675+ 2,9518x// 
 
 
 
 
 
y = 2,9518x + 39,675
R² = 0,7688
0
10
20
30
40
50
60
70
80
0 2 4 6 8 10 12
Série1
Linear (Série1)
~ 
~ ~ 
21 
 
d) Coeficiente de Correlação: 
n ano de serviço (x) Nº de clientes (y) x2 y2 (x.y) 
1 2 48 4 2304 96 
2 3 50 9 2500 150 
3 4 56 16 3136 224 
4 5 52 25 2704 260 
5 4 43 16 1849 172 
6 6 60 36 3600 360 
7 7 62 49 3844 434 
8 8 58 64 3364 464 
9 8 64 64 4096 512 
10 10 72 100 5184 720 
∑ 57 565 383 32581 3392 
 
r=
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 →r= 
𝟏𝟎.(𝟑𝟑𝟗𝟐)–(𝟓𝟕).(𝟓𝟔𝟓)
√[𝟏𝟎.(𝟑𝟖𝟑)−(𝟓𝟕)𝟐].[𝟏𝟎.(𝟑𝟐𝟓𝟖𝟏)−(𝟓𝟔𝟓)𝟐]
 
 
r= 
𝟑𝟑𝟗𝟐𝟎−𝟑𝟐𝟐𝟎𝟓
√[𝟑𝟖𝟑𝟎−𝟑𝟐𝟒𝟗].[𝟑𝟐𝟓𝟖𝟏𝟎−𝟑𝟏𝟗𝟐𝟐𝟓]
 → r= 
𝟏𝟕𝟏𝟓
√[𝟓𝟖𝟏].[𝟔𝟓𝟖𝟓]
 
 
r= 
𝟏𝟕𝟏𝟓
√𝟑𝟖𝟐𝟓𝟖𝟖𝟓
 → r= 
𝟏𝟕𝟏𝟓
𝟏𝟗𝟓𝟓,𝟗𝟖
 → r= 0,8768// 
 
O coeficiente de Pearson é 0,8768, existindo portanto uma correlação forte 
positiva.// 
 
 
 
 
 
 
 
22 
 
10. Numa pesquisa feita com 10 famílias com renda bruta mensal entre 10 e 60 salários 
mínimos, mediram-se: X: renda bruta mensal (expressa em números de salários 
mínimos) e Y: a porcentagem de renda bruta anual gasta com assistência médica. 
x 12 16 18 20 28 30 40 48 50 54 
y 7,2 7,4 7 6,5 6,6 6,7 6 5,6 6 5,5 
 
a) Escolha adequadamente X e Y. 
b) Construa o diagrama de dispersão 
c) Calcule o coeficiente de correlação. 
 
Resolução: 
 
n x y x2 y2 (x.y) 
1 12 7,2 144 51,84 86,4 
2 16 7,4 256 54,76 118,4 
3 18 7 324 49 126 
4 20 6,5 400 42,25 130 
5 28 6,6 784 43,56 184,8 
6 30 6,7 900 44,89 201 
7 40 6 1600 36 240 
8 48 5,6 2304 31,36 268,8 
9 50 6 2500 36 300 
10 54 5,5 2916 30,25 297 
∑ 316 64,5 12128 419,91 1952,4 
 
a) x (renda bruta mensal) é a variável independente e y (% de renda bruta anual 
gasta com assistência médica) é a variável dependente.// 
 
 
*Equação da Regressão: 
Temos que : média x= 31,6 e média y=6,45 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟏𝟗𝟓𝟐,𝟒−𝟏𝟎(𝟑𝟏,𝟔)(𝟔,𝟒𝟓)
𝟏𝟐𝟏𝟐𝟖−𝟏𝟎(𝟑𝟏,𝟔)𝟐
 
 
~ 
~ ~ 
23 
 
b= 
𝟏𝟗𝟓𝟐,𝟒−𝟐𝟎𝟑𝟖,𝟐
𝟏𝟐𝟏𝟐𝟖−𝟗𝟗𝟖𝟓,𝟔
 → b= 
−𝟖𝟓,𝟖
𝟐𝟏𝟒𝟐,𝟒
 → b= -0,04// 
 
a= 6,45-(-0,04)(31,6) → a= 6,45+1,2655 → a= 7,7155 
 
Equação da Regressão y= 7,7155 – 0,04x// 
 
b) Diagrama de Dispersão: 
 
 
c) Coeficiente de Correlação: 
r=
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 →r= 
𝟏𝟎.(𝟏𝟗𝟓𝟐,𝟒)–(𝟑𝟏𝟔).(𝟔𝟒,𝟓)
√[𝟏𝟎.(𝟏𝟐𝟏𝟐𝟖)−(𝟑𝟏𝟔)𝟐].[𝟏𝟎.(𝟒𝟏𝟗,𝟗𝟏)−(𝟔𝟒,𝟓)𝟐]
 
 
r= 
𝟏𝟗𝟓𝟐𝟒−𝟐𝟎𝟑𝟖𝟐
√[𝟏𝟐𝟏𝟐𝟖𝟎−𝟗𝟗𝟖𝟓𝟔].[𝟒𝟏𝟗𝟗,𝟏−𝟒𝟏𝟔𝟎,𝟐𝟓]
 → r= 
−𝟖𝟓𝟖
√[𝟐𝟏𝟒𝟐𝟒].[𝟑𝟖,𝟖𝟓]
 
 
r= 
−𝟖𝟓𝟖
√𝟖𝟑𝟐𝟑𝟐𝟐,𝟒
 → r= 
−𝟖𝟓𝟖
𝟗𝟏𝟐,𝟑𝟏𝟕𝟎𝟓𝟎𝟐
 → r= -0,9404// 
 
O coeficiente de Pearson é 0,9404; existindo portanto uma correlação forte 
negativa.// 
0
1
2
3
4
5
6
7
8
0 10 20 30 40 50 60
24 
 
11. Os quatro conjuntos de dados a seguir foram preparados pelo estatístico F.J 
Anscombe e são usados com freqüência em aulas sobre correlação. 
Conjunto 1 Conjunto 2 Conjunto 3 Conjunto 4 
x y x y x y x y 
10 8,04 10 9,14 10 7,46 8 6,58 
8 6,95 8 8,14 8 6,77 8 5,76 
13 7,58 13 8,74 13 12,74 8 7,71 
9 8,81 9 8,77 9 7,11 8 8,84 
11 8,33 11 9,26 11 7,81 8 8,47 
14 9,96 14 8,1 14 8,84 8 7,04 
6 7,24 6 6,13 6 6,08 8 5,25 
4 4,26 4 3,1 4 5,39 19 12,5 
12 10,84 12 9,13 12 8,15 8 5,56 
7 4,82 7 7,26 7 6,42 8 7,91 
5 5,68 5 4,74 5 5,73 8 6,89 
 
a) Calcule a média e o desvio padrão para cada conjunto de dados. 
b) Calcule o coeficiente de correlação para cada conjunto de dados. 
c) Construa o diagrama de Dispersão para cada conjunto de dados. 
d) Analise os resultados. 
 
 
 
 
 
 
 
 
 
 
 
 
 
25 
 
Resolução: 
a) 
** Para o conjunto 1 ** 
Temos que a média de x = 9// e média de y= 7,5// 
 
 
n 
Conjunto 1 
(x-média x) 2 (y-média y)2 x2 y2 (x.y) 
x y 
1 10 8,04 1 0,2916 100 64,6416 80,4 
2 8 6,95 1 0,3025 64 48,3025 55,6 
3 13 7,58 16 0,0064 169 57,4564 98,54 
4 9 8,81 0 1,7161 81 77,6161 79,29 
5 11 8,33 4 0,6889 121 69,3889 91,63 
6 14 9,96 25 6,0516 196 99,2016 139,44 
7 6 7,24 9 0,0676 36 52,4176 43,44 
8 4 4,26 25 10,4976 16 18,1476 17,04 
9 12 10,84 9 11,1556 144 117,5056 130,08 
10 7 4,82 4 7,1824 49 23,2324 33,74 
11 5 5,68 16 3,3124 25 32,2624 28,4 
∑ 99 82,51 110 41,2727 1001 660,1727 797,6 
 
Desvio Padrão x: √
𝟏𝟏𝟎
𝟏𝟎
 →Desvio padrão x= 3,3166// 
Desvio Padrão y: √
𝟒𝟏,𝟐𝟕𝟐𝟕
𝟏𝟎
 →Desvio padrão y= 2,0315// 
 
 
 
 
 
 
 
 
26 
 
** Para o conjunto 2 ** 
Temos que a média de x = 9// e média de y= 7,5// 
n 
Conjunto 2 
(x-média x)2 (y-média y)2 x2 y2 (x.y) 
x y 
1 10 9,14 1 2,6896 100 83,5396 91,4 
2 8 8,14 1 0,4096 64 66,2596 65,12 
3 13 8,74 16 1,5376 169 76,3876 113,62 
4 9 8,77 0 1,6129 81 76,9129 78,93 
5 11 9,26 4 3,0976 121 85,7476 101,86 
6 14 8,1 25 0,36 196 65,61 113,4 
7 6 6,13 9 1,8769 36 37,5769 36,78 
8 4 3,1 25 19,36 16 9,61 12,4 
9 12 9,13 9 2,6569 144 83,3569 109,56 
10 7 7,26 4 0,0576 49 52,7076 50,82 
11 5 4,74 16 7,6176 25 22,4676 23,7 
∑ 99 82,51 110 41,2763 1001 660,1763 797,59 
 
Desvio Padrão x: √
𝟏𝟏𝟎
𝟏𝟎
 →Desvio padrão x= 3,3166// 
Desvio Padrão y: √
𝟒𝟏,𝟐𝟕𝟔𝟑
𝟏𝟎
 →Desvio padrão y= 2,0316// 
** Para o conjunto 3 ** 
Temos que a média de x = 9// e média de y= 7,5// 
n 
Conjunto 3 
(x-média x)2 (y-média y)2 x2 y2 (x.y) 
x y 
1 10 7,46 1 0,0016 100 55,6516 74,6 
2 8 6,77 1 0,5329 64 45,8329 54,16 
3 13 12,74 16 27,4576 169 162,3076 165,62 
4 9 7,11 0 0,1521 81 50,5521 63,99 
5 11 7,81 4 0,0961 121 60,9961 85,91 
6 14 8,84 25 1,7956 196 78,1456 123,76 
7 6 6,08 9 2,0164 36 36,9664 36,48 
8 4 5,39 25 4,4521 16 29,0521 21,56 
9 12 8,15 9 0,4225 144 66,4225 97,8 
10 7 6,42 4 1,1664 49 41,2164 44,94 
11 5 5,73 16 3,1329 25 32,8329 28,65 
∑ 99 82,5 110 41,2262 1001 659,9762 797,47 
 
27 
 
Desvio Padrão x: √
𝟏𝟏𝟎
𝟏𝟎
 →Desvio padrão x= 3,3166// 
Desvio Padrão y: √
𝟒𝟏,𝟐𝟐𝟔𝟐
𝟏𝟎
 →Desvio padrão y= 2,0304// 
** Para o conjunto 4 ** 
Temos que a média de x = 9// e média de y= 7,5// 
n 
Conjunto 4 
(x-média x)2 (y-média y)2 x2 y2 (x.y) 
x y 
1 8 6,58 1 0,8464 64 43,2964 52,64 
2 8 5,76 1 3,0276 64 33,1776 46,08 
3 8 7,71 1 0,0441 64 59,4441 61,68 
4 8 8,84 1 1,7956 64 78,1456 70,72 
5 8 8,47 1 0,9409 64 71,7409 67,76 
6 8 7,04 1 0,2116 64 49,5616 56,32 
7 8 5,25 1 5,0625 64 27,5625 42 
8 19 12,5 100 25 361 156,25 237,5 
9 8 5,56 1 3,7636 64 30,9136 44,48 
10 8 7,91 1 0,1681 64 62,5681 63,28 
11 8 6,89 1 0,3721 64 47,4721 55,12 
∑ 99 82,51 110 41,2325 1001 660,1325 797,58 
 
Desvio Padrão x: √
𝟏𝟏𝟎
𝟏𝟎
 →Desvio padrão x= 3,3166// 
Desvio Padrão y: √
𝟒𝟏,𝟐𝟑𝟐𝟓
𝟏𝟎
 →Desvio padrão y= 2,0305// 
 
b) Coeficiente de Correlação:** Para o conjunto 1 ** 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟏.(𝟕𝟗𝟕,𝟔)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
√[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟐𝟕)−(𝟖𝟐,𝟓𝟏)𝟐]
 
 
r= 
𝟖𝟕𝟕𝟑,𝟔−𝟖𝟏𝟔𝟖,𝟒𝟗
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟖𝟗𝟗𝟕−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏]
 → r= 
𝟔𝟎𝟓,𝟏𝟏
√[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟗𝟗𝟗𝟔]
 
 
28 
 
r= 
𝟔𝟎𝟓,𝟏𝟏
√𝟓𝟒𝟗𝟑𝟑𝟗,𝟓𝟏𝟔
 → r= 
𝟔𝟎𝟓,𝟏𝟏
𝟕𝟒𝟏,𝟏𝟕𝟒𝟒𝟏𝟔𝟕
 → r= 0,8164// 
 
O coeficiente de Pearson é 0,8164 existindo portanto, uma correlação positiva 
forte.// 
 
** Para o conjunto 2 ** 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟗)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
√[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟔𝟑)−(𝟖𝟐,𝟓𝟏)𝟐]
 
 
r= 
𝟖𝟕𝟕𝟑,𝟒𝟗−𝟖𝟏𝟔𝟖,𝟒𝟗
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟗𝟑𝟗𝟑−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏]
 → r= 
𝟔𝟎𝟓
√[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟒,𝟎𝟑𝟗𝟐]
 
 
r= 
𝟔𝟎𝟓
√𝟓𝟒𝟗𝟑𝟖𝟕,𝟒𝟑𝟐
 → r= 
𝟔𝟎𝟓
𝟕𝟒𝟏,𝟐𝟎𝟔𝟕𝟒𝟎𝟒
 → r= 0,8162// 
 
O coeficiente de Pearson é 0,8162 existindo portanto, uma correlação positiva 
forte.// 
 
** Para o conjunto 3 ** 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟏.(𝟕𝟗𝟕,𝟒𝟕)–(𝟗𝟗).(𝟖𝟐,𝟓)
√[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟓𝟗,𝟗𝟕𝟔𝟐)−(𝟖𝟐,𝟓)𝟐]
 
 
r= 
𝟖𝟕𝟕𝟐,𝟏𝟕−𝟖𝟏𝟔𝟕,𝟓
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟓𝟗,𝟕𝟑𝟖𝟐−𝟔𝟖𝟎𝟔,𝟐𝟓]
 → r= 
𝟔𝟎𝟒,𝟔𝟕
√[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟒𝟖𝟖𝟐]
 
 
r= 
𝟔𝟎𝟒,𝟔𝟕
√𝟓𝟒𝟖𝟕𝟐𝟎,𝟕𝟐𝟐
 → r= 
𝟔𝟎𝟒,𝟔𝟕
𝟕𝟒𝟎,𝟕𝟓𝟔𝟖𝟓𝟖
 → r= 0,8162// 
 
O coeficiente de Pearson é 0,8162 existindo portanto, uma correlação positiva 
forte.// 
29 
 
** Para o conjunto 4 ** 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟖)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
√[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟑𝟐𝟓)−(𝟖𝟐,𝟓𝟏)𝟐]
 
 
r= 
𝟖𝟕𝟕𝟑,𝟑𝟖−𝟖𝟏𝟔𝟖,𝟒𝟗
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟒𝟓𝟕𝟓−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏]
 → r= 
𝟔𝟎𝟒,𝟖𝟗
√[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟓𝟓𝟕𝟒]
 
 
r= 
𝟔𝟎𝟒,𝟖𝟗
√𝟓𝟒𝟖𝟖𝟎𝟒,𝟒𝟓𝟒
 → r= 
𝟔𝟎𝟒,𝟖𝟗
𝟕𝟒𝟎,𝟖𝟏𝟑𝟑𝟕𝟑
 → r= 0,8165// 
 
O coeficiente de Pearson é 0,8165 existindo portanto, uma correlação positiva 
forte.// 
 
 
c) Diagrama de Dispersão: 
** Para o conjunto 1 ** 
 
 
 
 
 
0
2
4
6
8
10
12
0 5 10 15
Série1
30 
 
** Para o conjunto 2 ** 
 
 
 
 
 
 
 
** Para o conjunto 3 ** 
 
 
0
1
2
3
4
5
6
7
8
9
10
0 5 10 15
Série1
0
2
4
6
8
10
12
14
0 5 10 15
Série1
31 
 
** Para o conjunto 4 ** 
 
 
 
 
d) Análise: 
Os resultados foram praticamente os mesmos, com pequenas diferenças de 
arredondamento, possuem a mesma média para todos e coeficiente de variação 
quase iguais, todos com correlação forte positiva entre os dados.// 
 
 
 
 
 
 
 
 
 
 
 
0
2
4
6
8
10
12
14
0 5 10 15 20
Série1
32 
 
12. Uma empresa que produz bens de alta tecnologia está preocupada com a 
produtividade de funcionários que exercem funções repetitivas e procura descobrir 
como algumas variáveis podem influenciar no rendimento dessas pessoas. Para isso 
implementa em cada uma de suas três fábricas um programa específico: alimentação 
especial sugerida pelos nutricionistas; intervalos para exercícios de relaxamento 
sugerido pelos fisioterapeutas; rodízio de funções sugerido pelos psicólogos. O quadro a 
seguir mostra o resultado da produtividade para diversos níveis implementados no 
programa. 
Produtividade (menor = 100%) 100 102 105 108 112 120 
Alimentação (frequência semanal) 4 5 1 3 6 2 
Exercícios (frequência semanal) 1 3 2 4 5 6 
Rodízio (frequência semanal) 3 1 2 6 4 5 
 
a) Construa o diagrama de dispersão da produtividade contra cada uma das variáveis 
explicativas. Qual variável parece manter melhor correlação com a produtividade? 
b) Calcule o coeficiente de correlação linear de Pearson nos 3 casos. O coeficiente 
confirma a impressão visual dos diagramas? 
 
Resolução: 
a) Diagrama de Dispersão: 
** Para Produtividade x Alimentação (freqüência semanal) ** 
 
 
 
 
0
1
2
3
4
5
6
7
95 100 105 110 115 120 125
Série1
33 
 
** Para Produtividade x Exercícios (freqüência semanal) ** 
 
 
 
** Para Produtividade x Rodízio (freqüência semanal) ** 
 
 
 
Analisando os gráficos a variável que representa ter maior correlação com a 
produtividade é a variável “Exercícios”. 
 
 
 
 
0
1
2
3
4
5
6
7
95 100 105 110 115 120 125
Série1
0
1
2
3
4
5
6
7
95 100 105 110 115 120 125
Série1
34 
 
b) Coeficiente de Correlação; 
** Para Produtividade x Alimentação (freqüência semanal) ** 
n Produtividade (menor = 100%) Alimentação (frequência semanal) x2 y2 (x.y) 
1 100 4 10000 16 400 
2 102 5 10404 25 510 
3 105 1 11025 1 105 
4 108 3 11664 9 324 
5 112 6 12544 36 672 
6 120 2 14400 4 240 
∑ 647 21 70037 91 2251 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟔.(𝟐𝟐𝟓𝟏)–(𝟔𝟒𝟕).(𝟐𝟏)
√[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐]
 
 
r= 
𝟏𝟑𝟓𝟎𝟔−𝟏𝟑𝟓𝟖𝟕
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏]
 → r= 
−𝟖𝟏
√[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]
 
 
r= 
−𝟖𝟏
√𝟏𝟔𝟗𝟑𝟔𝟓
 → r= 
−𝟖𝟏
𝟒𝟏𝟏,𝟓𝟑𝟗𝟕
 → r= -0,1968// 
 
O coeficiente de Pearson é -0,1968 existindo portanto, uma correlação negativa 
fraca.// 
 
 
 
 
 
 
 
 
 
 
35 
 
** Para Produtividade x Exercícios (freqüência semanal) ** 
n Produtividade (menor = 100%) Exercícios (frequência semanal) x2 y2 (x.y) 
1 100 1 10000 1 100 
2 102 3 10404 9 306 
3 105 2 11025 4 210 
4 108 4 11664 16 432 
5 112 5 12544 25 560 
6 120 6 14400 36 720 
∑ 647 21 70037 91 2328 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟔.(𝟐𝟑𝟐𝟖)–(𝟔𝟒𝟕).(𝟐𝟏)
√[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐]
 
 
r= 
𝟏𝟑𝟗𝟔𝟖−𝟏𝟑𝟓𝟖𝟕
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏]
 → r= 
𝟑𝟖𝟏
√[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]
 
 
r= 
𝟑𝟖𝟏
√𝟏𝟔𝟗𝟑𝟔𝟓
 → r= 
𝟑𝟖𝟏
𝟒𝟏𝟏,𝟓𝟑𝟗𝟕
 → r= 0,9257// 
 
O coeficiente de Pearson é 0,9257 existindo portanto, uma correlação positiva 
forte.// 
 
 
 
 
 
 
 
 
 
 
 
36 
 
** Para Produtividade x Rodízio (freqüência semanal) ** 
n Produtividade (menor = 100%) Rodízio (frequência semanal) x2 y2 (x.y) 
1 100 3 10000 9 300 
2 102 1 10404 1 102 
3 105 2 11025 4 210 
4 108 6 11664 36 648 
5 112 4 12544 16 448 
6 120 5 14400 25 600 
∑ 647 21 70037 91 2308 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟔.(𝟐𝟑𝟎𝟖)–(𝟔𝟒𝟕).(𝟐𝟏)
√[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐]
 
 
r= 
𝟏𝟑𝟖𝟒𝟖−𝟏𝟑𝟓𝟖𝟕
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏]
 → r= 
𝟐𝟔𝟏
√[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]
 
 
r= 
𝟐𝟔𝟏
√𝟏𝟔𝟗𝟑𝟔𝟓
 → r= 
𝟐𝟔𝟏
𝟒𝟏𝟏,𝟓𝟑𝟗𝟕
 → r= 0,6341// 
 
O coeficiente de Pearson é 0,6341 existindo portanto, uma correlação positiva 
média.// 
O coeficiente calculado confirma a impressão observada no gráfico, de que o fator 
que apresenta maior correlação com a produtividade é o fator exercícios. Em 
seguida o fator “rodízio” apresenta média correlação, e o que apresenta menor 
correlação é o fator alimentação. 
 
 
 
 
 
 
 
37 
 
13. Use as informações de poupança agregada e renda (bilhõesde reais) em um país X 
no período de 1990 a 1999 (dados fictícios), para estimar a influência do nível de renda 
sobre a poupança. 
a) Construa o diagrama de dispersão e trace a reta de regressão da poupança em função 
da renda. Interprete os coeficientes. 
b) Diga qual é o acréscimo na poupança agregada para cada bilhão a mais na renda. 
c) Estime a poupança para uma renda de R$469 400 000 000,00. Quanto seria o 
consumo agregado das famílias? (consumo+poupança=renda). 
d) Calcule e interprete o coeficiente de correlação 
e) Calcule e interprete o coeficiente de determinação 
f) Construa o diagrama de dispersão considerando o consumo como variável resposta e 
a renda como variável explicativa(preditora). Estime a reta de regressão e compare com 
o resultado do item a. 
 
Resolução: 
OBSERVAÇÃO: 
Dados baseados no PIB, renda e poupança do Brasil nos anos de 1990 a 1999 
(dados modificados devido a conversão para reais supondo-se um dólar de R$ 
2,30). 
 
Quadro - Renda X Poupança: Brasil 1990-1999 
Ano Renda em bi(R$) (x) Poupança em bi (R$)(y) 
1990 397,7 85,5 
1991 454,7 89,6 
1992 516,8 92,7 
1993 571 100,6 
1994 575,8 98,8 
1995 593,9 94,5 
1996 678,5 121,3 
1997 727,4 125,9 
1998 892,1 170,6 
1999 988,6 207,9 
 
 
 
38 
 
a) Diagrama de Dispersão: 
 
 
 
Através do diagrama observa-se uma correlação forte positiva, para variações 
unitárias de x haveria decréscimo em y, conforme observado na equação dada. 
 
b) Equação da Regressão: 
Temos que média x=639,65 e média y= 118,74 
 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)(𝟏𝟏𝟖,𝟕𝟒)
𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)𝟐
 
 
b= 
𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−(𝟕𝟓𝟗𝟓𝟐𝟎,𝟒𝟏)
𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟒𝟎𝟗𝟏𝟓𝟐𝟏,𝟐𝟐𝟓
 → b= 
𝟔𝟓𝟏𝟗𝟎,𝟒𝟗
𝟑𝟏𝟑𝟒𝟐𝟕,𝟕𝟖
 → b= 0,208/ 
 
a= 118,74-(0,208)(639,65) → a= 118,74-133,0472 → a= -14,302 
Equação da Regressão: 
y= -14,302+0,208x 
 
y = 0,208x - 14,302
R² = 0,926
0
50
100
150
200
250
0 500 1000 1500
Série1
Linear (Série1)
~ 
~ ~ 
39 
 
Acréscimo na poupança agregada para cada bilhão a mais na renda 
Resposta 1 : y= -14,302+0,208x// 
Resposta 2: 
 
Observação: conforme a equação da regressão obtida com base nos dados criados 
o aumento unitário (de 1 bilhão na renda não seria suficiente para gerar acréscimo 
na poupança, devida a disparidade entre o nível de consumo e poupança, a 
população do país em questão tende a consumir mais e poupar menos). Portanto 
para a variação de um bilhão na renda teremos: 
y= -14,302+0,208 
y=-14,094 
 
Teremos um decréscimo de -14,094 (partindo do pressuposto renda inicial zero) 
Para o acréscimo na poupança o nível de renda deverá ser no mínimo de 68,76 
bilhões. Partindo deste ponto onde o nível de poupança será zero, o acréscimo de 
um bilhão na renda acarretará em um acréscimo na poupança de: 
y=-14,302+0,208(68,76) 
y=0 
y=-14,302+0,208(68,76+1) 
y=-14,302+14,51 
y=0,20808 
 
Portanto o acréscimo inicial na poupança será de 0,20808// 
 
c) Poupança para uma renda de 469,4 bilhões 
 y=-14,302+0,208(469,4) 
y=-14,302+97,6352 
y=83,3332 
 
 
40 
 
Consumo Agregado das Famílias 
C+S=Y → C +83,3332= 469,4 → C= 469,4 – 83,3332 
C= 386,0668 
O consumo agregado das famílias seria de aproximadamente 386,07 bilhões de 
reais.// 
 
d) 
Ano Renda em bi(R$) (x) Poupança em bi (R$)(y) x2 y2 (x.y) 
1990 397,7 85,5 158165,3 7310,25 34003,35 
1991 454,7 89,6 206752,1 8028,16 40741,12 
1992 516,8 92,7 267082,2 8593,29 47907,36 
1993 571 100,6 326041 10120,36 57442,6 
1994 575,8 98,8 331545,6 9761,44 56889,04 
1995 593,9 94,5 352717,2 8930,25 56123,55 
1996 678,5 121,3 460362,3 14713,69 82302,05 
1997 727,4 125,9 529110,8 15850,81 91579,66 
1998 892,1 170,6 795842,4 29104,36 152192,3 
1999 988,6 207,9 977330 43222,41 205529,9 
∑ 6396,5 1187,4 4404949 155635 824710,9 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟖𝟐𝟒𝟕𝟏𝟎,𝟗𝟑)–(𝟔𝟑𝟗𝟔,𝟓).(𝟏𝟏𝟖𝟕,𝟒)
√[𝟏𝟎.(𝟒𝟒𝟎𝟒𝟗𝟒𝟖,𝟖𝟓)−(𝟔𝟑𝟗𝟔,𝟓)𝟐].[𝟏𝟎.(𝟏𝟓𝟓𝟔𝟑𝟓,𝟎𝟐)−(𝟏𝟏𝟖𝟕,𝟒)𝟐]
 
 
r= 
𝟖𝟐𝟒𝟕𝟏𝟎𝟗,𝟑𝟎−𝟕𝟓𝟗𝟓𝟐𝟎𝟒,𝟏𝟎
√[𝟒𝟒𝟎𝟒𝟗𝟒𝟖𝟖,𝟓−𝟒𝟎𝟗𝟏𝟓𝟐𝟏𝟐,𝟐𝟓].[𝟏𝟓𝟓𝟔𝟑𝟓𝟎,𝟐𝟎−𝟏𝟒𝟎𝟗𝟗𝟏𝟖,𝟕𝟔]
 → r= 
𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎
√[𝟑𝟏𝟑𝟒𝟐𝟕𝟔,𝟐𝟓].[𝟏𝟒𝟔𝟒𝟑𝟏,𝟒𝟒]
 
 
r= 
𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎
√𝟒𝟓𝟖𝟗𝟓𝟔𝟓𝟖𝟒𝟔𝟒𝟓
 → r= 
𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎
𝟔𝟕𝟕𝟒𝟔𝟑,𝟑𝟒𝟓𝟔𝟎𝟗
 → r= 0,9622 
 
O coeficiente de Pearson é 0,9622 existindo portanto, uma correlação positiva 
forte.// 
e) Coeficiente de determinação: 
r2= 0,926// 
41 
 
f) Diagrama de Dispersão: 
**Renda X Consumo 
Ano Renda em bi(R$) (x) Consumo bi(R$) (x) 
1990 397,7 312,2 
1991 454,7 365,1 
1992 516,8 424,1 
1993 571 470,4 
1994 575,8 477 
1995 593,9 499,4 
1996 678,5 557,2 
1997 727,4 601,5 
1998 892,1 721,5 
1999 988,6 780,7 
∑ 6396,5 5209,1 
 
 
 
A correlação entre renda e consumo é muito mais forte do que a correlação entre 
renda e popança, sendo quase perfeita. Enquanto o fato do aumento da renda não 
acarretar aumento significativo na poupança(podendo causar inclusive decréscimo 
dependendo do nível de renda), o aumento no nível de renda representa um grande 
aumento no consumo. (como já dito o país em questão tem maior tendência a 
consumir e menor tendência a poupar). 
 
 
 
y = 0,792x + 14,302
R² = 0,9945
0
100
200
300
400
500
600
700
800
900
0 200 400 600 800 1000 1200
Série1
Linear (Série1)
42 
 
14. Suponha os seguintes dados: 
 
Despesas com propagandas 
(milhões R$) 
Vendas de Certo 
Produto (mil unidades) 
2,5 120 
6,5 190 
11 240 
4 140 
8,5 180 
14 280 
6 150 
5 115 
10 215 
13,5 220 
16 320 
 
a) Construa o diagrama de dispersão. 
b) Ajuste uma reta aos dados e estime a vendas do produto, para um gasto com 
propaganda de 12 milhões de reais. 
c) Qual o acréscimo nas vendas para cada milhão a mais gasto com propaganda? 
d) Trace a reta no diagrama de dispersão. 
e) Determine o coeficiente de correlação e interprete-o. 
f) Calcule e interprete o coeficiente de determinação. 
 
 
 
 
 
 
 
 
 
 
43 
 
Resolução: 
a) Diagrama de Dispersão 
 
 
b) Equação da Regressão: 
Temos que média x=8,81 e média y= 197,27 
 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟐𝟏𝟗𝟎𝟎−𝟏𝟏(𝟖,𝟖𝟏)(𝟏𝟗𝟕,𝟐𝟕)
𝟏𝟎𝟓𝟑−𝟏𝟏(𝟖,𝟖𝟏)𝟐
 
 
b= 
𝟐𝟏𝟗𝟎𝟎−𝟏𝟗𝟏𝟏𝟕
𝟏𝟎𝟓𝟑−𝟖𝟓𝟑,𝟕𝟕𝟕𝟏
 → b= 
𝟐𝟕𝟖𝟑
𝟏𝟗𝟗
 → b= 13,985// 
 
a= 197,27-(13,985)(8,81) → a= 74,06 
Equação da Regressão: 
y= 74,06+13,985x// 
 
**Para um gasto com propaganda de 12 milhões temos: 
y= 74,06+13,985(12) 
y=74,06+167,82 
0
50
100
150
200
250
300
350
0 5 10 15 20
Série1
~ 
~ ~ 
44 
 
y=241,88 
A venda de produtos será de aproximadamente 241,88 (mil) produtos. 
 
 
c) y= 74,06+13,985x// 
 
y=74,06+13,985 
y=88,045 
 
O acréscimo nas vendas para cada milhão a mais gasto com propaganda é 88,045. 
 
d) Reta de Regressão 
 
 
 
 
 
 
 
y = 13,988x + 73,924
R² = 0,8958
0
50
100
150
200
250
300
350
0 5 10 15 20
Série1
Linear (Série1)
45 
 
 
e) Coeficiente de Correlação: 
n 
Despesas com propagandas 
(milhões R$) 
Vendas de Certo 
Produto (mil unidades) x2 y2 (x.y) 
1 2,5 120 6,25 14400 300 
2 6,5 190 42,25 36100 1235 
3 11 240 121 57600 2640 
4 4 140 16 19600 560 
5 8,5 180 72,2532400 1530 
6 14 280 196 78400 3920 
7 6 150 36 22500 900 
8 5 115 25 13225 575 
9 10 215 100 46225 2150 
10 13,5 220 182,25 48400 2970 
11 16 320 256 102400 5120 
∑ 97 2170 1053 471250 21900 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟏.(𝟐𝟏𝟗𝟎𝟎)–(𝟗𝟕).(𝟐𝟏𝟕𝟎)
√[𝟏𝟏.(𝟏𝟎𝟓𝟑)−(𝟗𝟕)𝟐].[𝟏𝟏.(𝟒𝟕𝟏𝟐𝟓𝟎)−(𝟐𝟏𝟕𝟎)𝟐]
 
 
r= 
𝟐𝟒𝟎𝟗𝟎𝟎−𝟐𝟏𝟎𝟒𝟗𝟎
√[𝟏𝟏𝟓𝟖𝟑−𝟗𝟒𝟎𝟗].[𝟓𝟏𝟖𝟑𝟕𝟓𝟎−𝟒𝟕𝟎𝟖𝟗𝟎𝟎]
 → r= 
𝟑𝟎𝟒𝟏𝟎
√[𝟐𝟏𝟕𝟒].[𝟒𝟕𝟎𝟖𝟓𝟎]
 
 
r= 
𝟑𝟎𝟒𝟏𝟎
√𝟏𝟎𝟑𝟐𝟑𝟐𝟑𝟗𝟎𝟎
 → r= 
𝟑𝟎𝟒𝟏𝟎
𝟑𝟐𝟏𝟐𝟗,𝟕𝟗𝟕𝟔𝟕𝟔𝟗𝟔𝟐
 → r= 0,9454// 
 
O coeficiente de Pearson é 0,9454 existindo portanto, uma correlação positiva 
forte.// 
 
f) Coeficiente de Determinação: 
r2= 0,8958 
 
 
 
46 
 
15. O quadro abaixo fornece os resultados de uma pesquisa com 10 famílias de 
determinada região: 
Famílias 
Renda 
(R$100,00) 
Poupança 
(R$10,00) 
nº de 
filhos 
média de anos de 
estudo da família 
A 10 4 8 3 
B 15 7 6 4 
C 12 5 5 5 
D 70 20 1 12 
E 80 20 2 16 
F 100 30 2 18 
G 20 8 3 8 
H 30 8 2 8 
I 10 3 6 4 
J 60 15 1 8 
 
a) Calcule o coeficiente de correlação entre as variáveis renda e poupança, renda e 
número de filhos, poupança e número de filhos, média dos anos de estudo e número de 
filhos e entre as variáveis renda familiar e média de anos de estudo. Retire conclusões. 
b) Ajuste um modelo linear utilizando as variáveis Renda (x) e Poupança (y). Estime o 
valor poupado quando a renda for de 2000 reais. 
 
 
 
 
 
 
 
 
 
 
 
 
 
47 
 
Resolução: 
a) Coeficiente de Correlação: 
** Para renda X poupança ** 
n Renda (R$100,00) 
Poupança 
(R$10,00) x2 y2 (x.y) 
1 10 4 100 16 40 
2 15 7 225 49 105 
3 12 5 144 25 60 
4 70 20 4900 400 1400 
5 80 20 6400 400 1600 
6 100 30 10000 900 3000 
7 20 8 400 64 160 
8 30 8 900 64 240 
9 10 3 100 9 30 
10 60 15 3600 225 900 
∑ 407 120 26769 2152 7535 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟕𝟓𝟑𝟓)–(𝟒𝟎𝟕).(𝟏𝟐𝟎)
√[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐].[𝟏𝟎.(𝟐𝟏𝟓𝟏)−(𝟏𝟐𝟎)𝟐]
 
 
r= 
𝟕𝟓𝟑𝟓𝟎−𝟒𝟖𝟖𝟒𝟎
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟐𝟏𝟓𝟏𝟎−𝟏𝟒𝟒𝟎𝟎]
 → r= 
𝟐𝟔𝟓𝟏𝟎
√[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟕𝟏𝟏𝟎]
 
 
r= 
𝟐𝟔𝟓𝟏𝟎
√𝟕𝟐𝟓𝟓𝟏𝟏𝟓𝟏𝟎
 → r= 
𝟐𝟔𝟓𝟏𝟎
𝟐𝟔𝟗𝟑𝟓,𝟑𝟐
 → r= 0,9835// 
 
O coeficiente de Pearson é 0,9835 existindo portanto, uma correlação positiva 
forte.// 
 
 
 
 
 
 
48 
 
** Para renda X nº de filhos ** 
n Renda (R$100,00) nº de filhos x2 y2 (x.y) 
1 10 8 100 64 80 
2 15 6 225 36 90 
3 12 5 144 25 60 
4 70 1 4900 1 70 
5 80 2 6400 4 160 
6 100 2 10000 4 200 
7 20 3 400 9 60 
8 30 2 900 4 60 
9 10 6 100 36 60 
10 60 1 3600 1 60 
∑ 407 36 26769 184 900 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟗𝟎𝟎)–(𝟒𝟎𝟕).(𝟑𝟔)
√[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐]
 
 
r= 
𝟗𝟎𝟎𝟎−𝟏𝟒𝟔𝟓𝟐
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔]
 → r= 
−𝟓𝟔𝟓𝟐
√[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟓𝟒𝟒]
 
 
r= 
−𝟓𝟔𝟐𝟎
√𝟓𝟓𝟓𝟏𝟎𝟑𝟎𝟒
 → r= 
−𝟓𝟔𝟐𝟎
𝟕𝟒𝟓𝟎,𝟓𝟐
 → r= -0,7586// 
 
O coeficiente de Pearson é -0,7586 existindo portanto, uma correlação negativa 
forte.// 
 
 
 
 
 
 
 
 
49 
 
** Poupança X nº de filhos ** 
n Poupança (R$10,00) nº de filhos x2 y2 (x.y) 
1 4 8 16 64 32 
2 7 6 49 36 42 
3 5 5 25 25 25 
4 20 1 400 1 20 
5 20 2 400 4 40 
6 30 2 900 4 60 
7 8 3 64 9 24 
8 8 2 64 4 16 
9 3 6 9 36 18 
10 15 1 225 1 15 
∑ 120 36 2152 184 292 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟐𝟗𝟐)–(𝟏𝟐𝟎).(𝟑𝟔)
√[𝟏𝟎.(𝟐𝟏𝟓𝟐)−(𝟏𝟐𝟎)𝟐].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐]
 
 
r= 
𝟐𝟗𝟐𝟎−𝟒𝟑𝟐𝟎
√[𝟐𝟏𝟓𝟐𝟎−𝟏𝟒𝟒𝟎𝟎].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔]
 → r= 
−𝟏𝟒𝟎𝟎
√[𝟕𝟏𝟐𝟎].[𝟓𝟒𝟒]
 
 
r= 
−𝟏𝟒𝟎𝟎
√𝟑𝟖𝟕𝟑𝟐𝟖𝟎
 → r= 
−𝟏𝟒𝟎𝟎
𝟏𝟗𝟔𝟖,𝟎𝟔𝟓
 → r= -0,7113// 
 
O coeficiente de Pearson é -0,7113 existindo portanto, uma correlação negativa 
média.// 
 
 
 
 
 
 
 
 
50 
 
** Média anos de estudo X nº de filhos ** 
n 
média de anos de 
estudo da família nº de filhos x2 y2 (x.y) 
1 3 8 9 64 24 
2 4 6 16 36 24 
3 5 5 25 25 25 
4 12 1 144 1 12 
5 16 2 256 4 32 
6 18 2 324 4 36 
7 8 3 64 9 24 
8 8 2 64 4 16 
9 4 6 16 36 24 
10 8 1 64 1 8 
∑ 86 36 982 184 225 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟐𝟐𝟓)–(𝟖𝟔).(𝟑𝟔)
√[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐]
 
 
r= 
𝟐𝟐𝟓𝟎−𝟑𝟎𝟗𝟔
√[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔]
 → r= 
−𝟖𝟒𝟔
√[𝟐𝟒𝟐𝟒].[𝟓𝟒𝟒]
 
 
r= 
−𝟖𝟒𝟔
√𝟏𝟑𝟏𝟖𝟔𝟓𝟔
 → r= 
−𝟖𝟒𝟔
𝟏𝟏𝟒𝟖,𝟑𝟐
 → r= -0,7367// 
 
O coeficiente de Pearson é -0,7367 existindo portanto, uma correlação negativa 
média.// 
 
 
 
 
 
 
 
 
51 
 
** Renda familiar X Média anos de estudo ** 
n Renda (R$100,00) 
média de anos de 
estudo da família x2 y2 (x.y) 
1 10 3 100 9 30 
2 15 4 225 16 60 
3 12 5 144 25 60 
4 70 12 4900 144 840 
5 80 16 6400 256 1280 
6 100 18 10000 324 1800 
7 20 8 400 64 160 
8 30 8 900 64 240 
9 10 4 100 16 40 
10 60 8 3600 64 480 
∑ 407 86 26769 982 4990 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟒𝟗𝟗𝟎)–(𝟒𝟎𝟕).(𝟖𝟔)
√[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐].[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐]
 
 
r= 
𝟒𝟗𝟗𝟎𝟎−𝟑𝟓𝟎𝟎𝟐
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔]
 → r= 
𝟏𝟒𝟖𝟗𝟖
√[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟐𝟒𝟐𝟒]
 
 
r= 
𝟏𝟒𝟖𝟗𝟖
√𝟐𝟒𝟕𝟑𝟒𝟕𝟑𝟖𝟒
 → r= 
𝟏𝟒𝟖𝟗𝟖
𝟏𝟓𝟕𝟐𝟕,𝟐𝟖
 → r= 0,9472// 
 
O coeficiente de Pearson é 0,9472 existindo portanto, uma correlação positiva 
forte.// 
 
 
b) Equação da Regressão (Renda X Poupança): 
 
Temos que: 
 
Média x= 40,7 e Média y=12 
 
 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟕𝟓𝟑𝟓−𝟏𝟎(𝟒𝟎,𝟕)(𝟏𝟐)
𝟐𝟔𝟕𝟔𝟗−𝟏𝟎(𝟒𝟎,𝟕)𝟐
 
 
~ 
~ ~ 
52 
 
b= 
𝟕𝟓𝟑𝟓−(𝟒𝟖𝟖𝟒)
𝟐𝟔𝟕𝟔𝟗−𝟏𝟔𝟓𝟔𝟒,𝟗
 → b= 
𝟐𝟔𝟓𝟏
𝟏𝟎𝟐𝟎𝟒,𝟏
 → b= 0,2598// 
 
a= 12-(0,2598)(40,7) → a= 12-10,5738 → a= 1,4262 
Equação da Regressão: 
y= 1,4262+0,2598x 
 
Para renda igual a 2000 reais temos: 
y= 1,4262+0,2598(2000) 
y= 1,4262+519,6 
y= 521,0262 
 
Para uma renda de R$ 2000,00 a poupança será de aproximadamente R$ 521,02 
 
 
16. A administração de um banco desejava estabelecer um critério objetivo para avaliar 
a eficiência de seus gerentes. Para isso, levantou (para cada um dos subdistritos onde 
possuía agência) dados a respeito do depósito médio mensal por agência e o número de 
estabelecimentos comerciais existentes nesses subdistritos. Os dados são os seguintes: 
 
n Subdistritos 
nº de 
estabelecimentos 
comerciais 
depósito médio 
mensal por agência 
(10000 R$) 
1 Nossa Senhora do Ó 16 14 
2 Casa Verde 30 16 
3 Vila Formosa 35 19 
4 Santana 70 30 
5 Barra Funda 90 31 
6 Jardim Paulista 120 33 
7 Santo Amaro 160 35 
8 Lapa 237 43 
9 Pinheiros 378 50 
 
 
 
53 
 
a) Construa o diagrama de dispersão 
b) Ajuste uma reta aos dados e estime um depósito médio para um número de 
estabelecimentos comerciais iguais a 350. 
c) Qual o crescimento nos depósitos médios, para cada estabelecimento a mais no 
subdistrito?d) Trace a reta no diagrama de Dispersão 
e) Determine o coeficiente de correlação e interprete-o 
f) Calcule e interprete o coeficiente de determinação 
 
Resolução: 
a) Diagrama de Dispersão: 
 
 
b) Equação da Regressão: 
 Temos que: 
 
Média x= 126,22 e Média y=30,11 
 
 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟒𝟒𝟗𝟏𝟎−𝟗(𝟏𝟐𝟔,𝟐𝟐)(𝟑𝟎,𝟏𝟏)
𝟐𝟓𝟒𝟒𝟑𝟒−𝟗(𝟏𝟐𝟔,𝟐𝟐)𝟐
 
 
0
10
20
30
40
50
60
0 100 200 300 400
Série1
~ 
~ ~ 
54 
 
b= 
𝟒𝟒𝟗𝟏𝟎−(𝟑𝟒𝟐𝟎𝟒,𝟑𝟓𝟕𝟖)
𝟐𝟓𝟒𝟒𝟑𝟒−𝟏𝟒𝟑𝟑𝟖𝟑,𝟑𝟗𝟔
 → b= 
𝟏𝟎𝟕𝟎𝟓,𝟔𝟒𝟐𝟐
𝟏𝟏𝟏𝟎𝟓𝟎,𝟔𝟎𝟒
 → b= 0,0964// 
 
a= 30,11-(0,0964)(126,22) → a= 30,11-12,167 → a= 17,944 
Equação da Regressão: 
y= 17,944+0,0964x 
 
Para um número de estabelecimentos comerciais igual a 350 temos: 
y= 17,944+0,0964(350) 
y= 17,944+33,74 
y=51,684// 
 
Para 350 estabelecimentos comerciais temos um depósito médio (R$ 10000) de R$ 
51,68// 
 
c) 
y= 17,944+0,0964(1) 
y=18,0404 
O acréscimo médio nos depósitos mensais para cada estabelecimento a mais é de 
R$ 18,0404// 
 
 
 
 
 
 
 
 
55 
 
d) Reta de Regressão: 
 
 
e) Coeficiente de Correlação: 
 
n Subdistritos 
nº de estabelecimentos 
comerciais 
depósito médio mensal 
por agência (10000 R$) 
X2 Y2 (X.Y) 
1 Nossa Senhora do Ó 16 14 256 196 224 
2 Casa Verde 30 16 900 256 480 
3 Vila Formosa 35 19 1225 361 665 
4 Santana 70 30 4900 900 2100 
5 Barra Funda 90 31 8100 961 2790 
6 Jardim Paulista 120 33 14400 1089 3960 
7 Santo Amaro 160 35 25600 1225 5600 
8 Lapa 237 43 56169 1849 10191 
9 Pinheiros 378 50 142884 2500 18900 
∑ 1136 271 254434 9337 44910 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟗.(𝟒𝟒𝟗𝟏𝟎)–(𝟏𝟏𝟑𝟔).(𝟐𝟕𝟏)
√[𝟗.(𝟐𝟓𝟒𝟒𝟑𝟒)−(𝟏𝟏𝟑𝟔)𝟐].[𝟗.(𝟗𝟑𝟑𝟕)−(𝟐𝟕𝟏)𝟐]
 
 
r= 
𝟒𝟎𝟒𝟏𝟗𝟎−𝟑𝟎𝟕𝟖𝟓𝟔
√[𝟐𝟐𝟖𝟗𝟗𝟎𝟔−𝟏𝟐𝟗𝟎𝟒𝟗𝟔].[𝟖𝟒𝟎𝟑𝟑−𝟕𝟑𝟒𝟒𝟏]
 → r= 
𝟗𝟔𝟑𝟑𝟒
√[𝟗𝟗𝟗𝟒𝟏𝟎].[𝟏𝟎𝟓𝟗𝟐]
 
 
r= 
𝟗𝟔𝟑𝟑𝟒
√𝟏𝟎𝟓𝟖𝟓𝟕𝟓𝟎𝟕𝟐𝟎
 → r= 
𝟗𝟔𝟑𝟑𝟒
𝟏𝟎𝟐𝟖𝟖𝟕,𝟎𝟕𝟕𝟓
 → r= 0,9363// 
y = 0,0964x + 17,944
R² = 0,8767
0
10
20
30
40
50
60
0 100 200 300 400
Série1
Linear (Série1)
56 
 
O coeficiente de Pearson é 0,9363 existindo portanto, uma correlação positiva 
forte.// 
 
f) Coeficiente de Determinação: 
R2=0,8767// 
 
17. Com o objetivo de verificar se numa certa região existe correlação entre o nível de 
escolaridade médio dos pais e o nível de escolaridade dos filhos, observou-se uma 
amostra aleatória de 8 indivíduos adultos, verificando o número de anos que estes 
freqüentaram (e tiveram aprovação) em escolas regulares(Y) e o número médio de anos 
que os seus pais freqüentaram (e tiveram aprovação) em escolas regulares (X). Ao 
resultados são apresentados no quadro abaixo: 
x 0 0 2 3 4 4 5 7 
y 2 3 2 5 9 8 8 15 
 
a) Calcule o coeficiente de correlação de Pearson 
b) Em termos do Resultado do item (a) , o que se pode dizer sobre a correlação entre o 
número de anos que os 8 indivíduos freqüentaram escolas regulares (Y) e o número 
médio de anos que os seus pais freqüentaram escolas regulares (X)? 
 
Resolução: 
a) Coeficiente de Pearson: 
n x y x2 y2 (x.y) 
1 0 2 0 4 0 
2 0 3 0 9 0 
3 2 2 4 4 4 
4 3 5 9 25 15 
5 4 9 16 81 36 
6 4 8 16 64 32 
7 5 8 25 64 40 
8 7 15 49 225 105 
∑ 25 52 119 476 232 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟖.(𝟐𝟑𝟐)–(𝟐𝟓).(𝟓𝟐)
√[𝟖.(𝟏𝟏𝟗)−(𝟐𝟓)𝟐].[𝟖.(𝟒𝟕𝟔)−(𝟓𝟐)𝟐]
 
57 
 
 
r= 
𝟏𝟖𝟓𝟔−𝟏𝟑𝟎𝟎
√[𝟗𝟓𝟐−𝟔𝟐𝟓].[𝟑𝟖𝟎𝟖−𝟐𝟕𝟎𝟒]
 → r= 
𝟓𝟓𝟔
√[𝟑𝟐𝟕].[𝟏𝟏𝟎𝟒]
 
 
r= 
𝟓𝟓𝟔
√𝟑𝟔𝟏𝟎𝟎𝟖
 → r= 
𝟓𝟓𝟔
𝟔𝟎𝟎,𝟖𝟑𝟗𝟒
 → r= 0,9253// 
O coeficiente de Pearson é 0,9253 existindo portanto, uma correlação positiva 
forte.// 
 
b) Verificou-se que há uma forte correlação entre os dados, estudaram mais os 
filhos cujos pais freqüentaram (e tiveram aprovação) escolas regulares por mais 
tempo. 
 
18. A tabela a seguir relaciona os pesos (em centenas de Kg) e as taxas de consumo de 
combustível em rodovia (km/litro) numa amostra de 10 carros e passeio novos. 
peso 12 13 14 14 16 18 19 22 24 26 
consumo 16 14 14 13 11 12 9 9 8 6 
 
a) Calcule o coeficiente de correlação de Pearson. 
b) Considerando o resultado do item (a), como você avalia o relacionamento entre o 
peso e o consumo, na amostra observada? 
c) Para estabelecer uma reta de regressão, qual deve ser a variável dependente e qual 
deve ser a variável independente? Justifique a sua resposta. 
d) Estabeleça a equação de regressão, considerando a resposta do item (c). 
e) Apresente o diagrama de dispersão e a reta de regressão obtida em (d). 
f) Você considera adequado o modelo de ajuste de regressão do item (d)? De uma 
medida desta adequação interpretando-a 
g) Qual o consumo esperado para um carro de 2000 kg? 
h) Você considera o seu estudo capaz de predizer o consumo esperado para um carro de 
7000 kg? Justifique sua resposta. 
 
 
58 
 
Resolução: 
a) Coeficiente de Correlação: 
n peso consumo x2 y2 (x.y) 
1 12 16 144 256 192 
2 13 14 169 196 182 
3 14 14 196 196 196 
4 14 13 196 169 182 
5 16 11 256 121 176 
6 18 12 324 144 216 
7 19 9 361 81 171 
8 22 9 484 81 198 
9 24 8 576 64 192 
10 26 6 676 36 156 
∑ 178 112 3382 1344 1861 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟏𝟖𝟔𝟏)–(𝟏𝟕𝟖).(𝟏𝟏𝟐)
√[𝟏𝟎.(𝟑𝟑𝟖𝟐)−(𝟏𝟕𝟖)𝟐].[𝟏𝟎.(𝟏𝟑𝟒𝟒)−(𝟏𝟏𝟐)𝟐]
 
 
r= 
𝟏𝟖𝟔𝟏𝟎−𝟏𝟗𝟗𝟑𝟔
√[𝟑𝟑𝟖𝟐𝟎−𝟑𝟏𝟔𝟖𝟒].[𝟏𝟑𝟒𝟒𝟎−𝟏𝟐𝟓𝟒𝟒]
 → r= 
−𝟏𝟑𝟐𝟔
√[𝟐𝟏𝟑𝟔].[𝟖𝟗𝟔]
 
 
r= 
−𝟏𝟑𝟐𝟔
√𝟏𝟗𝟏𝟑𝟖𝟓𝟔
 → r= 
−𝟏𝟑𝟐𝟔
𝟏𝟑𝟖𝟑,𝟒𝟐𝟏𝟖
 → r= -0,9584// 
O coeficiente de Pearson é -0,9584 existindo portanto, uma correlação negativa 
forte.// 
 
b) Há uma forte correlação. Quanto maior o peso do veículo, menor será o 
consumo. 
c) A variável dependente será o consumo e a variável independente será o peso, 
analisa-se através dos dados qual a variação do consumo em função do peso do 
veículo: y(x) 
 
 
 
59 
 
d) Equação da Regressão: 
Temos que: 
 
Média x= 17,8 e Média y=11,2 
 
 
b= 
∑𝒙𝒚−𝒏.𝒙.𝒚 
∑𝒙𝟐−𝒏.𝒙𝟐
 → b= 
𝟏𝟖𝟔𝟏−𝟏𝟎(𝟏𝟕,𝟖)(𝟏𝟏,𝟐)
𝟑𝟑𝟖𝟐−𝟏𝟎(𝟑𝟏𝟔,𝟖𝟒)𝟐
 
 
b= 
𝟏𝟖𝟔𝟏−(𝟏𝟗𝟗𝟑,𝟔)
𝟑𝟑𝟖𝟐−𝟑𝟏𝟔𝟖,𝟒
 → b= 
−𝟏𝟑𝟐,𝟔
𝟐𝟏𝟑,𝟔
 → b= -0,6208// 
 
a= 11,2-(-0,6208)(17,8) → a= 11,2+11,05 → a= 22,25 
Equação da Regressão: 
y= 22,25-0,6208x// 
 
e) Diagrama de Dispersão: 
 
 
 
 
 
 
0
2
4
6
8
10
12
14
16
18
0 10 20 30
Série1
~ 
~ ~ 
60 
 
Reta da Regressão e Equação da Regressão: 
 
 
f) Sim, este modelo linear se aplica bem, sendo a correlação quase perfeita. 
 
g) Sendo os dados em centenas de Kg o consumo para 2000, será: 
2000/100= 20, portanto x=20. 
 y= 22,25-0,6208x 
y= 22,25-0,6208(20) 
y= 22,25-12,416 
y=9,834 
O consumo para um veículo de 2000kg será de aproximadamente 9,8 (km/litro) 
 
h) Não, não considero, de acordo com a equação da regressão um carro de 7000 kg 
ganharia gasolina ao invés de consumir, por km rodado. É um valor exorbitante 
que foge das previsões. 
7000/100= 70, portanto x=70 
y= 22,25-0,6208x 
y= 22,25-0,6208(70) 
y= 22,25-43,456 
y= -0,6208x + 22,25
R² = 0,9187
0
2
4
6
8
10
12
14
16
18
0 10 20 30
Série1
Linear (Série1)
61 
 
y=-21,20 
Como o consumo não pode ser negativo (-21,20 km/l), presumimos que para 
7000kg não é possível presumir-se o consumo. 
 
 
19. O administrador de uma grande sorveteria anotou por um longo período de tempo a 
temperatura média diária em ºC (x), e o volume de vendas diária de sorvete, em kg (y). 
Com os dados, estabeleceu uma equação de regressão, resultando em: 
 
y=0,5 + 1,8x, com R2= 0,80 
 
Pede-se: 
a) Qual o consumo esperado de sorvete num dia de 27ºC? 
b) Qual o incremento esperado nas vendas para cada 1ºC de aumento da temperatura? 
 
Resolução: 
a) y= 0,5+1,8(27) → y=0,5+48,60 → y=49,10// 
O consumo esperado em um dia de 27ºC é de 49,10 Kg.// 
 
b) y= 0,5+1,8(1) → y=0,5+1,8 → y=2,30 
O incremento esperado nas vendas para cada 1ºC de aumento na temperatura é de 
2,30 kg.// 
 
20. Investigaram em que medida partículas de chumbo potencialmente tóxicas emitidas 
por veículos automotores são absorvidas por ciclistas que participam de competições. A 
tabela abaixo, construída a partir de um gráfico apresentado em seu artigo, fornece 
níveis de chumbo no sangue e horas de treinamento de 10 ciclistas. 
 
Horas de treinamento 8 10 10 12 15 18 18 21 25 25 
chumbo no sangue (mml/L) 0,53 0,25 0,34 0,25 0,29 0,3 0,53 0,53 0,53 0,87 
 
62 
 
Pede-se: 
 
a) Faça um gráfico dos dados. Quais suas impressões? 
b) Verifique se há uma correlação entre níveis de chumbo no sangue e horas de 
treinamento. 
c) O ciclista 10 tem níveis muito altos. Nossa evidência de uma relação é proveniente 
quase que inteiramente desta observação? Repita (b) omitindo o ciclista 10. 
d) O que fizemos em (c) parece razoável? 
e) Está claro a partir do gráfico obtido em (a) que há variação nos dados que não é 
explicada pelas horas de treinamento. (O que nos dá esta informação?). Talvez o efeito 
de horas de treinamento não apareça tão fortemente como deveria, porque estamos 
deixando de levar em consideração outras variáveis importantes. Sugira algumas outras 
variáveis que poderiam ser importantes. 
 
Resolução: 
a) Diagrama de Dispersão: 
 
 
 
 
 
 
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 5 10 15 20 25 30
Série1
63 
 
b) Coeficiente de Correlação: 
n Horas de treinamento chumbo no sangue (mml/L) x2 y2 (x.y) 
1 8 0,53 64 0,2809 4,24 
2 10 0,25 100 0,0625 2,5 
3 10 0,34 100 0,1156 3,4 
4 12 0,25 144 0,0625 3 
5 15 0,29 225 0,0841 4,35 
6 18 0,3 324 0,09 5,4 
7 18 0,53 324 0,2809 9,54 
8 21 0,53 441 0,2809 11,13 
9 25 0,53 625 0,2809 13,25 
10 25 0,87 625 0,7569 21,75 
∑ 162 4,42 2972 2,2952 78,56 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟏𝟎.(𝟕𝟖,𝟓𝟔)–(𝟏𝟔𝟐).(𝟒,𝟒𝟐)
√[𝟏𝟎.(𝟐𝟗𝟕𝟐)−(𝟏𝟔𝟐)𝟐].[𝟏𝟎.(𝟐,𝟐𝟗𝟓𝟐)−(𝟒,𝟒𝟐)𝟐]
 
 
r= 
𝟕𝟖𝟓,𝟔−𝟕𝟏𝟔,𝟎𝟒
√[𝟐𝟗𝟕𝟐𝟎−𝟐𝟔𝟐𝟒𝟏].[𝟐𝟐,𝟗𝟓−𝟏𝟗,𝟓𝟑]
 → r= 
𝟔𝟗,𝟓𝟔
√[𝟑𝟒𝟕𝟗].[𝟑,𝟒𝟐]
 
 
r= 
𝟔𝟗,𝟓𝟔
√𝟏𝟏𝟖𝟗𝟖,𝟏𝟖
 → r= 
𝟔𝟗,𝟓𝟔
𝟏𝟎𝟗,𝟎𝟕𝟐𝟕
 → r= 0,6385// 
O coeficiente de Pearson é 0,6385 existindo portanto, uma correlação positiva 
moderada.// 
 
 
 
 
 
 
 
 
 
64 
 
c) Coeficiente de Correlação (Omitindo o décimo ciclista): 
n Horas de treinamento chumbo no sangue (mml/L) x2 y2 (x.y) 
1 8 0,53 64 0,2809 4,24 
2 10 0,25 100 0,0625 2,5 
3 10 0,34 100 0,1156 3,4 
4 12 0,25 144 0,0625 3 
5 15 0,29 225 0,0841 4,35 
6 18 0,3 324 0,09 5,4 
7 18 0,53 324 0,2809 9,54 
8 21 0,53 441 0,2809 11,13 
9 25 0,53 625 0,2809 13,25 
∑ 137 3,55 2347 1,5383 56,81 
 
r= 
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚
√[𝒏.∑𝒙𝟐−(∑𝒙)𝟐].[𝒏.∑𝒚𝟐−(∑𝒚)𝟐]
 → r= 
𝟗.(𝟓𝟔,𝟖𝟏)–(𝟏𝟑𝟕).(𝟑,𝟓𝟓)
√[𝟗.(𝟐𝟑𝟒𝟕)−(𝟏𝟑𝟕)𝟐].[𝟗.(𝟏,𝟓𝟑𝟖𝟑)−(𝟑,𝟓𝟓)𝟐]
 
 
r= 
𝟓𝟏𝟏,𝟐𝟗−𝟒𝟖𝟔,𝟑𝟓
√[𝟐𝟏𝟏𝟐𝟑−𝟏𝟖𝟕𝟔𝟗].[𝟏𝟑,𝟖𝟒𝟒𝟕−𝟏𝟐,𝟔𝟎𝟐𝟓]
 → r= 
𝟐𝟒,𝟗𝟒
√[𝟐𝟑𝟓𝟒].[𝟏,𝟐𝟒𝟐𝟐]
 
 
r= 
𝟐𝟒,𝟗𝟒
√𝟐𝟗𝟐𝟒,𝟏𝟑𝟖𝟖
 → r= 
𝟐𝟒,𝟗𝟒
𝟓𝟒,𝟎𝟕𝟓𝟑𝟎𝟔𝟕
 → r= 0,4612// 
O coeficiente de Pearson é 0,4612 existindo portanto, uma correlação positiva 
fraca.// 
 
d) Sim, parece razoável, a retirada do décimo ciclista gerou uma mudança 
razoável na correlação. 
 
e) Sim, os dados estão bastante dispersos, poderíamos considerar como outros 
fatores a alimentação e horas de sono.

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes