Buscar

Apostila estatística pág. 73 80

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

73 
6. CORRELAÇÃO E REGRESSÃO LINEAR 
 
 É o estudo da existência e do grau de relação entre variáveis, tendo por objetivo medir e avaliar o grau de 
relação existente entre duas variáveis aleatórias. Por exemplo: 
 O sucesso de um emprego pode ser predito com base no resultado de testes; 
 Quanto maior for a produção, maior será o custo total; 
 Quanto maior for a idade de um automóvel, menor será seu preço de venda. 
 Problemas como esses podem ser estudados através de uma análise de correlação simples, onde 
podemos determinar a “força” do relacionamento entre estas duas variáveis estudadas. 
 
6.1. CORRELAÇÃO LINEAR SIMPLES 
 Procura medir a relação entre as variáveis X e Y através da disposição dos pontos (X, Y) em torno de uma 
reta. 
 
 
 Como a correlação em estudo tem como “imagem” uma reta crescente ela é chamada correlação linear 
positiva. 
Assim, uma correlação é: 
 
a) Linear Positiva se os pontos do diagrama têm com “imagem” uma reta crescente; 
b) Linear Negativa se os pontos do diagrama têm com “imagem” uma reta decrescente; 
c) Não Linear se os pontos têm com “imagem” uma curva. 
 
 Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, concluímos que não há 
relação alguma entre as variáveis em estudo. Temos então: 
 
 
 
 
6.2. COEFICIENTE DE CORRELAÇÃO LINEAR SIMPLES 
 
 Medida do grau de associação (relacionamento) entre duas variáveis estudadas a partir de uma série de 
observações. 
 Esta medida é também chamada de coeficiente de correlação de Pearson, em homenagem ao seu 
criador e é dada por: 
 
 74 
 
  
     2222 
 



iiii
iiii
yynxxn
yxyxn
r
 
 
Onde n é o número de pares de valores (x, y) observados e r varia no intervalo 
11  r
, para o 
mesmo, temos que: 
• Valores de r próximos de +1 indicam uma forte correlação positiva entre x e y; 
• Valores de r próximos de – 1 indicam uma forte correlação negativa entre x e y; 
• Valores de r próximos de 0 indicam uma fraca correlação positiva ou negativa entre x e y. 
 A partir dos valores de r, podemos verificar o tipo da correlação existente entre as variáveis estudadas, 
conforme a seguinte tabela: 
 
 
 
 
 
 
 
Exemplo: Calcular o coeficiente de correlação relativo a tabela a seguir. 
 
Matemática (X) Estatística (Y) X .Y X2 Y2 
5 6 
8 9 
7 8 
10 10 
6 5 
7 7 
9 8 
3 4 
8 6 
2 2 

 

 

 

 

 
 
 
 
 
 
 
 
 
 
 
Daí: r = ________, resultado que indica uma correlação linear ________________________________ 
Significativa entre as duas variáveis. 
Valor de r Correlação 
0,0 nula 
0,0 ----| 0,5 fraca 
0,5 ----| 0,8 média 
 0,8 ---- 1,0 forte 
1,0 perfeita 
 
 
 75 
6.3. REGRESSÃO LINEAR 
 
 Sempre que desejamos estudar determinada variável em função de outra, fazemos uma análise de 
regressão. 
 Podemos dizer que a análise de regressão tem por objetivo descrever, através de um modelo 
matemático, a relação entre duas variáveis, partindo de n observações das mesmas. 
 As variáveis estudadas serão: x, denominada de variável independente, e y, denominada de variável 
dependente. As funções resultantes do ajuste de uma função linear entre 2 variáveis y e x, define a linha reta 
que descreve a associação entre duas características e permite estimar o valor de uma medida pela outra. Para 
obter a reta de regressão é necessário calcular o Coeficiente angular “a” e o coeficiente linear da reta com o eixo 
das ordenadas “b”. 
 
Parâmetros da reta y = ax + b (Regressão): 
 
  
 22 
 



ii
iiii
xxn
yxyxn
a
 e 
xayb 
. 
 Onde: 
n
x
x i


 e 
n
y
y i


. 
 
 
Exemplo: Com base no exemplo anterior encontre a equação da reta ajustada e em seguida trace-a no gráfico. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
USANDO O EXCEL 
 
Correlação 
 
 
1. Nas colunas A e B insira os dados conforme imagem. 
2. Na célula C2 escreva: r 
3. Na célula D2 digite a fórmula: 
=CORREL(A2:A11;B2:B11) 
4. Aperte o ENTER e o valor do coeficiente de correlação 
aparecerá na célula B2. 
 
 
 
 
 
 
 76 
Regressão Linear 
1. Selecione a célula A2 até B11 
2. Vá em INSERIR gráfico de dispersão 
3. Clique com o botão direito do mousse em um dos pontos do gráfico 
4. Vá em adicionar linha de tendência 
5. Selecione LINEAR e mostrar equação no gráfico 
6. Aperte o ENTER e a equação de regressão linear aparecerá no gráfico. 
 
 
 
 
 
 77 
 
 
 
 
EXERCÍCIOS 
 
1. Sejam os seguintes diagramas de dispersão. Determine se há uma correlação linear positiva, uma 
correlação linear negativa ou se não há correlação entre as variáveis. 
 
 
 
 
 ________________________ ________________________ _________________________ 
 
 78 
2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a média 
dos pesos aparentes, dados pelo grupo, obteve-se a tabela: 
 
Peso real (
ix
) Peso aparente 
(
iy
) 
ii yx
 
2
ix
 
2
iy
 
18 10 
30 23 
42 33 
62 60 
73 91 
97 98 
120 159 

________ 

_________ 

______ 

______ 

______ 
 Com a tabela preenchida, calcule o índice de correlação. r = 0,98 
 
3. Uma amostra de residências selecionadas aleatoriamente, num bairro, foi observada quanto à idade do 
imóvel (x), em anos, e ao preço de venda (y), em mil reais, resultando: 
 
ix
 
iy
 
ii yx
 
2
ix
 
2
iy
 
1 100 
2 80 
3 90 
4 15 
5 50 
6 20 

_______ 

_______ 

_______ 

_______ 

_______ 
 
Com os dados da tabela, responda os itens abaixo. 
a) Estime a reta de regressão. y = – 16,14 x + 115,66 
b) Calcule o coeficiente de correlação x e y. r = – 0,83 
 
4. Considere os resultados de dois testes, x e y, obtidos por um grupo de alunos da escola A: 
 
ix
 
iy
 
ii yx
 
2
ix
 
2
iy
 
11 13 
14 14 
19 18 
19 15 
22 22 
28 17 
30 24 
31 22 
34 24 
37 25 

_______ 

_______ 

_______ 

_______ 

_______ 
 
Com os dados da tabela, calcule o coeficiente de correlação. r = 0,89 
 
 79 
 
5. Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica” (xi) e “volume de 
produção nas empresas industriais” (yi), fez-se uma amostragem que inclui vinte empresas, computando-
se os seguintes valores: 
.13,22,96,84,16,12,72,20,34,11 22  iiiiii yxyxyx
 
 Determine: 
a) o cálculo do coeficiente de correlação; r = 0,54 
b) a equação de regressão de y para x; y = 1,81 x + 0,01 
 
6. A variação do valor da UPC (Unidade Padrão de Capital), relativamente a alguns meses de 2009, deu 
origem à tabela: 
 
Meses 
ix
 Valores (R$) (
iy
) 
ii yx
 
2
ix
 
2
iy
 
Maio 21,75 
Junho 21,75 
Julho 21,78 
Agosto 21,78 
Setembro 21,78 
Outubro 21,81 
Novembro 21,81 
 

_____ 

_____________ 

________ 

________ 

________ 
Preencha a tabela e responda os itens abaixo. 
a) calcule o grau de correlação. r = 0,94 
b) estabeleça a equação de regressão de y sobre x. y = 0,34 x + 8,58 
c)estime o valor da UPC para o mês de dezembro. R$ 12,66 
Sugestão: Substitua os meses, respectivamente, por 5, 6, ..., 11. 
 
7. A partir da tabela: 
 
ix
 
iy
 
ii yx
 
2
ix
 
2
iy
 
1 70 
2 50 
3 40 
4 30 
5 20 
6 10 

___________ 

_____________ 

________ 

_______ 

_______ 
a) calcule o grau de correlação; r = – 0,99 
b) determine a reta ajustada; y = – 11,43 x + 76,68 
c) estime o valor de y para x = 0. y = 76,68 
 
8. Usando uma amostra de 18 elementos casuais um agente estimou o coeficiente de correlação entre x e y 
em 0,32. O que isso te comunica sobre essas duas variáveis nessa população? 
 
9. Em certa população o coeficiente de correlação entre x e y é – 0,8. O que isso significa? 
 
10. Quando você investiga a relação entre duas variáveis aleatórias contínuas, por que é importante fazer um 
gráfico de dispersão dos dados? 
 
 80 
 
11. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma 
nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a 
idade (x) e a massa muscular (y). 
 
Idade (xi) 
Massa 
muscular (yi) 
ii yx
 
2
ix
 
2
iy
 
71 82 
64 91 
43 100 
67 68 
56 87 
73 73 
68 78 
56 80 
76 65 
65 84 
45 116 
58 76 
45 97 
53 100 
49 105 
78 77 
73 73 
68 78 

________ 

_________ 

________ 

_________ 

_________ 
 
Com os dados da tabela, responda os itens abaixo. 
a) O diagrama de dispersão está construído abaixo, interprete-o. 
 
b) Calcule o coeficiente de correlação linear entre x e y. O que se pode concluir sobre a correlação de posse 
do valor de r? 
c) Ajuste uma reta de regressão para a relação entre as variáveis y: massa muscular (dependente) e x: idade 
(independente). 
d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos.

Outros materiais