Buscar

Aula 08 CORRELACAO E REGRESSAO (1)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Correlação e 
Regressão
Capa
da Obra
Introdução
Quando consideramos observações de duas ou mais
variáveis, surge um novo problema: as relações
que podem existir entre as variáveis estudadas.
Assim, quando consideramos variáveis como peso e
altura de um grupo de pessoas, uso de cigarro e
incidência de câncer, procuramos verificar se
existe alguma relação entre as variáveis de cada
um dos pares e qual o grau dessa relação.
Capa
da Obra
Sendo a relação entre as variáveis de
natureza quantitativa, a correlação é
o instrumento adequado para descobrir e
medir essa relação.
Uma vez caracterizada a relação,
procuramos descrevê-la através de uma
função matemática. A regressão é o
instrumento adequado para a
determinação dos parâmetros da função.
Capa
da Obra
Correlação
As relações do tipo peso – altura são conhecidas
como relações estatísticas.
Quando duas variáveis estão ligadas por uma
relação estatística, dizemos que existe
correlação entre elas.
Capa
da ObraDiagrama de dispersão
Representando, em um sistema
cartesiano ordenado ortogonal, os
pares ordenados (x,y), obtemos
uma nuvem de pontos que
denominamos diagrama de
dispersão.
Capa
da ObraCorrelação Linear
Capa
daObra
Como a correlação em estudo tem como “imagem” uma
reta ascendente, ela é chamada correlação linear
positiva. Assim, uma correlação é:
- Linear positiva se os pontos têm como imagem uma
reta ascendente;
- Linear negativa se os pontos têm como imagem
uma reta descendente;
- Não-linear se os pontos têm como imagem uma
curva.
Capa
da ObraTipos de Correlação
apa
da ObraCoeficiente de correlação linear
O instrumento empregado para a medida da
correlação linear é o coeficiente de correlação.
Esse coeficiente deve indicar o grau de intensidade
da correlação entre duas variáveis e, ainda, o
sentido dessa correlação (positivo ou negativo).
Capa
da Obra
O coeficiente de correlação de Pearson é dado por:



























































2
2
2
2
i
yyn..
i
xxn.
i
y.
i
x
i
y
i
xn
r
ii
Capa
da Obra
Dessa maneira, podemos ver que:
- Se r=+1, há correlação perfeita e positiva
entre as variáveis;
- Se r=-1, há correlação perfeita e negativa
entre as variáveis;
- Se r=0, ou não há correlação entre as variáveis,
ou a relação que porventura exista não é linear.
Correlação
Coeficiente de correlação linear
Notas:
Para que uma relação possa ser descrita por meio do
coeficiente de correlação de Pearson é imprescindível que
ela se aproxime de uma função linear. Uma maneira
prática de verificarmos a linearidade da relação é a
inspeção do diagrama de dispersão: se a elipse apresenta
saliências ou reentrâncias muito acentuadas,
provavelmente trata-se de correlação curvilínea.
Correlação
Coeficiente de correlação linear
Para podermos tirar algumas conclusões significativas sobre o
comportamento simultâneo das variáveis analisadas, é
necessário que:
Analisando o Diagrama de Dispersão, quando o coeficiente de
correlação é um valor mais perto de 1 ou -1, os pontos estão mais
próximos uns dos outros. Se o valor de r for menor que 0,6, os pontos
no diagrama estarão mais dispersos.
Capa
da Obra
Regressão
Ajustamento da reta
Sempre que desejamos estudar determinada variável
em função de outra fazemos uma análise de
regressão.
A análise de regressão tem por objetivo descrever,
através de um modelo matemático, a relação
entre duas variáveis, partindo de n observações
das mesmas.
A variável a qual desejamos fazer uma estimativa
recebe o nome de variável dependente e a
outra recebe o nome de variável
independente.
Capa
da Obra
Regressão
Ajustamento da reta
Podemos concluir, pela
forma do diagrama, que se
trata de uma correlação
retilínea, de modo a
permitir o ajustamento de
uma reta, imagem da
função definida por:
Y = aX + b.
Capa
da Obra
Ajustamento da reta Y = aX + b
Determinar os valores de a e b através das 
seguintes fórmulas:
Capa
da ObraNota:
Como estamos fazendo uso de uma amostra
para obtermos os valores dos parâmetros, o
resultado, na realidade, é uma estimativa da
verdadeira equação de regressão. Sendo assim,
escrevemos:
Capa
da Obra
Exemplos:
1) Uma empresa pretende analisar as despesas de combustível para a
entrega de seus produtos. Foram coletados dados referentes a 5
caminhões, onde x representa a distância percorrida (em km) e y a
quantidade necessária de combustível (em litros):
Investigar se há correlação entre as variáveis. Caso exista, fazer uma
estimativa para a quantidade de combustível associada a uma distância de
120km.
x (km) y (litros)
50 60
80 80
90 85
100 90
150 190
x (km) y (litros) x.y x2 y2
50 60 3000 2500 3600
80 80 6400 6400 6400
90 85 7650 8100 7225
100 90 9000 10000 8100
150 190 28500 22500 36100
470 505 54550 49500 61425



























































2
2
2
2
i
yyn..
i
xxn.
i
y.
i
x
i
y
i
xn
r
ii
   
   
95,0
14,37227
35400
1385860000
35400
52100.26600
35400
52100.26600
35400
255025307125.220900247500
237350272750
50561425.5.47049500.5
505.47054550.5
22








r
r
r
r
De acordo com o coeficiente de correlação de Pearson (r = 0,95),
temos uma CORRELAÇÃO LINEAR POSITIVA entre as
variáveis, altamente significativa.
0952,243308,1
0952,24
0952,125101
94.3308,1101
101
5
505
 94
5
470
x
:Médias das Cálculo
3308,1
26600
35400






xy
b
b
b
y
a
,
2
2



























i
xxn.
i
y.
i
x
i
y
i
xn
a
i
xayb .
y = 1,330x - 24,09
0
20
40
60
80
100
120
140
160
180
200
0 50 100 150 200
Análise de Regressão
Determinar a Equação da Reta de Regressão:
y=a.x+b 
y=1,33x-24,09 
Diagrama de Dispersão
Análise de Regressão
y=1,33x-24,09 
Utilizamos a função para obter um valor estimado de y a partir 
de uma valor de x.
Tempos x= 120km, então: 
y=1,33.120-24,09=135,51
Assim, uma estimativa para a quantidade de combustível
associada a uma distância de 120km seria de,
aproximadamente, 136 litros.
Capa
da Obra
Exemplos:
2) Uma empresa pretende analisar as despesas de combustível para a
entrega de seus produtos. Foram coletados dados referentes a 5
caminhões, onde x representa a distância percorrida (em km) e y a
quantidade necessária de combustível (em litros):
Investigar se há correlação entre as variáveis. Caso exista, fazer uma
estimativa para a quantidade de combustível associada a uma distância de
30km.
x (km) y (litros)
5 30
15 83
20 120
28 130
35 175
x (km) y (litros) x.y x2 y2
5 30 150 25 900
15 83 1245 225 6889
20 120 2400 400 14400
28 130 3640 784 16900
35 175 6125 1225 30625
103 538 13560 2659 69714
CÁLCULO DO COEFICIENTE DE CORRELAÇÃO
   
98,0
08,12602
12386
158812436
12386
591262686
12386
2894443485701060913295
5541467800
2
538697145
2
10326595
53810313560.5



















.
r
.
r
...
.
r
De acordo com o coeficiente de
correlação de Pearson (r = 0,98),
temos uma CORRELAÇÃO
LINEAR POSITIVA entre as
variáveis, altamente significativa.
y=4,61x+12,61
60722,126113,4
60722,12
99278,946,107
6,20.6113,46,107
.





xy
b
b
b
xayb
Análise de Regressão
Determinar a Equação da Reta de Regressão:
y=a.x+b 
6,107
5
538
6,20
5
103
:Médias das Cálculo


y
x
y = 4,611x + 12,60
0
20
40
60
80
100
120
140
160
180
200
0 10 20 30 40
Diagrama de Dispersão
6113,4
2686
12386
a
Análise de Regressão
Utilizamos a função para obter um valor estimado de y a partir 
de uma valor de x.
Tempos x= 30km, então: 
y=4,61.30+12,61=150,91
Assim, uma estimativa paraa quantidade de combustível
associada a uma distância de 30km seria de,
aproximadamente, 151 litros.
y=4,61x+12,61
Capa
da Obra
Exemplos:
3) Uma empresa com 10 armazéns compilou dados sobre a área 
de vendas (em metros quadrados) versus lucro diário:
Colunas auxiliares
65 65 473 481 475
475
481
473.
65
65
10
2
2











y
x
yx
y
x
n
91,0
1886,554
505
307125
505
525585
505
)42254750).(42254810(
42254730
)65475.10).(65481.10(
65.65473.10
22










r
r
r
r



























































2
2
2
2
i
yyn..
i
xxn.
i
y.
i
x
i
y
i
xn
r
ii
Capa
da ObraAjustamento da reta
Diagrama de Dispersão
65
65
10





y
x
n
91,0
59,55,6
5,6.86,05,6
86,0
585
505





b
b
b
xayb
a
5,6
10
65
5,6
10
65




n
y
y
n
x
x
i
i
estimado Lucro
35,491,04.86,0
91,086,0


y
xy
91,086,0 

xy
baxy
Equação de Regressão:
Estimativa para x=4 (por exemplo):
Determinação dos parâmetros a e b:
Capa
da ObraInterpolação e Extrapolação
Voltando à tabela do exemplo anterior, vemos que 4,0 não
figura entre os valores de área. Entretanto, podemos
estimar o lucro diário correspondente a área fazendo
X=4,0 na equação de regressão:
Assim,
O mesmo acontece com a área igual a 1,0:
91,086,0  XY

35,491,00,486,00,4  YX

77,191,00,186,00,1  YX

Como 4 pertence ao intervalo [2,10], dizemos que foi feita
uma interpolação; e como 1 não pertence ao intervalo
[2,10], dizemos que foi feita uma extrapolação.

Outros materiais