Buscar

Aula do dia 09 11 2020 Atividade 13 Coeficiente de Correlação de Pearson e Regressão Linear

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ATIVIDADE XIII - ESTATÍSTICA
CURSO ENGENHARIA ELÉTRICA
PROFESSOR Me. Neilon José de Oliveira
MATÉRIA: Variável e Frequência.
Coeficiente de Correlação de Pearson 
O instrumento empregado para medida de correlação linear é o Coeficiente de Pearson, representada por r. Este coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo). O objetivo de calcular o valor de r é avaliar, analisar e determinar o grau de dependência entre variáveis de uma determinada relação. 
Podemos nos pergunta:
· Qual é a relação entre o consumo de cigarros e o aparecimento de câncer de pulmão?
· Qual é a relação entre o peso aparente de uma objeto e seu peso real?
· Qual é a relação entre o tamanho de uma barra de alumínio e sua temperatura?
· Qual é a relação entre a corrente que passa por um resistor e a tensão fornecida a um circuito? 
Quando necessitamos estabelecer relações entre variáveis, devemos apurar a possibilidade da dependência e, em qual grau de dependência se encontra essa relação. No entanto, o processo estatístico adequado para essa averiguação é o cálculo o coeficiente de correlação. 
Os valores limites deste coeficiente são -1 e +1, isto é, no mínimo -1 e no máximo +1. O coeficiente r é calculado por:
· Se a correlação entre duas variáveis é perfeita e positiva então r = +1 e o gráfico será uma reta crescente.
· Se a correlação é perfeita, mas negativa então r = -1 e o gráfico será uma reta decrescente.
· Se não há correlação entre as variáveis, então r será igual ou muito próximo de zero. Neste caso os pontos não serão colineares
· 
Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas, é necessário que , ou seja, o valor absoluto de r deve estar entre 0,6 e 1. Neste caso podemos estimar uma reta que passa mais próxima dos pontos. Esta reta é denominada reta de tendência.
· 
Se , isto é, o valor absoluto de r estiver entre 0,3 e 0,6, há uma correlação relativamente fraca entre as variáveis.
· 
Se , isto é, r estiver entre 0 e 0,3, a correlação é muito fraca e, praticamente, nada podemos concluir sobre a relação entre as variáveis em estudo.
Exemplo 1: Correlação Perfeita Positiva ocorre quando r=1.
	x
	y
	x.y
	x^2
	y^2
	1,0
	1
	1
	1,0
	1
	2,0
	3
	6
	4,0
	9
	4,0
	7
	28
	16,0
	49
	5,0
	9
	45
	25,0
	81
	6,0
	11
	66
	36,0
	121
	18,0
	31
	146
	82
	261
Verifique os cálculos.
Note que se r=1 todos os pontos no gráfico serão colineares.
Trace a reta e calcule a equação da reta que passa por eles (reta de tendência).
COMO CALCULAR A EQUAÇÃO DA RETA QUE PASSA POR DOIS PONTOS DADOS
PRIMEIRO PASSO: Toda equação de uma reta é dada por 
SEGUDO PASSO: Tome dois pontos do plano (1,1) e (5,9)
TERCEIRO PASSO: é denominada coeficiente angular.
Daí a equação procurada é que é denominada reta de tendência ou equação de regressão linear.
Exemplo 2: Correlação Positiva não Perfeita (r ≠1).
	x = Peso (Kg)
	y = Comprimento (cm)
	x.y
	x^2
	y^2
	14,5
	91
	1319,5
	210,25
	8281
	17,0
	100
	1700,0
	289,00
	10000
	19,0
	102
	1938,0
	361,00
	10404
	19,0
	108
	2052,0
	361,00
	11664
	19,5
	99
	1930,5
	380,25
	9801
	21,2
	103
	2183,6
	449,44
	10609
	21,5
	105
	2257,5
	462,25
	11025
	22,7
	107
	2428,9
	515,29
	11449
	23,0
	104
	2392,0
	529,00
	10816
	28,4
	104
	2953,6
	806,56
	10816
	205,8
	1023,0
	21155,6
	4364,04
	104865
Verifique os cálculos.
Note que os pontos não são colineares. Neste caso é possível avaliar e estimar uma reta que passa mais próxima dos pontos. O cálculo da equação desta reta será visto em regressão linear.
Conhecendo a equação da reta podemos fazer estimativas para o peso ou para o comprimento. Por exemplo:
· Para uma barra de comprimento igual a 120cm qual será seu peso?
y = 0,794x + 85,94 
120=0,794*x+85,94
x=42,87
· Para uma barra com 30kg qual será seu comprimento?
y = 0,794x + 85,94 
y=109,76
Atividades
1. Calcule o coeficiente de correlação relativo às variáveis x e y.
	x
	y
	x.y
	X^2
	y^2
	3
	2
	6
	9
	4
	4
	4
	16
	16
	16
	7
	10
	70
	49
	100
	9
	14
	126
	81
	196
	11
	18
	198
	121
	324
	13
	22
	286
	169
	484
	
	
	
	
	
	47
	70
	702
	445
	1124
Faça o gráfico e calcule a equação da reta que passa pelos pontos.
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
2. Calcule o coeficiente de correlação relativo às variáveis x e y.
	x
	y
	x.y
	X^2
	y^2
	1,0
	2
	
	
	
	2,0
	4
	
	
	
	3,0
	6
	
	
	
	4,0
	8
	
	
	
	5,0
	10
	
	
	
	6,0
	12
	
	
	
	7,0
	14
	
	
	
	8,0
	16
	
	
	
	9,0
	18
	
	
	
	
	
	
	
	
Faça o gráfico e calcule a equação da reta que passa pelos pontos.
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
REGRESSÃO LINEAR - DETERMINAÇÃO DA RETA DE TENDÊNCIA.
Sempre que desejamos estudar determinada variável em função de outra, fazemos uma análise de regressão, que tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de um número de observações das mesmas.
Por exemplo, se queremos saber se o número de multas aplicadas aos condutores influencia na redução de acidentes de trânsito, ou se a variação do preço do dólar afeta positiva ou negativamente a venda de eletrodomésticos, ou se o aumento da demanda de determinado produto interfere no preço, etc.
Para que uma relação possa ser descrita por meio do coeficiente de correlação de Pearson é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se os pontos apresentam uma tendência a aproximarem de uma curva, esta relação é denominada não linear.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. Assim, supondo X a variável independente e Y a dependente, vamos verificar como podemos estimar a relação de duas grandezas a partir do ajustamento de uma reta, dado pela função:
Y = AX+B onde:
A = coeficiente angular (ou inclinação) e
B = coeficiente linear (ou intercepção).
Atividades 
3. Calcule a equação da reta que passa pelos pontos (2, 7) e (4, 11) e faça a representação gráfica.
4. Dê a equação da reta Y = AX+B que passa pelos pontos apresentados na seguinte tabela:
	x
	0
	1
	2
	3
	?
	y
	1
	3
	5
	7
	0
5. Calcule o valor de r e construa os gráficos de dispersão para os seguintes casos (use Excel):
a)
	x
	0
	1
	2
	3
	4
	y
	1
	3
	5
	7
	9
b)
	x
	2
	1
	7
	4
	6
	10
	9
	y
	16
	18
	6
	12
	8
	0
	2
c) 
	x
	5
	8
	7
	10
	6
	7
	9
	3
	8
	2
	y
	6
	9
	8
	10
	5
	7
	8
	4
	6
	2
d)
	x
	4
	6
	8
	10
	12
	y
	12
	10
	8
	12
	14
e) 
	x
	1
	8
	1
	10
	9
	7
	4
	3
	8
	2
	y
	6
	1
	8
	10
	5
	7
	8
	4
	6
	2
CÁLCULO DA EQUAÇÃO DA RETA DE TENDÊNCIA
A partir do diagrama de dispersão (gráfico dos pontos) podemos concluir se há ou não uma correlação linear, de modo a permitiro ajustamento de uma reta dada Y = AX+B, também denominada reta de tendência.
Pode demonstrar que os valores de A e B da reta que mais se aproxima dos pontos são dados por:
onde: 
· n é o número de observações;
· 
 é a média dos valores de X , ou seja, e
· 
é a média dos valores de Y, ou seja, .
No Excel:
 o valor de A é calculado por 		=INCLINAÇÃO( VAL Y_ :VAL X _) 
o valor de B por: 				=INTERSEPÇÃO(VAL Y_ :VAL X _) . 
	
Observação: como estamos fazendo uso de uma amostra de dados para obtermos os valores dos parâmetros A e B, o resultado, é uma estimativa da verdadeira equação de regressão.
Nas atividades seguintes determine o coeficiente de correlação entre estas grandezas, e procure verificar o significado deste número. Usando o Excel, construa os gráficos e procure inserir a reta de tendência em cada caso. A fórmula para o cálculo do coeficiente de correlação é = CORREL( Val y_ : Val x_ ).
6. A título de ilustração, complete o esquema de cálculo do coeficiente de correlação r para os valores das variáveis x e y e calcule r, e em seguida esboce o gráfico e trace a linha de tendência determinando sua equação e seus respectivos pontos de interseção com os eixos coordenados.
	x
	y
	x*y
	x^2
	y^2
	2
	7
	
	
	
	4
	11
	
	
	
	5
	13
	
	
	
	3
	9
	
	
	
	1
	5
	
	
	
	6
	15
	
	
	
	
	
	
	
	
7. A partir da tabela abaixo, faça o diagrama de dispersão, calcule o valor de r e dê a equação da reta de ajuste.
	x
	y
	x*y
	x^2
	y^2
	2
	30
	
	
	
	4
	25
	
	
	
	6
	22
	
	
	
	8
	18
	
	
	
	10
	15
	
	
	
	12
	11
	
	
	
	14
	10
	
	
	
	
	
	
	
	
8. Consideremos uma amostra aleatória, formada por 10 do 98 alunos de uma classe da faculdade. Observando as notas obtidas por eles em Matemática no primeiro período e em Estatística no terceiro período obtemos:
	Matemática
	Estatística
	x*y
	x^2
	y^2
	50
	60
	
	
	
	80
	90
	
	
	
	70
	80
	
	
	
	100
	100
	
	
	
	60
	50
	
	
	
	70
	70
	
	
	
	90
	80
	
	
	
	30
	40
	
	
	
	80
	60
	
	
	
	20
	20
	
	
	
	
	
	
	
	
a) Será que há correlação entre as notas dos alunos obtidas em Matemática e Estatística? Faça o gráfico, calcule r e dê a equação da reta de tendência.
b) Faça uma estimativa da nota de Matemática para um aluno que tire 30 em Estatística. 
c) Faça uma estimativa da nota de Estatística para um aluno que tire 40 em Matemática. 
9. É conhecido da Física que a variação de temperatura faz variar o comprimento de uma barra de metal. A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura em que ela é submetida.
	TEMPERATURA ( em ºC)
	10
	15
	20
	25
	30
	COMPRIMENTO (em mm)
	1,003
	1,005
	1,01
	1,011
	1,014
a) Dê o coeficiente de correlação;
b) A reta ajustada a essa correlação;
c) O valor estimado do comprimento para a temperatura de 180C;
d) O valor estimado do comprimento para a temperatura de 350C;
e) O valor estimado para a temperatura quando a barra apresentar um comprimento de 1,018mm. 
10. Certa empresa, estudando a variação da demanda de seu produto em relação à variação de preço de venda, obteve a tabela:
	PREÇO
	38
	42
	50
	56
	59
	63
	70
	80
	95
	110
	DEMANDA
	350
	325
	297
	270
	256
	246
	238
	223
	215
	208
a) Calcule o coeficiente de correlação;
b) Estabeleça a equação da reta ajustada;
c) Estima y para x=60 e para x=120.
d) Qual o valor máximo para a demanda?
FAÇA AS ATIVIDADES DAS PÁGINAS 158 E 159 DO LIVRO 
ESTATÍSTICA FÁCIL, ANTÔNIO ARNOT CRESPO, 18º EDIÇÃO.
8
1
6
,
0
£
£
r
6
,
0
3
,
0
£
£
r
3
,
0
0
£
£
r
(
)
(
)
(
)
(
)
[
]
(
)
[
]
1
31
261
.
5
.
18
82
.
5
31
18
146
.
5
2
2
=
-
-
-
=
r
Correlação Perfeita Positiva (r =+ 1)
0
1
2
3
4
5
6
7
8
9
10
11
12
0,01,02,03,04,05,06,07,0
Correlação Positiva não Perfeita (r =+ 0,62)
90
92
94
96
98
100
102
104
106
108
110
0,05,010,015,020,025,030,0
(
)
(
)
(
)
(
)
[
]
(
)
[
]
62
,
0
1023
104865
.
10
.
8
,
205
04
,
4364
.
10
1023
8
,
205
6
,
21155
.
10
2
2
@
-
-
-
=
r
å
=
X
å
=
Y
å
=
Y
.
X
å
=
2
X
å
=
2
Y
(
)
(
)
(
)
(
)
2
2
.
.
.
å
å
å
å
å
-
-
=
i
i
i
i
i
i
x
x
n
y
x
y
x
n
A
X
A
Y
B
-
=
X
n
x
X
i
å
=
Y
n
y
Y
i
å
=
(
)
(
)
(
)
(
)
[
]
(
)
[
]
2
2
2
2
.
.
.
.
.
å
å
å
å
å
å
å
-
-
-
=
i
i
i
i
i
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r

Continue navegando