Buscar

CAPITULO X Regressao

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

CAPÍTULO X
CORRELAÇÃO E REGRESSÃO Prof. Marcone Soares
10.1 Introdução
 Em algumas situações, precisamos estabelecer algumas relações entre duas ou mais variáveis, que damos o nome de relação funcional ou relação Estatística.
Exemplos:
Área do retângulo (S = a . b) é a relação entre os lados de um retângulo;
Perímetro de um quadrado (2p = 4l) é a relação entre o perímetro e os lados de um quadrado.
10.2 Relações Estatísticas e Correlações
 São relações estabelecidas após uma pesquisa. Com bases nos resultados da pesquisa, fazem-se comparações que eventualmente podem conduzir (ou não) à ligação entre variáveis.
 No estudo estatístico, a relação entre duas ou mais variáveis denomina-se correlação.
A utilidade e importância das correlações entre duas variáveis podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em tomadas de decisões.
Exemplos
Idade e altura de recém nascidos
Tempo de prática de esportes e ritmo cardíaco
Tempo de estudo e nota na prova
Taxa de desemprego e taxa de criminalidade
Expectativa de vida e taxa de analfabetismo
10.3 Diagrama de Dispersão
 O diagrama de dispersão é um gráfico cartesiano em que cada num dos eixos corresponde as variáveis correlacionadas. A variável dependente (y) situa-se no eixo vertical e o eixo das abscissas é reservado para a variável dependente (x). 
 Os pares ordenados ( x,y ) formam uma nuvem de pontos.
 A configuração geométrica do diagrama de dispersão pode estar associada a uma linha reta (correlação linear) ou uma linha curva (correlação não linear) ou, ainda ter os pontos dispersos de maneira que não defina nenhuma configuração linear, isto é, não há correlação.
 Y Y
 X X
 
 Correlação linear Correlação não linear
10.4 Correlação Linear
A correlação mede a força ou grau de relacionamento entre duas variáveis.
A correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição de pontos, que pode corresponder a uma reta ou uma curva. Por outro lado é também, uma linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha.
Assim, uma correlação pode ser:
Linear positiva – se os pontos do diagrama têm como imagem uma reta ascendente (crescente);
Linear negativa – se os pontos têm como imagem uma reta descendente (decrescente);
Não linear – se os pontos têm como imagem uma curva.
 Se os pontos apresentam-se dispersos, não oferecendo uma imagem definida, concluímos que não há relação alguma entre as variáveis em estudo.
10.5 Coeficiente de correlação linear
O instrumento empregado para a medida da correlação linear é o coeficiente de correlação.
Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação se positiva ou negativa.
Usaremos o coeficiente de correlação de PEARSON que é dado por:
 
 
 
Onde n é o número de observações.
Os valores limites de r são -1 e + 1, isto é, r pertence ao intervalo [-1, +1].
Dessa forma, temos que:
Se a correlação entre duas variáveis é perfeita e positiva, então r = +1;
Se a correlação é perfeita negativa, então r = -1;
Se não há correlação entre as variáveis, ou a relação que por ventura exista não é linear, então r = 0.
 Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas, é necessário que:
 0,6 < 
 
 1
Se 0,3 
 
 < 0,6, há uma correlação relativamente fraca entre as variáveis;
Se 0 < 
 < 0,3, a correlação é muito fraca e, praticamente, nada podemos concluir sobre a relação entre as variáveis em estudo.
Exemplo
Seja uma amostra aleatória, formada por dez dos 100 alunos de uma classe da Faculdade X e pelas notas obtidas por eles em Matemática e Estatística:
	
	 NOTAS
	
	
	
	
	Números
	Matemática
	Estatística
	
	
	
	
	(xi)
	(yi)
	xiyi
	 
	
	03
09
25
36
42
58
68
71
86
95
	5,0
8,0
7,0
10,0
6,0
7,0
9,0
3,0
8,0
2,0
	6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
	30
72
56
100
30
49
72
12
48
4
	25
64
49
100
36
49
81
9
64
4
	36
81
64
100
25
49
64
16
36
4
 SOMA 65 65 473 481 475
 
= 
= 
 =
. Logo, r = 0,911, resultado que indica uma correlação linear altamente significativa entre as duas variáveis.
Exercício
Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo descartado, por dia, num hotel com o peso do papel contido nesse lixo.
	Hotel
	H1
	H2
	H3
	H4
	H5
	H6
	H7
	H8
	H9
	H10
	Peso total
	10,47
	19,85
	21,25
	24,36
	27,38
	28,09
	33,61
	35,73
	38,33
	49,14
	Peso do papel
	2,43
	5,12
	6,88
	6,22
	8,84
	8,76
	7,54
	8,47
	9,55
	11,43
Determine o grau de correlação entre as variáveis e dê sua conclusão.(resposta:r = 0,9206).
10.6 Regressão
Ajustamento da reta (mínimos quadrados)
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente.
Suponha X a variável independente e Y a variável dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por: Y = aX + b , onde a e b são parâmetros.
Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora não perfeita, por exemplo, as que formam a tabela abaixo:
 xi 5 8 7 10 6 7 9 3 8 2
 yi 6 9 8 10 5 7 8 4 6 2
 
 Y
 10
 
 * y = a X + b
 * *
 * * 
 * * 
 * 
 *
 * 
 
 0 5 6 10 x
 Podemos calcular pela fórmula do diagrama, que se trata de uma correlação retilínea, de modo a permitir um ajustamento de uma reta, imagem da função definida por Y = aX + b
Calculamos os parâmetros a e b através das fórmulas:
 
 
 e 
 
Onde: n é o número de observações
 
 é a média dos valores de x
 
 é a média dos valores de y 
 
Exemplo
Seja uma amostra aleatória formada por dez dos 100 alunos de uma classe da Faculdade X e pelas notas obtidas por eles em Matemática e Estatística, determinea reta ajustada a essa correlação.
 
	
	 NOTAS
	
	
	
	Números
	Matemática
	Estatística
	
	
	
	(xi)
	(yi)
	xiyi
	 
	03
09
25
36
42
58
68
71
86
95
	5,0
8,0
7,0
10,0
6,0
7,0
9,0
3,0
8,0
2,0
	6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
	30
72
56
100
30
49
72
12
48
4
	25
64
49
100
36
49
81
9
64
4
 SOMA 65 65 473 481 
Como, 
= 
= 6,5 e 
= 
 = 6,5 temos: b = 6,5 – 0,8632 x 6,6 = 08892, donde teremos
a = 0,86 e b = 0,89 Logo: y = aX + b 	 y = 0,86X + 0,89
EXERCÍCIOS
1) a tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura:
 Temperatura (ºC) 10 15 20 25 30
 Comprimento (mm) 1.003 1.005 1.010 1.011 1.014
Determine:
O coeficiente de correlação; (r = 0,89)
A reta justada a essa correlação; ( y = 0,34X + 9,94)
O valor estimado do comprimento da barra para a temperatura de 18ºC. (
 = 1.007,5)
2) Certa empresa, estudando a variação da demanda de seu produto em relação a variação de preço de venda, obteve a tabela:
 Preço (xi) 38 42 50 56 59 63 70 80 95 110
 Demanda (yi) 350 325 279 270 256 246 238 223 215 208
a) Determine o coeficiente de correlação (r = - 0,90)
Estabeleça a equação da reta ajustada. ( y = -1,87X +386,8)
Estime Y para X = 60 (
 = 274,6 ) 
3) Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo:
	X
	2,0
	2,0
	4,0
	4,0
	6,0
	6,0
	8,0
	8,0
	10,0
	10,0
	Y
	2,1
	1,9
	4,5
	4,2
	6,2
	6,5
	7,8
	7,7
	9,6
	10,0
(a) Construa o diagrama de dispersão para esses dados. 
(b) Calcule o coeficiente de correlação entre as variáveis X e Y. 
(d) Obtenha a reta de regressão da variável Y em função de X. 
4) Em um estudo sobre o efeito dos componentes de uma dieta (X) sobre a composição lipídica (Y)
foram obtidos os seguintes dados em uma amostra de 15 animais.
Componente da dieta (X) Composição lipídica (Y)
 18 30
 21 35
 28 43
 35 60
 47 50
 33 28
 40 40
 41 60
 28 43
 21 30
 30 33
 46 65
 44 68
 38 62
 19 25
a) Apresente os dados em um diagrama de dispersão
b) Calcule a reta de regressão da composição lipídica como função do componente da dieta.
c) Desenhe a reta de regressão
d) Interprete os coeficientes da reta de regressão
e) Dê a equação da reta estimada.
_1223541171.unknown
_1223797787.unknown
_1223799370.unknown
_1223801471.unknown
_1223799263.unknown
_1223798192.unknown
_1223798239.unknown
_1223797974.unknown
_1223542452.unknown
_1223542474.unknown
_1223542431.unknown
_1223538150.unknown
_1223541134.unknown
_1223538123.unknown
_1223538099.unknown
_1223395168.unknown

Outros materiais