Buscar

RegressaoLinear

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 49 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 49 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 49 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Regressão Linear
Prof. Carlos Roberto Fonseca
Bioestatística
Regressão Linear
Teste estatístico utilizado para testar se 
existe influência de uma variável contínua (X) 
sobre uma outra variável contínua (Y)
X (causa)		Y (efeito)
Y e X são variáveis contínuas
Exemplos:
	Altura (m)
	Peso (kg)
	Umidade (%)
	Temperatura (°C)
	Concentração do Nutriente (mg/kg)
Variável X
Variável Y
0
0
Representação gráfica dos dados
Variável X
Variável Y
0
0
Representação gráfica do modelo
de regressão linear
A reta é o modelo
Variável X
Variável Y
0
0
A reta de regressão sempre passa pelas médias de x e y
Média de y
Média de x
Variável X
Variável Y
b
a
0
0
Equação Linear
(y = bx + a)
Coeficiente angular
Inclinação
Coeficiente da Regressão
Intercepto
Variável X
Variável Y
a
0
0
Equação Linear
(y = bx + a)
Valor de Y quando X = 0
Y = 0x + a, Y = a
Variável X
Variável Y
7
0
0
Equação Linear
(y = bx + 7)
Valor de Y quando X = 0
Y = 0x + a, Y = 7
Variável X
Variável Y
b
0
0
Equação Linear
(y = bx + a)
Taxa de aumento de Y 
em relação a X
Variável X
Variável Y
0.5
0
0 1 2 3 4 5 6 7 8 
Equação Linear
(y = 0.5x + a)
Quantas unidades Y aumenta
por cada 1 unidade de X
1
10
10.5
20
Variável X
0
0 1 2 3 4 5 6 7 8 
Equação Linear
0.5
1
10
10.5
20
4
2
b = 0.5
H0: A variável X não influencia a variável Y.
H1: A variável X influencia a variável Y.
Hipótese nula (H0) e alternativa (H1)
Variável X
Variável Y
Variável Y
Ho: b = 0
H1: b ≠ 0
Hipótese Nula
Hipótese Alternativa
Variável X
Variável X
Variável Y
Variável Y
Ho: b = 0
H1: b ≠ 0
Hipótese Nula
Hipótese Alternativa
Variável X
Na regressão linear
as três regras de ouro 
também valem!
Variável X
Variável Y
0
0
Soma dos Quadrados Total
SQtotal = Σ(Dado-Média de Y)2
Dado
Y
Média de Y
Variável X
Variável Y
0
0
Soma dos Quadrados do Erro
Estimado
Dado
SQerro = Σ(Dado-Estimado)2
Variável X
Variável Y
0
0
Soma dos Quadrados do Modelo
Estimado
SQmodelo = Σ(Estimado-Média de Y)2
Y
Média de Y
Exemplo de Aplicação
HIPÓTESES
Ho: A altura da árvore não afeta o número de frutos produzidos
H1: A altura da árvore afeta o número de frutos produzidos
PROBLEMA: 
Testar se a altura prevê o número de frutos produzidos por uma espécie de árvore
Altura (m)
Número de frutos produzidos
Ho: b = 0
H1: b ≠ 0
Hipótese Nula
Hipótese Alternativa
Altura (m)
Número de frutos produzidos
Os Dados
Visualização dos dados
Encontrando-se 
o coeficiente angular 
(b)
b = Covariância = 
 Variância X
 ∑ (x – x)(y – y) / g.l.
 ∑ (x – x)2 / g.l.
b = ∑ (x – x)(y – y)
 ∑ (x – x)2
Coeficiente angular (b)
b = ∑ (x – x)(y – y)
 ∑ (x – x)2
b = ∑ (x – x)(y – y)
 ∑ (x – x)2
b = 200
 40
b = 5
Coeficiente angular
Ou seja, 
Y aumenta 5 unidades
para cada 1 unidade de X
27
Encontrando-se 
o intercepto 
(a)
Encontrando-se o intercepto (a)
Y
X
Toda regressão passa pelas médias de X e Y
= ponto fixo
A inclinação da reta já foi calculada!
0
a
Podemos deduzir o intercepto!
0
Y
X
a
b.X
a = Y – (b.X)
Encontrando-se o intercepto (a)
0
0
60
4
a = 40
a = Y – (bX)
Encontrando-se o intercepto (a)
bX = 5x4 = 20
0
0
a = y – (bx)
a = 60 – (5 × 4)
a = 40
Intercepto
Equação da Reta
y = 5 x + 40
Achando-se os valores estimados
de cada um dos dados 
pela regressão
Se um dado tem x = 6, 
qual é o valor estimado de y?
y = 5x + 40
Dado
Estimado
6
?
y = 5⸼6 + 40
y = 30 + 40
y = 70
Se um dado tem x = 2, 
qual é o valor estimado de y?
y = 5x + 40
Dado
Estimado
2
?
y = 5⸼2 + 40
y = 10 + 40
y = 50
Encontrando-se a:
 Soma dos Quadrados Totais
 Soma dos Quadrados da Regressão
 Soma dos Quadrados do Erro
Soma dos Quadrados Totais
Soma dos Quadrados da Regressão
Soma dos Quadrados do Erro
Testando-se a 
significância da regressão
F = Variância da Regressão
	 Variância do Erro
	Fonte de Variação	SQ	g.l.	MQ	F
	Regressão	SQreg	1	SQtrat/gltrat	MQtrat/MQerro
	Erro	SQerro	N-2	SQerro/glerro	
	Total	SQtotal	N-1		
Tabela de ANOVA
SQ – Soma dos Quadrados
g.l. – Graus de Liberdade
MQ – Média dos Quadrados
F – Teste F
	Fonte de Variação	SQ	g.l.	MQ	F
	Regressão	1000	1	1000	4,33
	Erro	3000	13	230,77	
	Total	4000	14		
Tabela de ANOVA
SQ – Soma dos Quadrados
g.l. – Graus de Liberdade
MQ – Média dos Quadrados
F – Teste F
Fcalculado = 4,33
g.l. = 1,13
Fcrítico = 4,67
g.l. = 1,13
(α = 0.05)
Como Fcalculado ≤ Fcrítico,
			Ho é aceita e H1 é rejeitada
No R
qf(0.95,1,13)
Ou seja, a altura não afeta o número de frutos!
1-pf(4.33,1,13)
0.12
Para se achar a Probabilidade de um F calculado no R
Fcalculado = 4.33
g.l. = 1,13
F[1,13] = 4.33, P = 0.12, ns
Script
Resposta (P)
Coeficiente de Determinação (r2)
Quanto da variação de Y
foi explicada por X?
r2 = 	Soma dos quadrados da Regressão (SQreg)
	 Soma dos Quadrados Total (SQtotal)
Tabela de ANOVA
r2 = 1000 / 4000 = 0,25
(Ou seja, a altura explica somente 25% da variação do número de frutos)
	Fonte de Variação	SQ	g.l.	MQ	F
	Regressão	1000	1	1000	4,33
	Erro	3000	13	230,77	
	Total	4000	14		
FIM
Amostras
X
Y
1
3
30
2
2
40
3
1
50
4
4
40
5
3
50
6
2
60
7
5
50
8
4
60
9
3
70
10
6
60
11
5
70
12
4
80
13
7
70
14
6
80
15
5
90
0
40
Média X
Média Y
4.00
60.00
X
(X-Mx)(X-Mx
)2
Y
(Y-My)(Y-My)
2
(X-Mx)(Y-My)
13-1.001.00130-30.00900.00130.00
22-2.004.00240-20.00400.00240.00
31-3.009.00350-10.00100.00330.00
440.000.00440-20.00400.0040.00
53-1.001.00550-10.00100.00510.00
62-2.004.006600.000.0060.00
751.001.00750-10.00100.007-10.00
840.000.008600.000.0080.00
93-1.001.0097010.00100.009-10.00
1062.004.0010600.000.00100.00
1151.001.00117010.00100.001110.00
1240.000.00128020.00400.00120.00
1373.009.00137010.00100.001330.00
1462.004.00148020.00400.001440.00
1551.001.00159030.00900.001530.00
TOTAL60SQx =40.00TOTAL900SQy =4000.00Soma dos 200.00
N15 N15 Produtos das
Mx4.00 My60.00 Diferenças
YDadosMy(Y-My)(Y-My)
2
13060.00-30.00900.00
24060.00-20.00400.00
35060.00-10.00100.00
44060.00-20.00400.00
55060.00-10.00100.00
66060.000.000.00
75060.00-10.00100.00
86060.000.000.00
97060.0010.00100.00
106060.000.000.00
117060.0010.00100.00
128060.0020.00400.00
137060.0010.00100.00
148060.0020.00400.00
159060.0030.00900.00
TOTAL900 SQtotal =4000.00
N15
My60.00
YEstimadoMy(Est - My)(Est-My)
2
155.0060.00-5.0025.00
250.0060.00-10.00100.00
345.0060.00-15.00225.00
460.0060.000.000.00
555.0060.00-5.0025.00
650.0060.00-10.00100.00
765.0060.005.0025.00
860.0060.000.000.00
955.0060.00-5.0025.00
1070.0060.0010.00100.00
1165.0060.005.0025.00
1260.0060.000.000.00
1375.0060.0015.00225.00
1470.0060.0010.00100.00
1565.0060.005.0025.00
SQtratamento = 1000.00
YDadosEstimado(Y-Est)(Y-Est)
2
13055.00-25.00625.00
24050.00-10.00100.00
35045.005.0025.00
44060.00-20.00400.00
55055.00-5.0025.00
66050.0010.00100.00
75065.00-15.00225.00
86060.000.000.00
97055.0015.00225.00
106070.00-10.00100.00
117065.005.0025.00
128060.0020.00400.00
137075.00-5.0025.00
148070.0010.00100.00
159065.0025.00625.00
SQerro =3000.00

Outros materiais