Buscar

Estatística I

Prévia do material em texto

ESTATÍSTICA I AULA 07
CORRELAÇÃO E REGRESSÃO
<data/hora>
<rodapé>
4
Aulas prévias
Planejamento da pesquisa.
Análise Exploratória de Dados: através de tabelas e gráficos
Análise Exploratória de Dados: através de medidas de síntese
Correlação e regressão: diagrama de dispersão, coeficiente de correlação
<data/hora>
<rodapé>
<número>
Conteúdo desta aula
Correlação e regressão:
Regressão linear simples.
Coeficiente de determinação.
<data/hora>
<rodapé>
<número>
Regressão Linear Simples
Apenas DUAS variáveis.
Variação de Y (dependente) é “explicada” pela variação de X (independente) através do modelo de regressão.
Modelo de regressão: equação.
Regressão “linear”: equação de reta.
<data/hora>
<rodapé>
<número>
Suposições
"A função de regressão 'explica' grande parte da variação de Y com X. Uma parcela da variação permanece sem ser explicada, e é atribuída ao acaso".
Variação de Y em torno da função: média zero, desvio padrão constante.
Possível avaliar a equação de regressão pelo diagrama de dispersão.
<data/hora>
<rodapé>
<número>
Exemplo 1
<data/hora>
<rodapé>
<número>
Coeficientes da equação
Qual é a “melhor” reta?
Método dos MÍNIMOS QUADRADOS:
<data/hora>
<rodapé>
<número>
Coeficientes da reta
<data/hora>
<rodapé>
<número>
Exemplo 2
	Filial	Clientes (X)	Vendas (Y)	X2	Y2	XY
	1	907	11,2	822649	125,44	10158,4
	2	926	11,05	857476	122,1025	10232,3
	...	...	...	...	...	...
	20	621	7,41	385641	54,9081	4601,61
	Somatório	14623	176,11	11306209	1602,097	134127,9
<data/hora>
<rodapé>
<número>
Exemplo 2
<data/hora>
<rodapé>
<número>
Exemplo 2
<data/hora>
<rodapé>
<número>
No Excel
b = INCLINAÇÃO(células com y; células com x)
a = INTERCEPÇÃO(células com y; células com x)
<data/hora>
<rodapé>
<número>
Outros modelos
Logarítmico
Polinômio de 2º grau
Potência
Exponencial
;
 
<data/hora>
<rodapé>
<número>
Coeficiente de Determinação – r2
Mede quanto da variação total de Y em torno da sua média pode ser explicada pelo modelo de regressão.
<data/hora>
<rodapé>
<número>
Coeficiente de Determinação – r2
0 ≤ r2 ≤ 1
Quanto mais próximo de 1 for o r2 melhor será o modelo de regressão.
Ao comparar dois modelos de regressão para os mesmos dados: recomendável o de maior r2. 
<data/hora>
<rodapé>
<número>
Exemplo 3
APENAS para o caso linear:
r2 = (0,9549)2 = 0,9118
Em média, 91,18% da variabilidade de Y pode ser “explicada” pela variabilidade de X através do modelo linear Y = 0,0087 ×X + 2,423
<data/hora>
<rodapé>
<número>
Exemplo 3
<data/hora>
<rodapé>
<número>
Tô afim de saber...
Sobre regressão linear simples, coeficiente r2 e outros aspectos: 
BARBETTA,P. A. Estatística Aplicada às Ciências Sociais. 8ª. ed. – Florianópolis: Ed. da UFSC, 2008, capítulo 13.
MOORE, D.S., McCABE, G.P., DUCKWORTH, W.M., SCLOVE, S. L., A prática da estatística empresarial: como usar dados para tomar decisões. Rio de Janeiro: LTC, 2006. Capítulo 2.
<data/hora>
<rodapé>
<número>
Tô afim de saber...
Para saber como realizar as análises descritas na Unidade 4 através do Microsoft Excel  consulte “Análise Bidimensional com o Microsoft Excel ”, disponível no ambiente virtual assim como o arquivo de dados usado nos exemplos apresentados, ou no canal menreis39 no YouTube. 
<data/hora>
<rodapé>
<número>
Próxima aula
Correlação e Regressão
Análise de Resíduos
<data/hora>
<rodapé>
<número>
image1.wmf
4567891011121340050060070080090010001100Vendas semnais da filial ($1000)Número semanal de clientes da filialVendas semanais por número de clientes
oleObject1.bin
image2.wmf
a
bX
Y
+
=
ˆ
oleObject2.bin
image3.wmf
(
)
å
-
Þ
2
i
Y
ˆ
i
Y
min
b
 
e
 
a
image4.wmf
a
bX
Y
+
=
ˆ
image5.wmf
(
)
å
-
Þ
2
i
Y
ˆ
i
Y
min
b
 
e
 
a
image6.wmf
(
)
(
)
2
1
1
2
1
1
1
÷
ø
ö
ç
è
æ
-
´
´
-
´
´
=
å
å
å
å
å
=
=
=
=
=
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
i
x
x
n
y
x
y
x
n
b
image7.wmf
n
x
b
y
a
n
i
i
n
i
i
å
å
=
=
´
-
=
1
1
image8.wmf
(
)
(
)
2
1
1
2
1
1
1
÷
ø
ö
ç
è
æ
-
´
´
-
´
´
=
å
å
å
å
å
=
=
=
=
=
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
i
x
x
n
y
x
y
x
n
b
image9.wmf
n
x
b
y
a
n
i
i
n
i
i
å
å
=
=
´
-
=
1
1
image10.wmf
(
)
(
)
(
)
008729
,
0
14623
11306209
20
)
11
,
176
14623
(
9
,
134127
20
2
2
1
1
2
1
1
1
=
-
´
´
-
´
=
÷
ø
ö
ç
è
æ
-
´
´
-
´
´
=
å
å
å
å
å
=
=
=
=
=
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
i
x
x
n
y
x
y
x
n
b
image11.wmf
423
,
2
20
14623
008729
,
0
11
,
176
1
1
=
´
-
=
´
-
=
å
å
=
=
n
x
b
y
a
n
i
i
n
i
i
image12.wmf
(
)
(
)
(
)
008729
,
0
14623
11306209
20
)
11
,
176
14623
(
9
,
134127
20
2
2
1
1
2
1
1
1
=
-
´
´
-
´
=
÷
ø
ö
ç
è
æ
-
´
´
-
´
´
=
å
å
å
å
å
=
=
=
=
=
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
i
x
x
n
y
x
y
x
n
b
image13.wmf
423
,
2
20
14623
008729
,
0
11
,
176
1
1
=
´
-
=
´
-
=
å
å
=
=
n
x
b
y
a
n
i
i
n
i
i
image14.wmf
y = 0,0087x + 2,423
4567891011121340050060070080090010001100Vendas semnais da filial ($1000)Número semanal de clientes da filial
Vendas semanais por número de clientes
image15.wmf
(
)
(
)
total
 
iância
explicada
 
variância
Y
Y
Y
Y
r
n
i
i
n
i
i
var
ˆ
1
2
1
2
2
=
-
-
=
å
å
=
=
image16.wmf
(
)
(
)
total
 
iância
explicada
 
variância
Y
Y
Y
Y
r
n
i
i
n
i
i
var
ˆ
1
2
1
2
2
=
-
-
=
å
å
=
=
image17.wmf
y = 0,0087x + 2,423R² = 0,91194567891011121340050060070080090010001100Vendas semnais da filial ($1000)Número semanal de clientes da filialVendas semanais por número de clientes

Continue navegando