Buscar

Inferência Estatística II - Bernardo

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
Professor 
 Waldemiro Carneiro Neto 
Inferência Estatística II 
Curso de Inferência Estatística Aplicada 
na Engenharia de Avaliações 
Utilização do Sistema de Avaliação de Bens - SAB 
 Método comparativo direto de 
dados de mercado 
 Aquele pelo qual o valor de mercado 
de um bem é estimado por meio de 
tratamento técnico dos atributos dos 
elementos comparáveis, constituintes 
da amostra. 
 
2 
Y i 
X i 
bo { 
a 
Y = b 
i o 
+ b x i 1 
<
 
. 
b 1 = tg a 
 
Y  Variável Explicada (Preço) i 
X  Variável Explicativa (características) i 
Tratamento Estatístico po Regressão Linear Simples 
P (R$/m2) 
 
b = 50 
b = tg 45º = 1 
0 
1 
F (m) 
45º 
50 { 
O Modelo estimado será: P = 50 + 1 * F 
<
 
Tratamento Estatístico po Regressão Linear Simples 
Interpretação: quando a frente do terreno aumenta 1m, o seu 
preço unitário cresce R$1,00/m2 
(obs.: quanto maiot o angulo, maior a representatividade da variavel)
Baudson
Underline
Baudson
Highlight
3 
P (R$/m2) 
 
F (m) 
45º 
50 { 
 P = 50 +1 * F 
<
 
Tratamento Estatístico po Regressão Linear Simples 
10 
| 
30 
| 
para 10 < F < 30 _ _ 
Extrapolação 
Grau 
III II I 
Não 
admitida 
Admitida para apenas uma 
variável, desde que: 
a) as medidas das 
características do imóvel 
avaliando não sejam superiores 
a 100% do limite amostral 
superior, nem inferiores à 
metade do limite amostral 
inferior 
b) o valor estimado não 
ultrapasse 15% do valor 
calculado no limite da fronteira 
amostral, para a referida 
variável 
Admitida, desde que: 
a) as medidas das características 
do imóvel avaliando não sejam 
superiores a 100% do limite 
amostral superior, nem inferiores 
à metade do limite amostral 
inferior 
b) o valor estimado não 
ultrapasse 20% do valor 
calculado no limite da fronteira 
amostral, para as referidas 
variáveis, de per si e 
simultaneamente 
9.4.1 - Graus de fundamentação no caso de utilização de modelos de regressão linear 
4 
 P = 50 + 1 * F 
<
 
Extrapolação 
para 10 < F < 30 _ _ 
Condição a) : Extrapolação de Características 
 
 Fmi = 0,5 * 10 = 5m e Fma = 2 * 30 = 60m 
Condição b) : Extrapolação de Valores 
 
 - Para F = 10 => 
 
 
 P = 50 +1 * 10 = R$60/m2 => Pmi = 0,80 * 60 = R$48/m2 
<
 
- Para F = 30 => P = 50 +1* 30 = R$80/m2 => Pma = 80*1,20 = R$ 96/m2 
<
 
Conclusão: o modelo só é válido para avaliar terrenos com frentes entre 5 
e 46m 
TESTE DE SIGNIFICÂNCIA DO MODELO 
- Hipótese para um modelo de regressão linear simples: 


 
zero de diferente é :
0:
11
10


H
H
Ho : o modelo deve ser expresso por uma reta horizontal 
H1 : o modelo deve ser explicado por uma reta inclinada 
- Hipótese para um modelo de regressão linear com k variáveis explicativas: 
 

 
zero de diferente é k1,...,=j um menos pelo
0...:
1
210
j
k
H
H


5 
A visualização gráfica do teste 
Y 
Y i 
 Y 
X i X 
Y = b + b .x 
i 
<
 
o 1 i 
Variância Explicada 
   /1ˆexp 2YYV i 
Variância não Explicada 
 
  2)- /(Nˆexp 2YYVn i 
Variância Total 
 
1)- /(N)( 2YYVtot i 
Variâncias 
Estatística F 
F = Vexp / Vnexp 
i 
<
 
Y < 
Y - Y 
i 
<
 
Y 
 - Y i 
Visualização da Distribuição de Snedecor 
F 
a 
 a; k ; (n-k-1) 
Aceitação de Ho Rejeição de Ho 
6 
Passos para utilização do teste: 
 
1o) Calcula-se: 
 
 
 
1
2
ˆ
ˆ
 
Vnexp
Vexp
 Fc
2
2






 n
YY
YY
F
ii
i
c
 
  K
kn
YY
YY
F
ii
i
c
1
ˆ
ˆ
 
2
2







Para um modelo com k variáveis explicativas 
2o) Estabelece-se um nível de significância a com o número de graus de 
liberdade da variância do numerador ( k ) e do denominador ( n – k – 1 ), 
encontra-se na tabela (a = 5% ) ou (a =1% ). 
Ftab = F ( ; k ; n – k -1 ) 
3o) Comparar Fc com o Ftab 
Se Fc  Ftab pelo menos que uma das variáveis explicativas consideradas 
no modelo, é importante para explicar a variação observada nos preços. 
Isto é, neste caso rejeita-se Ho. 
. 
7 
Codificação de Variáveis Qualitativas 
 
CODIFICAÇÃO DE VARIÁVEIS QUALITATIVAS 
 
Tipos de Variáveis 
- Quantitativas 
 
- Qualitativas 
 
 
- Tipo de dado de mercado: Oferta - 1 
 Venda - 0 
 
- O edifício tem elevador? Sim - 1 
 Não - 0 
 
- Apenas duas alternativas: Variáveis Dicotômicas, Dummies ou Binárias 
Exemplos 
8 
 
2a Opção: duas dummies 
 Padrão Normal Alto 
 Baixo 0 0 
 Normal 1 0 
 Alto 0 1 
 
1a Opção: códigos alocados 
CODIFICAÇÃO DE VARIÁVEIS QUALITATIVAS 
 
- Mais de duas alternativas: Códigos Alocados; Dicotômicas Múltiplas, 
Proxies 
Exemplo: Padrão de Acabamento 
Padrão Baixo Normal Alto 
 
Pesos 1 2 3 
3a Opção: assumindo o CUB como uma proxy 
Padrão Baixo Normal Alto 
 
CUB 
Dados Área Distância CUB PU/m² 
1 120 10 Baixo 777,00 
2 100 7 Alto 1300,00 
3 73 5 Alto 1500,00 
4 105 8 Alto 1079,00 
5 116 12 Baixo 897,00 
6 128 14 Baixo 637,00 
7 112 13 Baixo 807,00 
8 90 3 Alto 1555,00 
9 85 6 Normal 1200,00 
10 95 15 Normal 1000,00 
11 82 9 Normal 1043,00 
12 64 6 Normal 1321,00 
13 68 4 Alto 1654,00 
14 95 5 Normal 1112,00 
Verifique 
1 - Análise exploratória dos dados - Dispersão 
2 - Intervalo de confiança para a média dos preços. a = 20% 
3 - Matriz de correlações 
4 – O modelo de avaliação e a significância ao nível 5% 
5 - Erro padrão do modelo 
6 - Se as variáveis podem ser utilizadas para explicar o 
 preço considerando o nível de 10% 
7 - Estimar o valor de um imóvel com 95 m² ,8 km, normal 
8 - Intervalo de confiança para a estimativa do preço 
9 - Enquadramento da avaliação segundo o grau de precisão. 
10- Enquadramento Global 
 
Exercício 
Para avaliação de um apartamento foram coletados os dados da tabela a seguir, compostos 
pela área privativa em m2, distância em km e preço unitário por m2. 
9 
Y i 
X 
X 
e i 
LINEARIZAÇÃO 
- Falta de Lineridade 
 
- Variância não constante para o erro 
X i 
e 
i 
Escala adequada para a variável 
10 
Z = bo + b1 . A 
Mercado com Tendência Hiperbólica 
A 
P 
Escala Original 
A 
Z= 
1 
p 
Transformación Inversa en P 
 1_____ 
 bo + b1 A 
P = 
1 
P 
= bo + b1 . A 
MEDIDAS CORRETIVAS 
- Observar a tendência do mercado 
 
- Linearizar os dados utilizando-se a 
transformação inversa ou incluindo-se 
termos de interação ou de ordem superior 
 
11 
Função Exponencial 
Gráficos 
Modelo Original 
Y = a  e bx 
Modelo Linearizado 
Lny = Ln a + bx 
Obs.: b indica a taxa de variação de y em relação à x 
a 
a e b 
y 
x 1 
b >0 
y 
x 
b < 0 
Ex: Considere o modelo: Pu = 300 * 1,05Andar 
 
Interpretação: Pu cresce 5% a cada Andar mais elevado 
Função Potencial 
Gráficos 
Modelo Original 
Y = a  x b 
Modelo Linearizado 
Lny = Lna + bLnx 
Obs.: b indica a elasticidade de y em relação à x, ou seja: e = dy/y / dx/x 
 
y 
x 1 
a 
b > 1 
b = 0 
0 < b < 1 
y 
1 
a 
x 
-1 < b < 0 
b = -1 
b < -1 
Ex: Considere o modelo: Pu = 300 * Área ( -0,5 ) 
 
Interpretação: Quando a área aumenta 10%, Pu decresce 5% (0,5*10%) 
12 
A HIPÓTESES BÁSICAS DO MODELO CLÁSSICO 
DE REGRESSÃO 
PRIMEIRA HIPÓTESE: 
 
As variáveis independentes correspondem a números reais sem nenhuma 
perturbação aleatória. 
SEGUNDA HIPÓTESE: 
 
O número de observações, n, deve ser superior ao número de parâmetros 
estimadospelo modelo. 
A NBR 14.653-2: 2011: 
 
•n  3 (k + 1) 
•para n ≤ 30, ni  3 
•para 30 < n ≤ 100, ni  10% n 
•para n > 100, ni  10 
 
Onde ni é o número de dados de mesma característica, no caso de utilização de variáveis 
dicotômicas e variáveis qualitativas expressas por códigos alocados ou códigos ajustados; 
TERCEIRA HIPÓTESE: 
 
Os erros são variáveis aleatórias com valor esperado nulo e variância 
constante. 
 
e i 
Y i 
<
 
O 
Modelo Heterocedástico 
 ( variância crescente ) 
Y i 
<
 
e 
i 
O 
Modelo Homocedástico 
( variância constante ) 
 
Testes Formais: White, Breush-Pagan; Park. 
13 
QUARTA HIPÓTESE 
 
Os erros são variáveis aleatórias com distribuição normal. 
Intervalo abrangido pelos resíduos padronizados = e i / se 
 
- 68% entre  -1; + 1  
 
- 90% entre  -1,64; + 1,64  
 
- 95% entre  -1,96 ; + 1,96 . 
e
*
i
Testes Formais: Jarque-Bera; Kolmogorov-Smirnov. 
 
 
 
Quinta Hipótese 
 
Os erros são não correlacionados, isto é, são independentes sob a condição 
de normalidade. 
 
 
- Não autocorrelação serial - Autocorrelação serial 
 
A autocorrelação nos resíduos pode ser: 
 
• Serial 
• Temporal 
• Espacial 
 
Teste Formal: Durbin-Watson 
14 
Autocorrelação Espacial 
Espacialmente aleatórios Espacialmente dependentes 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
- 
Situação A 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
- 
Situação B 
Testes Formais: Moran I e LM. 
e 
i 
Y i 
<
 
+
2 
0 
-2 
OUTLIER 
OUTLIER 
PONTOS ATÍPICOS 
Outlier 
* 
15 
e 
i 
Y i 
<
 
+2 
0 
-2 
-1 
+1 
* 
e 
i 
Y i 
<
 
+2 
0 
-2 
-1 
+1 
* 
16 
X 
. . . . . . 
Reta 1 
Reta 2 
e 
Y 
<
 
PONTOS INFLUENCIANTES 
Testes Formais: Distância de Cook; DFFITS 
Y 
e 
i 
Y i 
<
 
0 
Formação de Clusters 
* 
17 
Y 
X 
Reta 1 
Y 
X 
Reta 1 
Reta 2 
Homogeneidade Espacial 
Errado Certo 
Y 
X 
Heterogeneidade Espacial 
Reta 1 
Y 
X 
Reta 2 
Reta 1 
Reta 2 
Errado Certo 
18 
19 
20

Outros materiais