Buscar

avaliacao de imoveis

Prévia do material em texto

AVALIAÇÃO DE IMÓVEIS PELO MÉTODO DOS MÍNIMOS 
QUADRADOS
Carlos Aurélio Nadal
Curitiba 
2008
Carlos Aurélio Nadal
Engenheiro Civil
UNIVERSIDADE FEDERAL DO PARANÁ
SETOR DE CIÊNCIAS DA TERRA
DEPARTAMENTO DE GEOMÁTICA
Mestre em Ciências Geodésicas
Doutor em Ciências Geodésicas
Professor Titular do Departamento de Geomática da UFPR.
Catalogação na Fonte
Tania Barros Bággio
CRB - 9/760
Nadal, Carlos A.
 Avaliação de imóveis pelo método dos mínimos 
quadrados/Carlos A. Nadal. 1a Ed. Curitiba, Departamento de 
Geomática- UFPr: 2008.
49p,:il.
Inclui bibliografia
1. Avaliações. 2.Método dos mínimos quadrados. 3. Inferência
Estatística. 4. Terrenos urbanos. I. Título
CDD 20 - 526.6
SUMÁRIO
TÓPICO PÁGINA
1. INTRODUÇÃO 04
2
2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS 06
3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES 12
4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR EM 
AVALIAÇÕES DE BENS 16
 4.1 Regressão Linear Simples 16
 4.2 Validação de uma regressão linear simples 23
 4.2.1 Coeficiente de correlação (r) 23
 4.2.2 Coeficiente de Determinação 24
 4.2.3 Erro padrão da estimativa 24
 4.2.4 Análise de variância 24
 4.2.5 Teste de hipótese para o regressor b 25
 4.2.6 Intervalo de confiança para b 26
 4.3 Regressões simples não lineares 26
 4.3.1 Função logaritmica 26
 4.3.2 Função exponencial 26
 4.3.1 Função potencial 26
5. EXERCICIO DE REGRESSÃO SIMPLES 27
6. REGRESSÕES LINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE 
BENS 35
 6.1. Testes estatísticos como diretrizes em análise de 
ajustamento de regressões múltiplas 37
7. EXERCICIO DE REGRESSÃO LINEAR MULTIPLA 42
REFERÊNCIAS 51
1. INTRODUÇÃO
O conceito de avaliação imobiliária pode ser entendido como a estimativa do 
valor de um bem, ou seja, o valor mais provável pelo qual o mesmo possa ser objeto 
de transação no mercado em que está inserido. A norma brasileira NBR 14653- 1 
3
Avaliação de bens, em sua parte 1 (ABNT,2001), que dita os procedimentos gerais 
para avaliações prescreve como metodologia os métodos: método comparativo de 
dados do mercado, método involutivo, método evolutivo e método da capitalização 
da renda.
No Método Comparativo de Dados de Mercado, que será o principal objetivo 
deste trabalho, o valor de mercado dos imóveis é estimado com base nos preços de 
um grupo de propriedades semelhantes ao bem avaliando transacionadas no 
mercado imobiliário em um período próximo a data da avaliação. Este método é, 
indiscutivelmente, o mais empregado em avaliações de imóveis, sendo que para a 
sua aplicação existem alguns requisitos básicos, entre os quais o fato de que é 
imprescindível a existência de bens semelhantes ao avaliando que tenham sido 
comercializados próximos à data da avaliação. Além disso, o avaliador necessita ter 
acesso às informações sobre as condições das transações e as características dos 
bens transacionados. Quanto menos comparáveis os elementos tomados como 
referência, menor será a confiabilidade da avaliação (MILLINGTON, 1994). 
Devido principalmente à heterogeneidade dos imóveis oferecidos pelo 
mercado imobiliário, torna- se impossível a comparação direta de preços, mesmo no 
caso de imóveis semelhantes ao do imóvel a ser avaliado, pois ainda assim, 
existirão fatores que diferenciam os imóveis entre si, ou as condições de cada 
transação. Assim, por exemplo suponha que são ofertadas casas iguais em um 
condomínio fechado, seus valores podem ser diferentes por exemplo em razão da 
inflação.
Pelos motivos acima expostos, é necessário aplicar uma técnica que permita 
ajustar estas diferenças. A análise de regressão múltipla, que é uma técnica de 
inferência estatística, vem sendo amplamente empregada para identificar os 
principais fatores que influenciam a determinação dos preços de imóveis e estimar o 
valor de mercado das propriedades, tanto nos casos de avaliações individuais 
quanto nas avaliações em massa. 
A avaliação de imóveis é utilizada na grande maioria dos negócios, 
discussões e pendências interpessoais e sociais em nossas comunidades, tais como 
na compra ou na venda de casas, lojas comerciais, instalações industriais, aluguéis, 
na reavaliação de ativos de empresas, em atendimento à legislação vigente, na 
partilha oriunda de heranças, meações ou divórcios, no lançamento de impostos, 
nas hipotecas imobiliárias, nas divergências que originam ações demarcatórias, 
possessórias, nas indenizações, nas desapropriações e servidões, enfim, em um 
número expressivo de ações oriundas de problemas inerentes aos relacionamentos 
humanos, onde o valor de um bem assume importância fundamental. 
Nas funções públicas, o Engenheiro encontra grande aplicabilidade na 
avaliação de bens, principalmente na definição do valor dos aluguéis a ser recebido 
pelos bens públicos, na definição de valores a serem pagos como aluguéis, 
compras, desapropriações, entre outras.
Apesar do conceito de valor ser de difícil definição, sujeito e suscetível às 
mudanças filosóficas, torna- se importante no relacionamento humano e social 
adotar- se alguns critérios para que se exerça um caráter de justiça em sua 
aplicação prática. Assim, um trabalho de avaliação imobiliária constitui - se de uma 
seqüência de operações que resultam no que poderia ser chamado de uma 
“formação de juízo” sobre o valor de um imóvel ou um direito sobre ele. 
O conceito de que o valor é aquele fornecido para um dado instante, único, 
não importando qual a finalidade da avaliação. Esse valor corresponde ao preço que 
se definiria, para um determinado imóvel, em um mercado de concorrência perfeito, 
sujeito às seguintes premissas: 
a) homogeneidade dos bens levados a mercado; 
4
b) números elevados de compradores e vendedores (o mercado não pode por 
eles ser alterado); 
c) sem influência externa; 
d) conhecimento pleno e absolutos sobre o mercado, sobre os bens e das 
tendências de avaliação por parte dos compradores e vendedores; 
e) vendedores e compradores oferecendo liquidez com liberdade plena de 
entrada e saída do mercado.
A determinação do valor é de grande interesse para os agentes do mercado 
mobiliário, servindo para apoiar a tomada de decisão em diferentes áreas, tais 
como: operações de garantia no sistema financeiro, transações de compra e venda, 
transações de locação, decisões judiciais, tributação de imóveis urbanos e decisões 
de investimento (DANTAS, 1998). 
Os trabalhos de avaliações foram ampliados com a aprovação do Estatuto da 
Cidade, lei federal na qual diferentes instrumentos de política urbana são 
regulamentados, entre os quais o solo criado, a transferência de potencial 
construtivo e a aplicação do Imposto sobre a Propriedade Predial e Territorial 
Urbana (IPTU) com alíquotas progressivas no tempo, visando ao cumprimento da 
função social da propriedade. Para garantir a eficácia na aplicação de qualquer 
destes instrumentos é necessário que sejam obtidas estimativas precisas sobre o 
valor de mercado dos imóveis. 
Como discutido por De Cesare (2000a), as falhas no processo avaliatório 
podem ser geradas pelo uso de métodos inadequados para o estudo em questão,pelas limitações das técnicas empregadas, pela omissão de atributos importantes 
no processo de valoração, ou ainda pela falta de compreensão do avaliador do 
fenômeno em análise. Como conseqüência destas falhas, podem ser citados os 
seguintes exemplos: 
a) venda de um bem por preço abaixo do seu valor ou a sua exposição 
no mercado por um período maior do que o necessário trazendo 
prejuízos financeiros ao vendedor. 
b) Avaliações em desapropriações podem ser estabelecidas por preços 
acima ou abaixo do valor de mercado, causando a dilapidação do 
patrimônio privado, partilhas podem ser realizadas de forma a 
beneficiar involuntariamente uma ou mais das partes envolvidas, ou 
o enriquecimento indevido de proprietários privados com recursos 
públicos. 
c) Injustiças na distribuição da carga tributária. 
Para minimizar os erros e as distorções no processo avaliatório, é 
imprescindível saber quais são os principais atributos que influenciam a formação 
do valor dos imóveis e a forma de interação entre os mesmos. 
Enfim, a impossibilidade de considerar e mesmo de identificar todos os 
atributos que influenciam o valor de um bem e a inexatidão contida na mensuração 
dos atributos determinantes para a formação do valor estão entre as principais 
razões pelas quais o valor revela- se como uma função aleatória. 
Variações na intensidade de motivações, preferências, aspirações e 
expectativas, resultam em variações de caráter aleatório nos preços praticados no 
mercado.
Existem, inclusive, diferenças no nível de informação entre compradores e 
vendedores que participam do mercado de forma não freqüente, como 
conseqüência os preços de transações resultam de negociações individuais entre 
compradores e vendedores.
2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS
5
Neste trabalho, não se pretende discorrer teoricamente sobre estatística, mas 
somente utilizar- se de conceitos desta ciência com a finalidade de aplicá- los a 
casos de avaliações de imóveis.
Durante um processo de medição, entendendo- se com tal a obtenção de uma 
medida sem correções, que pode ser denominada de observação, incorre- se aos 
inevitáveis erros de observação.
Denomina- se dado ao resultado do tratamento de uma observação (por 
aplicação de uma técnica ou de um modelo matemático) para retirada de erros 
sistemáticos.
A informação é o resultado do tratamento de dados (via modelo 
matemático/estatístico).
Por exemplo, na avaliação de bens, quando obtemos o valor do aluguel de 
um imóvel, temos uma observação, ao efetuarmos uma vistoria no imóvel, para 
confirmação da existência, das condições e da validação do valor obtido, esta 
observação transforma- se em dado, e após a aplicação de inferência estatística 
pode ser denominada de informação que é o resultado da avaliação. Ao consumidor 
final, ao gestor público, ao interessado em um processo, interessa 
fundamentalmente a informação e sua validação.
A NBR-14653- 1 (ABNT,2001) traz algumas definições importantes do ponto 
de vista estatístico:
amostra: Conjunto de dados de mercado representativos de uma população.
amostragem: Procedimento utilizado para constituir uma amostra.
dado de mercado: Conjunto de informações coletadas no mercado relacionadas a 
um determinado bem.
tratamento de dados: Aplicação de operações que expressem, em termos relativos, 
as diferenças de atributos entre os dados de mercado e os do bem avaliando.
Também, interessa- nos de perto o conceito de resolução, que pode ser 
adaptado da metrologia industrial onde é definido como o menor valor de uma 
medida que um instrumento fornece, já para a avaliação de imóveis, entendendo-
se como tal a capacidade de separação de observações. É fácil observar que uma 
régua de desenho, graduada no milímetro tem resolução de 1mm, ou seja a melhor 
medida que pode ser efetivada com esta é da ordem do milímetro. Ao aumentar- se 
a resolução instrumental, melhora- se a separação das observações. Assim por 
exemplo, a medida que aumentam- se as variáveis observadas num imóvel, por 
exemplo, número de vagas de garagens, existência ou não de suíte, distância ao 
centro comercial, etc., a observação vai sendo diferenciada de outra. 
Na teoria das medidas o conceito de Exatidão , pode ser entendida como o 
verdadeiro valor de uma grandeza, é, no entanto, uma utopia, pois todas as 
medidas são eivadas de erros. Assim um resultado pode ter precisão, termo que 
tem como significado o indicativo de repetibilidade dos resultados, sendo 
geralmente mostrado como o desvio padrão de uma medida. A acurácia ou 
acuracidade demonstra o quanto uma medida tendeu à exatidão. Na figura 1 
demonstram- se estes conceitos através de tiros efetivados em um alvo. 
Comparando- se as duas imagens situadas a esquerda da figura, denominadas de 
baixa resolução e alta resolução, nota- se que as quatro marcas deixadas nos alvos 
seriam pontuadas diferentemente nestes desenho, demonstrando que ao aumentar-
se a resolução (maior número de círculos concêntricos) separa- se as marcas. Na 
imagem situada no canto superior direito mostram- se marcas concentradas, porem 
distantes da “mosca”, trata- se portanto de precisão, resultando em informações 
com desvio padrão de pequena magnitude, já a imagem no canto inferior direito 
6
traz as marcas concentradas e localizadas no centro do alvo, trata- se de 
observações com precisão e acuracia (quase exatas).
Como já havíamos afirmado, todas as observações são eivadas de erros. Os 
erros podem ser classificados como: grosseiros ou faltas, sistemáticos e acidentais. 
Os erros grosseiros são aqueles oriundos de falhas, falta de atenção do 
observador e do mau funcionamento de um instrumento, deve ser evitado, pois é de 
difícil detecção após as medidas, um exemplo deste erro é um erro de anotação 
onde há a inversão de dígitos; deveria ser anotado 25 e anotou- se 52. Em 
avaliações, por exemplo, utiliza- se na amostra um imóvel que está sendo alugado 
por um preço muito superior ao do mercado. O avaliador não prestou atenção no 
intervalo de tempo que esta ofertado no mercado (está para alugar a mais de um 
ano), este fato pode configurar um erro grosseiro.
Os erros sistemáticos são produzidos por causas conhecidas, podem ser 
evitados por técnicas especiais de observações ou podem ser modelados 
matematicamente e eliminados das observações, um exemplo deste tipo de erro é o 
devido à dilatação térmica de uma trena, o erro de calibração de um distânciometro, 
etc. No caso de avaliações, por exemplo, utilizaram- se muitos dados na amostra de 
uma mesma origem (apartamentos para alugar de uma mesma imobiliária que 
tende a ter os preços superiores ao do mercado).
Os erros acidentais ocorrem de maneira aleatória e devem ser tratados 
estatisticamente.
O ajustamento de observações diz respeito a minimização dos erros 
acidentais das medidas, com a utilização do método dos mínimos quadrados o qual 
tem como fundamento: a soma dos quadrados dos resíduos é mínima [Gemael, 
1994].
7
 Baixa resolução Precisão
Alta resolução Acurácia
Figura 1 – Resolução, precisão acurácia [Andrade, 1998].
Outra definição muito utilizada nasnormas é a de tolerância que pode ser 
definida como o erro máximo acidental admissível, geralmente adotado com ±3σ.
Utilizando- se o método dos mínimos quadrados, pode- se proceder a 
propagação de erros acidentais, denominada de propagação de variâncias. Seja F 
uma função de várias medidas independentes m 1, m 2, m 3, ..., m k e assumindo- se 
que os erros médios quadráticos (desvios padrões) são conhecidos, e que as 
medidas estão livres de erros grosseiros e erros sistemáticos, o erro médio 
quadrático de F (σF) segue a seguinte lei de propagação [Chrzanowski, 1977]:
Analisando- se esta lei conclui- se que os erros não de propagam linearmente.
Utiliza- se em avaliações de imóveis a teoria da estimação, que é o processo 
que usa resultados extraídos da amostra para produzir inferências sobre a 
população da qual foi extraída aleatoriamente a amostra.
A inferência estatística é o método que parte do particular para o geral, ou 
seja, o processo pelo qual são feitas generalizações para a população a partir da 
amostra.
A estimação pode ser subdividida em dois tipos: a estimação por ponto que é 
aquela que a partir da amostra, procura obter um valor único para um certo 
parâmetro populacional e a estimação por intervalo que é aquela em que a 
estimativa de um parâmetro populacional é dada por dois números, entre os quais 
pode- se considerar que ele esteja situado. Um exemplo de estimativa pontual é a 
média amostral quando utilizada para representar a média populacional. A 
estimativa por intervalo pode ser representada pela média associada ao desvio 
padrão, por exemplo a distância medida de 20,153m ± 0,150m, significando qua a 
distância esta compreendida entre os valores 20,003m e 20,303m.
Tem importância fundamental neste estudo as principais qualidades de um 
estimador, quais sejam: não tendenciosidade, consistência e eficiência.
Interessa- nos de perto a denominada estatística descritiva. 
Os principais medidores de tendência central de uma amostra são: a média, a 
mediana e a moda. Denomina- se média a uma medida de tendência central 
resultante da divisão do somatório das observações dividido pelo número destas:
 Σ x i
 = ū  (2.1)
 n 
Onde: = média aritméticaū
 x 1, x 2,.... x n = observações
 n = número de observações
geralmente, a média aritmética é utilizada para dados não agrupados ou para dados 
de mesma confiabilidade.
No caso de utilizar- se dados agrupados ou de diferentes confiabilidades 
pode ser utilizada a média ponderada:
8
( ) ( ) ( ) ( ) ( ) ... ( ) ( )σ ∂∂ σ
∂
∂ σ
∂
∂ σF k k
F
m
m
F
m
m
F
m
m
2
1
2
1
2
2
2
2
2 2 2
= + + +
 Σ p i x i
 = ū  (2.2)
 Σ p i 
Onde p é o peso de uma observação.
A Mediana (Md) é o valor que divide uma série ordenada de observações de 
modo que o número de itens acima desse valor é igual ao número de itens abaixo. 
Se a amostra contiver um número ímpar de dados, a mediana corresponde ao valor 
do ponto médio; se contiver número par de dados a mediana é igual a média dos 
dois valores dos pontos médios.
 A Moda (Mo) é o valor com freqüência máxima (pode não existir ou haver 
mais de um valor).
As medidas de dispersão, são baseadas nas medidas da amplitude, variância, 
desvio padrão, quartil, percentil, assimetria e curtose.
A amplitude é obtida pela diferença entre os valores correspondentes ao valor 
máximo (xmáx) e mínimo (xmin) de uma observação:
A = x máx - xmin (2.3)
A variância é dada pela expressão:
 Σ v. v
σ2 =  (2.4)
 n – 1
onde v é denominado de resíduo e, é definido como:
v = x i – ū
O desvio padrão ou o erro médio quadrático da média é obtido pela raiz 
quadrada da variância.
O erro médio quadrático de uma observação isolada é dado pela expressão:
e = σ. n –1/2 (2.5)
O quartil pode ser definido como qualquer um dos três valores que divide o 
conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 
1/4 da amostra ou população. Assim, no caso duma amostra ordenada tem- se:
a) primeiro quartil (Q1/4 ) , ou quartil inferior que corresponde ao valor aos 25% da 
amostra ordenada, também denominado de 25º percentil .
b) segundo quartil (Q2/4 ) , corresponde a mediana e corresponde ao valor até ao 
qual se encontra 50% da amostra ordenada também denominado de 50º percentil .
c) terceiro quartil (Q3/4 ) , ou quartil superior é o valor a partir do qual se encontram 
25% dos valores mais elevados ou corresponde ao valor de 75% da amostra 
ordenada, denominado de 75º percentil .
A diferença entre os quartis superior e inferior chama- se amplitude inter-
quartil .
Um percentil é uma medida da posição relativa de uma unidade 
obsservacional em relação a todas as outras. O p- ésimo porcentil tem no mínimo 
p% dos valores abaixo daquele ponto e no mínimo (100 - p)% dos valores acima.
Entende- se por Assimetria , as medidas que possibilitam analisar uma 
distribuição de acordo com as relações entre suas medidas de moda, média e 
9
mediana, quando observadas graficamente. Uma distribuição é dita simétrica 
quando apresenta o mesmo valor para a moda, a média e a mediana. Ou seja 
assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de 
simetria. Este afastamento pode acontecer do lado esquerdo ou do lado direito da 
distribuição, chamado de assimetria negativa ou positiva respectivamente.
Figura 2 – Distribuição com curva assimétrica negativa
A assimetria pode ser calculada pela expressão:
 - Moū
AS =  (2.6)
 σ
Quando: AS = 0 distribuição simétrica; 
 AS > 0 distribuição assimétrica positiva; 
 AS < 0 distribuição assimétrica negativa.
Curtose é o grau de achatamento da distribuição. Ou o quanto uma curva de 
freqüência será achatada em relação a uma curva normal de referência. 
Para o cálculo do grau de curtose de uma distribuição utiliza- se o coeficiente 
de curtose (ou coeficiente percentílico de curtose) 
(Q3/4 – Q1/4 ) 
K =  (2.7)
2 . (P90 – P10)
onde: Q3/4 e Q1/4 são o terceiro e primeiro quartil e P90 e P10 são o décimo e 
nonagésimo. 
Quanto a curtose a distribuição pode ser: mesocúrtica ou normal, ou seja, 
nem achatada, nem alongada com K = 0,263,p ou achatada com k > 0,263 e 
leptocúrtica ou alongada, com k < 0,263.
Outra forma de se medir a dispersão de forma relativa é obtida com o 
coeficiente de variação (CV). A principal característica do CV é que este elimina o 
efeito da magnitude dos dados e exprime a variabilidade em relação a média, é 
dado pela expressão:
σ
CV =  100% (2.8)
10
x
i
f
i
Mo Md ū
Eixo d e 
Cau d a d esviad a 
p ara
esqu erd a
ū
É importante, em avaliações a estimação por intervalos, na qual constrói - se 
um intervalo em torno da estimativa por ponto, de modo que esse intervalo tenha 
uma probabilidade conhecida de conter o verdadeiro valor do parâmetro (Marques, 
2000), assim:
P (Φ1 u ≤ ≤ Φ2) = 1 - α (2.9)
 Onde:
Intervalo de confiança: Φ1 u ≤ ≤ Φ2
Limites de confiança: Φ1 e Φ2
Nível de confiança: 1 - α
A escolha do nível de confiançadepende da precisão com que desejamos 
estimar o parâmetro, sendo muito comum a utilização dos níveis 95% e 99%. O 
aumento de confiança no intervalo, implica no aumento de sua amplitude.
Convém também discutir as hipóteses estatísticas, que são suposições que 
fazemos a cerca dos parâmetros de uma população, ao tentar a fixação de decisões. 
Essas suposições poderão ser verdadeiras ou não. A hipótese pode ser simples se 
corresponder a um único valor do parâmetro ou composta.
A denominada hipótese nula (Ho) ou básica é a hipótese a ser validade pelo 
teste, sendo que o teste de hipótese estatística é um procedimento estatístico que 
mediante observações amostrais, permite decidir o aceite ou a rejeição da hipótese 
nula. A denominada hipótese alternativa (H1) é aquela contrária a hipótese nula. 
Deve- se observar que indica- se claramente qual é a Ho, e qual é a H1, pois aceitar a 
primeira, significa rejeitar a segunda e vice- versa.
Para compreender cientificamente o assunto sugere- se os livros 
especializados de estatística, por exemplo, Marques (2000).
O teste de hipóteses é utilizado na avaliação para validar os resultados 
obtidos.
11
3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES
Verificar estatisticamente a amostra a seguir, supondo- se que foram 
recolhidas observações de 20 apartamentos com dois quartos, colocados para 
alugar no centro de Curitiba, todos semelhantes, com 1 vaga na garagem.
Na tabela abaixo mostram- se os valores unitários obtidos em R$/m 2 não 
tabulados
6,47 6,59 8,96 7,65
7,22 7,09 6,88 8,06
6,55 7,19 6,78 8,16
6,88 7,25 6,88 8,00
6,94 6,88 7,22 8,11
1) Calculo dos indicadores de tendência central
Utilizando a tabela a seguir, retirada de planilha eletrônica
observaçõe
s valor desvio
desvio 
ao
 R$/m2 v
quadrad
o
1
6,47
- 0,818
0,66912
4
2
7,22
- 0,068
0,00462
4
3
6,55
- 0,738
0,54464
4
4
6,88
- 0,408
0,16646
4
5
6,94
- 0,348
0,12110
4
6
6,59
- 0,698
0,48720
4
7
7,09
- 0,198
0,03920
4
8
7,19
- 0,098
0,00960
4
9
7,25
- 0,038
0,00144
4
10
6,88
- 0,408
0,16646
4
11
8,96
1,672
2,79558
4
12
6,88
- 0,408
0,16646
4
13
6,78
- 0,508
0,25806
4
14
6,88
- 0,408
0,16646
4
15
7,22
- 0,068
0,00462
4
12
16
7,65
0,362
0,13104
4
17
8,06
0,772
0,59598
4
18
8,16
0,872
0,76038
4
19
8
0,712
0,50694
4
20
8,11
0,822
0,67568
4
soma 145,76
1,33227E-
14 8,27112
1.1) Média aritmética (utilizando a expressão 2.1).
 Σ x i 145,76
 = ū  =  ∴ =ū 7,29 R$/m 2
 n 20
1.2) Mediana
Para o cálculo da mediana os valores devem ser ordenados.
6,47 6,55 6,59 6,78
6,88 6,88 6,88 6,88
6,94 7,09 7,19 7,22
7,22 7,25 7,65 8,00
8,06 8,11 8,16 8,96
Como tem- se um número par de dados
 7,09 + 7,19
Md =  = 7,14 R$/m 2
 2
1.3) Moda
Mo = 6,88 R$/m 2 (repete- se quatro vezes)
2) Cálculo das medidas de dispersão
2.1) Amplitude (calculada pela expressão 2.3)
A = x máx - xmin 
A = 8,96 – 6,55
A = 2,41 R$/m 2 
2.2) Variância (calculada pela expressão 2.4)
 Σ v. v 8,27112
σ2 =  = 
 n – 1 19
13
σ2 = 0,4353 (R$/m 2)2 
 2.3) Desvio padrão
σ = 0,66 R$/m 2 
 2.4) Erro médio quadrático de uma observação isolada (expressão 2.5)
e = σ. n –1/2 = 0,66 x 20 –1/2
e = 0,15 R$/m 2
 2.5) Primeiro, segundo e terceiro quartil
Q1/4 = 6,88 R$/m 2
Q2/4 = 7,09 R$/m 2
Q3/4 = 7,65 R$/m 2
2.6) Assimetria (expressão 2.6)
 – Mo 7,29 - 6,88ū
AS =  = 
σ 0,66
AS = 0,62 
Se AS > 0 a distribuição assimétrica positiva, isto é, a moda e a mediana são 
menores que a média.
2.7) Curtose (expressão 2.7)
Para aplicar essa expressão é necessário a obtenção dos valores dos percentis
P90 = 8,11
P10 = 6,55
 (Q3/4 – Q1/4 ) 7,65 - 6,88
K =  = 
2 . (P90 – P10) 2 x (8,11 – 6,55)
K = 0,25
Conclui- se que a distribuição será leptocúrtica ou alongada, pois k < 0,263.
2.8) Coeficiente de variação (expressão 2.8)
σ 0,66
CV =  100% = 100
 7,29ū
CV = 9%
14
2.9) Estimativa por intervalo de confiança da média
 σ σ
P[ - —— t ū α ≤ x i ≤ + —— t ū α ] = 1- α
 √n √n
Sendo 1- α denominado de nível de significância, usualmente igual a 95%. α = 
0,05
Na tabela de Student para n- 1 =19 (graus de liberdade) t 0,05 = 2,093 
 σ 0,66 
 - —— t ū α = 7,29 - ———— 2,093 = R$ 6,98
 √n √ 20
 σ 0,66 
 + —— t ū α= 7,29 + ———— 2,093 = R$ 7,60
 √n √ 20
Neste ponto pode- se analisar os dados e verificar aqueles que encontram- se 
no intervalo calculado. No caso desta amostra em particular teríamos muitos dados 
fora do intervalo calculado a este nível de probabilidade, o que poderia desqualificar 
a amostra.
Os valores acima podem ser calculados diretamente na planilha excel, 
acionando- se na barra principal “Ferramentas”, nesta escolhe- se “Analise de dados” 
e nesta escolhe- se “estatística descritiva”. Preenche- se o quadro de estatística 
descritiva, obtendo- se o resultado.
15
Na Planilha Excel o erro padrão é igual ao erro médio quadrático de uma 
observação isolada expressão (2.5).
A curtose pode ser avaliada da seguinte forma: se k= 0, distribuição normal, 
K > 0, mais pico que a normal (alongada) e k< 0, menos pico que a normal 
(achatada).
Se a assimetria AS= 0, dados simétricos, AS> 0, assimetria para direita ou 
positiva, e AS< 0, assimetria para esquerda ou negativa. Os resultados são 
semelhantes aos calculados anteriormente, apesar de usar parametrização 
diferente.
A partir da analise dos resultados pode- se tirar algumas conclusões sobre a 
amostra, como por exemplo, a representatividade da média, a qualidade das 
observações, etc.
Propõe- se ao leitor a confecção de histograma de freqüência absoluta e 
relativa.
4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR SIMPLES EM 
AVALIAÇÕES DE BENS
A regressão linear é utilizada em experimentos que procuram determinar a 
relação existente entre duas ou mais variáveis. Neste caso, podem ocorrer dois tipos 
de situação:
(a) uma variável (X) pode ser medida acuradamente e seu valor escolhido pelo 
experimentador. Por exemplo, a dose de uma droga a ser administrada no 
animal. Esta variável e chamada de variável independente. A outra variável 
(Y), chamada variável dependente ou resposta, está sujeita a erro 
experimental, e seu valor depende do valor escolhido para a variável 
independente. Assim, a resposta (Y) é uma variável dependente da variável 
independente (X). Este é o caso da regressão. Este mesmo caso ocorre 
quando a avaliações de bens.
(b) As duas variáveis estão sujeitas a erros experimentais, isto é, erros de 
natureza aleatória, inerentes ao experimento. Por exemplo, produção de 
leite e produção de gordura medidas em vacas em lactação. Este tipo de 
associação entre duas variáveis constitui o caso da correlação. 
16
Se o problema envolver somente duas variáveistem- se a aplicação de correlação e 
regressão simples, se no problema for envolvido mais de duas variáveis tem- se a 
correlação e regressão múltipla.
 
4.1 Regressão Linear Simples
O termo regressão é usado para designar a expressão que relaciona uma 
variável dependente (Y) em função de outra (X), considerada independente. Diz- se 
regressão de Y sobre X. Se a relação funcional entre elas é expressa por uma 
equação de 1º grau, cuja a representação geométrica é uma linha reta, a regressão é 
dita linear. 
Postulada a existência de uma relação linear entre duas variáveis, pode- se 
representar aquele conjunto de pontos pela equação da reta: 
yi = a + bx i, (4.1)
que expressa o valor de Y em função de X.
Y é a variável dependente ou regredida, ou resposta
X é a variável independente, ou regressora ou explanatória
a e b são constantes, a é o intercepto e expressa o valor de y quando x é 
zero e b é o coeficiente de regressão, coeficiente angular ou inclinação da reta.
Um caso específico é obtido para o caso da coordenadas x=0 fazendo com 
que y=a. Ja no caso de a=0 a reta corta a origem.
Da Geometria analítica o problema pode ser resolvido com uma única 
solução, a partir do conhecimento das coordenadas cartesianas de dois pontos. É o 
caso, por exemplo, da determinação da equação do valor de um imóvel, se não 
houvesse erros na amostragem, ou em um mercado perfeito. Neste caso os dois 
imóveis amostrados abaixo, representariam o mercado. Na figura 3 mostra- se 
esquematicamente o problema.
imóvel Área R$/m2
1 15
0
100
2 18
0
140
17
Figura 3 – Determinação da equação de uma reta 
 A partir dos dados, tem- se o seguinte sistema de equações:
140 = a + b x 180 
100 = a + b x 150
Resolvendo obtém- se:
a = - 100 (intercepto)
b = 1,333 (declividade) 
i = arc tg 1,33 (função arco tangente)
i = 53,06º 
Desta forma o modelo matemático adotado para este mercado seria:
 
 VALOR = - 100 + 1,333 X ÁREA DO IMÓVEL
Por exemplo, neste mercado um imóvel cuja área seja 200 m2 será avaliado 
por R$ 166,60/m 2.
No caso mais geral, o problema básico consiste em estimar os parâmetros a e 
b para que se conheça a equação da reta. Se a e b são estimados estatisticamente, 
a equação é estimada da reta poderá ser escrita como:
ii xbay +=ˆ (4.2)
O problema fundamental consiste em ajustar uma regressão linear simples, 
isto é, a equação de uma reta ajustada aos dados. 
Y
X
Y = a + b 
X
15
0
10
0
18
0
14
0
a
i
b = tg 
i
18
Figura 4 – Ajuste de uma reta 
Não se pode precisar qual das retas é a melhor para representar como 
modelo de regressão o problema. Na inferência estatística, procura- se o melhor 
ajuste da reta aos pontos com um critério estatístico que permita a determinação da 
confiabilidade do modelo adotado.
A descrição matemática é dada por:
 iii vXbaY ++= (4.3)
Assim, por exemplo tem- se na tabela abaixo o valor do aluguel em reais (Y) e 
a área de apartamentos em m 2 (X):
Y 487 510 480 625 490 555 612 498 530 490
X 95 84 102 135 92 89 122 95 100 88
487= a + 95b + v1
510= a + 84b + v2
480= a + 102b + v3
625= a + 135b + v4
490= a + 92b + v5
555= a + 89b + v6
612= a + 122b + v7
498= a + 95b + v8
530= a + 100b + v9
490= a + 88b + v10
Escrevendo estas equações na forma matricial:
500,00
550,00
600,00
650,00
700,00
750,00
800,00
850,00
900,00
950,00
1000,00
130 132 134 136 138 140
área dos imóveis
al
u
gu
el
19


















+




















=


















10
9
8
7
6
5
4
3
2
1
881
1001
951
1221
891
921
1351
1021
841
951
490
530
498
612
555
490
625
480
510
487
v
v
v
v
v
v
v
v
v
v
b
a
ou 
 Y =AX + V
Sendo que a, b e os 10 v´s são desconhecidos e não é possível conhece- los, 
apenas podemos obter suas estimativas.
O sistema matematicamente tem incompatibilidades pois apresenta infinitas 
soluções, não podendo ser calculado com uma única solução algebricamente, 
podendo- se obter de cada duas equações separadas uma solução.
Pode- se estimar a e b é por meio do Método dos Quadrados Mínimos , o 
qual consiste em minimizar a soma de quadrados dos desvios vi.
Como
 iii yyv ˆ−= . 
Sendo ii yy ˆ− a diferença entre o valor observado e o estimado pela equação 
de regressão para cada observação, procura- se, então, estimar a e b, de tal modo 
que 
min)ˆ( 2 =−∑ ii yy (4.4)
Portanto, 
- vi = a + bx i –yi
e,
v2i = (a + bx i –yi)2
Os desvios de Y´s observados para a linha ajustada YYi ˆ− , ou resíduos, 
podem ser considerados como estimativas dos erros verdadeiros.
Para os erros verdadeiros assume- se importantes suposições:
1) Todos têm média igual a zero;
2) Todos têm a mesma variância σ2e; (homogeneidade de variâncias)
3) Todos são não correlacionados;
A soma dos quadrados dos desvios será:
SQR = Σ( a + bx i –yi)2
20
Para tornar mínima esta soma, quando variam a e b, devemos igualar a zero 
as derivadas parciais:
0=
∂
∂
a
SQR
 e 0=∂
∂
b
SQR
Obtemos
( )∑ −+=∂
∂
ii ybxa2
a
SQR
( ) iii xybxa2b
SQR ∑ −+=∂
∂
 Σ ( a + bx i –yi) = 0
 Σ ( a + bx i –yi) x i = 0
a e b são obtidos pelas das equações normais:
 na + bΣx i = Σyi
 aΣx i + bΣx 2i = Σx iyi 
que produzem
( ) ( ) ( ) ( )
( )∑ ∑−
∑∑−∑∑
= 2
i
2
i
iii
2
ii
xxn
yxxxy
a (4.5)
( ) ( )
( )∑ ∑−
∑∑−∑
= 2
i
2
i
iiii
xxn
yxyxnb (4.6)
A obtenção de a se dá mediante a divisão da equação 
na + bΣx i = Σyi 
por n
 
n
y
n
xb
a ii
∑
=
∑
+
 
n
xb
n
y
a ii
∑
−
∑
=
 
xbya −= (4.7)
Da equação 4.7, pode- se tirar duas conclusões:
 a) O ponto determinado pelas médias das variáveis ( )y,x está contido na reta de 
regressão;
b) As diferenças yy − , ou seja, os desvios acima e abaixo de Y podem ser 
determinados por ( )xxb −
Assim, 
)xx(byy −=−
 
)xx(byy −+=
21
Partindo da equação:
 
)xx(byy −=−
e sem alterar a igualdade, multiplicamos por ( )xx − , seus dois membros:
 
2)xx(b)yy()xx( −=−−
 
esta equação se refere ao desvio de um determinado valor de Y em relação a média 
Y , assim:
 ∑ −=∑ −− 2)xx(b)yy()xx(
 ∑ −
∑ −−
= 2)xx(
)yy()xx(b = quadradosdesoma
produtosdesoma
dividindo- se o numerador e o denominador de b por n- 1, vê- se que
[ ]
1
)(
1
)()(),(
22
−
∑ −
−
∑ −−
==
n
xx
n
yyxx
s
YXCovb
X
b é denominado coeficiente de regressão de Y em X; 
podemos escrever a soma de quadrados de X da seguinte forma:
 ( )
n
x
xxxi
∑
−∑∑ =−
2
22 )(
e a soma de produtos (numerador) pode ser desenvolvida:
∑ +−−=∑ −− )yxyxyxxy()yy()xx(
 ∑ ∑ ∑ +−−= yxnyxxyxy
 2n
yxn
n
yx
n
yx
xy ∑∑+∑∑−∑ ∑∑−=
 ∑ ∑∑−=
n
yx
xy
 ∑ −= yxnxy
então
n
x
x
n
yx
xy
b ∑∑
∑ ∑∑
−
−
= 2
2 )(
 
ou 
nx
x
yxnxy
b ∑∑
∑
−
−
= 2
2 )(
22
Se dividirmos tanto o denominador como o numerador por n a fórmula de b 
não ficará alterada.
Porém o denominador passará a indicar a variância de X pois:
 
N
XX
X
∑ −
=
2
2 )(σ
e o numerador se constituirá o que se denomina de covariância, isto é, a 
variabilidade média das variáveis X e Y analisadas simultaneamente:
N
YYXX
Cov XYYX
∑ −−
==
))((
,
σ
2
,
X
YXCovb
σ
==
A variância de X é estimada por 
1
)( 22
−
−
=
∑
n
xx
sX
E a covariância de x e y é estimada por 
1
))((
,
−
−−
=
∑
n
yyxx
Cov YX
22
,
)1( xX
YX
sn
yxnxy
s
Cov
b
−
−
===
∑
Quando se constata que o coeficiente de regressão de uma variável sobre outra 
não difere significativamente de zero, significa que os dois caracteres em estudo 
não estão relacionados.
Quando b difere significativamente de zero, seja b<0 ou b>0, existe 
associação entre os dois caracteres quantitativos.
Quando b>0 as variáveis em estudo estão correlacionadas positivamente; o 
valor de uma variável aumentará com o aumento da outra e diminuirá com a 
diminuição da outra.
Quando b<0, as variáveis estão correlacionadas negativamente, portanto 
variam em sentidos opostos.
Estes últimos conceitos podem ser visualizados no exemplo abaixo:
Y 900 850 850 860 870 880 890 1000
X 132 122 112 125 98 114 120 152
875,121=x
 
5,887=y
4346,2
8
)975(120581
)5,887)(875,121(8869580
)( 222
=
−
−
=
−
−
= ∑∑
∑ x
n
x
x
yxnxy
b
xbya −= = 887,5- 2,4346 (121,875) = 590,7866
Portanto:
y = 590,7866 + 2,4346 x
23
4.2 Validação de uma regressão linear simples
4.2.1 Coeficiente de correlação (r)
O coeficiente de correlação traduz numericamente o quanto as variaveis estão 
relacionadas entre si. O coeficiente de correlação está compreendido no intervalo:
- 1 ≤ r ≤ +1
Quando o sinal de r é positivo as variaveis variam no mesmo sentido, ou seja 
um incremento positivo da variavel explicativa implica num incremento positivo na 
variavel explicada, já o sinal negativo implica numa variação oposta. Se r = 0, 
conclui - se que não existe correlação entre as variaveis.
De forma pratica pode- se interpretar o coeficiente de correlação conforme a 
tabela a seguir (IMAPE,1998):
r = 0 correlação nula
0 ≤ r ≤ 0,30 correlação fraca
0,30 ≤ r ≤ 0,60 correlação média
0,60 ≤ r ≤ 0,90 correlação forte
0,90 ≤ r ≤ 0,99 correlação fortissima
r =1 correlação perfeita
O valor de r poderá ser calculado pela expressão:
22
yx
xyCov
r
σσ
= (4.8)
A Covxy é a covariância de X e Y pode ser obtida pela expressão:
∑
∑ ∑
=
= =
−=
n
i
n
i
n
i
ii
iixy
n
yx
yx
1
1 1cov
(4.9)
Já, 2xσ é a variância de X , pode ser obtida da expressão:
n
x
x
n
i
in
i
ix
∑
∑ =
=
−=
1
2
1
22
)(
σ
(4.10)
 e 
2
yσ é a variância de y.
n
y
y
n
i
in
i
iy
∑
∑ =
=
−=
1
2
1
22
)(
σ
(4.11)
O coeficiente de correlação é um parâmetro que possibilita a escolha do 
melhor modelo de ajuste, mas não é determinante no estudo, pois não permite 
24
conclusões definitivas sobre o modelo utilizado. Outras analises serão necessárias, 
para validar os modelos adotados.
4.2.2 Coeficiente de Determinação
O coeficiente de determinação traduz numericamente o percentual do valor 
de avaliação que está sendo explicado pelo modelo de regressão ajustado. Este 
coeficiente varia no intervalo [0,1]. Pode ser obtido pelo coeficiente de regressão 
elevado ao quadrado.
0 ≤ r2 ≤ +1
Outra expressão que fornece o valor do coeficiente de determinação é:
∑
∑
−
−
= )(
)ˆ(2
yy
yy
r (4.12)
Onde: yˆ é a variável estimada
y
 é a média aritmética de y a variável explicada
4.2.3 Erro padrão da estimativa
Ao ajustar uma reta, espera- se que ela explique o grupo de valores 
amostrados. 
Embora a reta de regressão tenha sido obtida minimizando a soma dos 
quadrados dos desvios, sempre haverá uma variabilidade dos dados ao redor da 
reta, exceto se os dados fizerem parte da própria reta de regressão. 
O desvio padrão dos dados ao redor da reta de regressão é denominado erro 
padrão da estimativa (Se) cuja medida é obtida da variância com (n- 2) graus de 
liberdade definida com a fórmula:
2
)ˆ(
1
−
−
=
∑
=
n
yy
Se
n
i
ii (4.13)
O conceito do erro padrão da estimativa é equivalente ao do desvio padrão 
que mede a variabilidade dos valores da amostra ao redor da média aritmética 
desses valores.
4.2.4 Análise de variância
O processo de avaliação por análise de regressão não se encerra com o 
cálculo do valor estimado de Y, obtido do modelo de melhor ajuste, além dos 
coeficientes de correlação e determinação. Outras analises deverão ser efetivadas 
para aferir o modelo, tendo em vista o objetivo final das avaliações que é a definição 
do valor de mercado.
A análise de variância objetiva a verificação da existência da equação de 
regressão, estudando a probabilidade do coeficiente de regressão b ser 
estatisticamente nulo, quando não haveria regressão.
Utiliza- se neste caso o teste estatístico com a distribuição de Fischer-
Snedecor (tabelada nos manuais de estatística). Calcula- se o coeficiente F da 
regressão pela expressão:
25
k
kn
yy
yy
Fcal
1
)ˆ(
)ˆ(
2
2
−−
×
−
−
= ∑
∑ (4.14)
Onde k é o número de variáveis independentes, na regressão linear simples
k=1
 n é o número de dados da amostra
A hipótese nula neste caso é a de que existe regressão de y em x. Na tabela 
de Fischer- Snedecor o valor de Ftab para um determinado nível de significância é 
obtido. 
Se Fcal > Ftab aceita- se a hipótese nula, de que há regressão pois b≠0, com a 
significância correspondente ao valor tabelado.
Se Fcal < Ftab rejeita- se a hipótese de que há correlação.
A partir deste teste pode- se exprimir a confiabilidade do modelo, que será 
fornecida pela expressão:
c = 100% - α
(4.15)
onde α é o nível de significância adotado.
4.2.5 Teste de hipótese para o regressor b
O regressor b é determinante para a equação de regressão, pois se b for igual 
a zero implica que o valor de Y está sendo determinado por uma constante “a”, que 
é o intercepto da reta de regressão. Na prática significa que a variável X não é 
importante na formação do valor de Y e portanto, não há regressão de Y em X.
A hipótese básica neste caso é que b≠0 (o coeficiente b é diferente de zero), 
para isso utiliza- se a distribuição de Student (tabelada nos livros de estatística).
Calcula- se o valor de T para o modelo de melhor ajuste, pela expressão:
b
calc
bT
σ
= (4.16)
Onde bσ é o desvio padrão de b, dado pela expressão:
x
b σ
σ
σ =
Onde:
2
)ˆ(
1
2
−
−
=
∑
=
n
yy
n
iσ
e,
n
x
x
n
i
in
i
ix
∑
∑ =
=
−=
1
2
1
2
)(
σ
O Tcalc deverá ser comparado com o Ttab a um determinado nível de 
significância; se o Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de 
incerteza do valor tabelado. Por outro lado se Tcal < Ttab não se pode afirmar que b≠
0.
4.2.6 Intervalo de confiança para b
26
O intervalo de confiança é construídoem torno da estimativa por ponto, de 
modo que esse intervalo tenha uma probabilidade conhecida de conter o verdadeiro 
valor do parâmetro. Em engenharia de avaliações este intervalo muitas vezes é 
denominado de campo de arbítrio do Engenheiro de Avaliações. É dentro deste 
intervalo que o valor do bem avaliando deve ser arbitrado. Os limites inferior (Li) e 
superior (Ls)do intervalo são dados pelas expressões:
bkni TbL σα )1(2/ −−−=
e, (4.17)
bkns TbL σα )1(2/ −−+=
4.3 Regressões simples não lineares
Em muitos casos a relação entre a variável explicativa e a explicada da- se na 
forma não linear. Algumas destas relações podem, por transformação de variaveis 
passar a ter o formato linear. 
4.3.1 Função logaritmica
A função logartimica pode ser observada na equação:
bay xee =
ˆ
Sendo e a base dos logaritmos neperianos. 
A transformada linear da função logarítmica resulta em:
)(ˆ xbLnay +=
4.3.2 Função exponencial
A função exponencial é dada pela equação:
xbay +=ˆ
A transformada linear da função exponencial resulta em:
)()()ˆ( bxLnaLnyLn +=
4.3.3 Função potencial
A função potencial é dada pela equação:
baxy =ˆ
A transformada linear da função exponencial resulta em:
)()()ˆ( xbLnaLnyLn +=
5. EXERCICIO DE REGRESSÃO SIMPLES
27
Um apartamento com área de 120 m 2 deve ser avaliado. A amostra coletada 
obteve informações sobre 20 apartamentos localizados no mesmo bairro, com o 
mesmo padrão de acabamento, com mesmo número de suites 01, enfim todos 
semelhantes e localizados em locais com mesmo tipo de infra- estrutura urbana.
A área é uma variavel importante formadora de valor, deve- se entretanto, 
verificar que as demais variaveis poderiam exercer influência no valor de mercado. 
Neste caso, simplificadamente usar- se- á a variavel área como única.
Nº Área (m²) Valor (R$)
X Y
1
 264,
00 
 195.000,
00 
2
 54,
00 
 45.000,
00 
3
 69,
00 
 55.000,
00 
4
 49,
00 
 27.000,
00 
5
 78,
00 
 70.000,
00 
6
 32,
62 
 30.000,
00 
7
 40,
00 
 34.000,
00 
8
 35,
00 
 37.900,
00 
9
 41,
00 
 33.000,
00 
10
 38,
00 
 29.000,
00 
11
 78,
18 
 58.000,
00 
12
 66,
00 
 75.000,
00 
13
 70,
00 
 55.000,
00 
14
 81,
17 
 117.500,
00 
15
 81,
17 
 117.500,
00 
16
 67,
31 
 70.000,
00 
17
 216,
56 
 235.000,
00 
18
 30,
00 
 13.000,
00 
19
 229,
00 
 420.000,
00 
20
 110,
00 
 90.000,
00 
Som
a
 1.730,
01 
 1.806.900,
00 
Para efetuar a regressão nessecitam- se alguns calculos preliminares, constantes na 
tabela a seguir:
a) Avaliação utilizando Regressão linear
ii xbay +=ˆ
a.1) Cálculo de b
28
n
x
x
n
yx
xy
b ∑∑
∑ ∑∑
−
−
= 2
2 )(
 
b = 1227,35
Nº Área (m²) Valor (R$)
X Y X.Y X² Y²
1
 264,
00 
 195.000,
00 
 51.480.000,
00 
 69.696,
00 38.025.000.000,00 
2
 54,
00 
 45.000,
00 
 2.430.000,
00 
 2.916,
00 2.025.000.000,00 
3
 69,
00 
 55.000,
00 
 3.795.000,
00 
 4.761,
00 3.025.000.000,00 
4
 49,
00 
 27.000,
00 
 1.323.000,
00 
 2.401,
00 729.000.000,00 
5
 78,
00 
 70.000,
00 
 5.460.000,
00 
 6.084,
00 4.900.000.000,00 
6
 32,
62 
 30.000,
00 
 978.600,
00 
 1.064,
06 900.000.000,00 
7
 40,
00 
 34.000,
00 
 1.360.000,
00 
 1.600,
00 1.156.000.000,00 
8
 35,
00 
 37.900,
00 
 1.326.500,
00 
 1.225,
00 1.436.410.000,00 
9
 41,
00 
 33.000,
00 
 1.353.000,
00 
 1.681,
00 1.089.000.000,00 
10
 38,
00 
 29.000,
00 
 1.102.000,
00 
 1.444,
00 841.000.000,00 
11
 78,
18 
 58.000,
00 
 4.534.440,
00 
 6.112,
11 3.364.000.000,00 
12
 66,
00 
 75.000,
00 
 4.950.000,
00 
 4.356,
00 5.625.000.000,00 
13
 70,
00 
 55.000,
00 
 3.850.000,
00 
 4.900,
00 3.025.000.000,00 
14
 81,
17 
 117.500,
00 
 9.537.475,
00 
 6.588,
57 13.806.250.000,00 
15
 81,
17 
 117.500,
00 
 9.537.475,
00 
 6.588,
57 13.806.250.000,00 
16
 67,
31 
 70.000,
00 
 4.711.700,
00 
 4.530,
64 4.900.000.000,00 
17
 216,
56 
 235.000,
00 
 50.891.600,
00 
 46.898,
23 55.225.000.000,00 
18
 30,
00 
 13.000,
00 
 390.000,
00 
 900,
00 169.000.000,00 
19
 229,
00 
 420.000,
00 
 96.180.000,
00 
 52.441,
00 176.400.000.000,00 
20
 110,
00 
 90.000,
00 
 9.900.000,
00 
 12.100,
00 8.100.000.000,00 
Soma
 1.730,
01 
 1.806.900,
00 
 265.090.790,
00 
 238.287,
18 338.546.910.000,00 
Médi
a
 86,
50 
 90.345,
00 
a.2) cálculo de a
xbya −=
a = - 15821,56 
a.3) Modelo linear (linha reta)
29
Y = - 15821,56 +1227,35X
a.4) Cálculo do coeficiente de correlação
22
yx
xyCov
r
σσ
=
r = 0,87
a.5) Cálculo do coeficiente de determinação
r2 = 0,76
a.6) Análise de variância
k
kn
yy
yy
Fcal
1
)ˆ(
)ˆ(
2
2
−−
×
−
−
= ∑
∑
Mais alguns cálculos auxiliares são necessários:
Nº Área (m²) Valor (R$)
X Y Y^ Y^- Ymed (Y^- Ymed)² (Y- Y^)^2
1 264,00 195.000,00 
 308.199,
36 
 217.854,
36 
47.460.522.911,0
8 
 12.814.095.488,
96 
2 54,00 45.000,00 
 50.455,
45 
 - 39.889,
55
 1.591.176.424,9
0 
 29.761.903,
83 
3 69,00 55.000,00 
 68.865,
73 
 - 21.479,
27
 461.359.178,0
6 
 192.258.379,
14 
4 49,00 27.000,00 
 44.318,
69 
 - 46.026,
31 2.118.421.460,65 
 299.936.929,
84 
5 78,00 70.000,00 
 79.911,
89 
 - 10.433,
11 108.849.689,42 
 98.245.653,
48 
6 32,62 30.000,00 
 24.214,
66 
 - 66.130,
34 4.373.221.608,2233.470.136,
14 
7 40,00 34.000,00 
 33.272,
52 
 - 57.072,
48 3.257.268.026,34 
 529.227,
83 
8 35,00 37.900,00 
 27.135,
76 
 - 63.209,
24 3.995.408.063,60 
 115.868.869,
97 
9 41,00 33.000,00 
 34.499,
87 
 - 55.845,
13 3.118.678.376,10 
 2.249.614,
55 
10 38,00 29.000,00 
 30.817,
82 
 - 59.527,
18
 3.543.485.684,0
4 
 3.304.453,
51 
11 78,18 58.000,00 
 80.132,
82 
 - 10.212,
18
 104.288.663,2
3 
 489.861.628,
23 
12 66,00 75.000,00 
 65.183,
67 
 - 25.161,
33
 633.092.484,1
8 
 96.360.317,
82 
13 70,00 55.000,00 
 70.093,
08 
 - 20.251,
92
 410.140.314,1
5 
 227.801.026,
27 
14 81,17 117.500,00 
 83.802,
60 
 - 6.542,
40
 42.802.993,8
0 
 1.135.514.746,
35 
15 81,17 117.500,00 
 83.802,
60 
 - 6.542,
40
 42.802.993,8
0 
 1.135.514.746,
35 
16 67,31 70.000,00 
 66.791,
50 
 - 23.553,
50
 554.767.270,6
7 
 10.294.459,
77 
17 216,56 235.000,00 
 249.973,
78 
 159.628,
78 
25.481.348.698,8
1 
 224.214.208,
92 
18 30,00 13.000,00 
 20.999,
00 
 - 69.346,
00
 4.808.867.744,2
5 
 63.983.997,
74 
19 229,00 420.000,00 
 265.242,
04 
 174.897,
04 
 30.588.975.513,
94 
 23.950.025.375,
34 
30
20 110,00 90.000,00 
 119.187,
16 
 28.842,
16 
 831.870.061,
46 
 851.890.175,
28 
Som
a 1.730,01 1.806.900,00 
133.527.348.160,
68 
 41.775.181.339,
32 
Fcal = 57,534
Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y 
em x.
b) Avaliação utilizando regressão logaritmica linearizada
Neste caso, a expressão utilizada já linearizada será:
)(ˆ xbLnay +=
Para efetuar os cálculos na coluna área deverá ser colocado o logaritmo neperiano 
da área.
Nº Área (m²) Valor (R$) X.Y X² Y²
 Ln(X) Y 
1
 5,
58 
 195.000,
00 
 1.087.310,
08 
 31,
09 
 38.025.000.000,
00 
2
 3,
99 
 45.000,
00 
 179.504,
28 
 15,
91 
 2.025.000.000,
00 
3
 4,
23 
 55.000,
00 
 232.875,
86 
 17,
93 
 3.025.000.000,
00 
4
 3,
89 
 27.000,
00 
 105.079,
15 
 15,
15 
 729.000.000,
00 
5
 4,
36 
 70.000,
00 
 304.969,
62 
 18,
98 
 4.900.000.000,
00 
6
 3,
48 
 30.000,
00 
 104.547,
77 
 12,
14 
 900.000.000,
00 
7
 3,
69 
 34.000,
00 
 125.421,
90 
 13,
61 
 1.156.000.000,
00 
8
 3,
56 
 37.900,
00 
 134.747,
69 
 12,
64 
 1.436.410.000,
00 
9
 3,
71 
 33.000,
00 
 122.547,
88 
 13,
79 
 1.089.000.000,
00 
10
 3,
64 
 29.000,
00 
 105.490,
00 
 13,
23 
 841.000.000,
00 
11 4, 58.000, 252.822, 19, 3.364.000.000,
31
36 00 80 00 00 
12
 4,
19 
 75.000,
00 
 314.224,
11 
 17,
55 
 5.625.000.000,
00 
13
 4,
25 
 55.000,
00 
 233.667,
24 
 18,
05 
 3.025.000.000,
00 
14
 4,
40 
 117.500,
00 
 516.594,
12 
 19,
33 
 13.806.250.000,
00 
15
 4,
40 
 117.500,
00 
 516.594,
12 
 19,
33 
 13.806.250.000,
00 
16
 4,
21 
 70.000,
00 
 294.651,
62 
 17,
72 
 4.900.000.000,
00 
17
 5,
38 
 235.000,
00 
 1.263.798,
90 
 28,
92 
 55.225.000.000,
00 
18
 3,
40 
 13.000,
00 
 44.215,
57 
 11,
57 
 169.000.000,
00 
19
 5,
43 
 420.000,
00 
 2.282.163,
24 
 29,
53 
 176.400.000.000,
00 
20
 4,
70 
 90.000,
00 
 423.043,
23 
 22,
09 
 8.100.000.000,
00 
Soma
 84,
84 
 1.806.900,
00 
 8.644.269,
16 
 367,
56 
 338.546.910.000,
00 
Média
 4,
24 
 90.345,
00 
b.1) Cálculo de b
b = 127.728,93
b.2) Cálculo de a
a = - 451.485,68
b.3) Modelo linear da função logarítmica
Y = - 451.485,68 +127.728,93 ln(X)
b.4) Cálculo do coeficiente de correlação
r = 0,84
b.5) Cálculo do coeficiente de determinação
r2 = 0,71
b.6) Análise de variância
Fcal = 44,481
Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y 
em x.
c) Avaliação utilizando regressão da função exponencial linearizada
Neste caso, a expressão utilizada já linearizada será:
))(ln()ln()ˆln( xbay +=
32
Para efetuar os cálculos na coluna valor deverá ser colocado o logaritmo 
neperiano do valor.
Nº Área (m²) Valor (R$) X.Y X² Y²
 X Y 
1
 264,
00 
 12,
18 
 3.215,
72 
 69.696,
00 
 148,
37 
2
 54,
00 
 10,
71 
 578,
58 
 2.916,
00 
 114,
80 
3
 69,
00 
 10,
92 
 753,
14 
 4.761,
00 
 119,
14 
4
 49,
00 
 10,
20 
 499,
98 
 2.401,
00 
 104,
11 
5
 78,
00 
 11,
16 
 870,
19 
 6.084,
00 
 124,
46 
6
 32,
62 
 10,
31 
 336,
28 
 1.064,
06 
 106,
27 
7
 40,
00 
 10,
43 
 417,
36 
 1.600,
00 
 108,
87 
8
 35,
00 
 10,
54 
 368,
99 
 1.225,
00 
 111,
15 
9
 41,
00 
 10,
40 
 426,
57 
 1.681,
00 
 108,
25 
10
 38,
00 
 10,
28 
 390,
45 
 1.444,
00 
 105,
58 
11
 78,
18 
 10,
97857,
49 
 6.112,
11 
 120,
30 
12
 66,
00 
 11,
23 
 740,
87 
 4.356,
00 
 126,
01 
13
 70,
00 
 10,
92 
 764,
06 
 4.900,
00 
 119,
14 
14
 81,
17 
 11,
67 
 947,
59 
 6.588,
57 
 136,
29 
15
 81,
17 
 11,
67 
 947,
59 
 6.588,
57 
 136,
29 
16
 67,
31 
 11,
16 
 750,
93 
 4.530,
64 
 124,
46 
17
 216,
56 
 12,
37 
 2.678,
27 
 46.898,
23 
 152,
95 
18
 30,
00 
 9,
47 
 284,
18 
 900,
00 
 89,
73 
19
 229,
00 
 12,
95 
 2.965,
09 
 52.441,
00 
 167,
65 
20
 110,
00 
 11,
41 
 1.254,
83 
 12.100,
00 
 130,
13 
Soma
 1.730,
01 
 220,
94 
 20.048,
18 
 238.287,
18 
 2.453,
95 
Média
 86,
50 
 11,
05 
c.1) Cálculo de ln b
ln b = 0,01
c.2) Cálculo de a
ln a = 10,13
c.3) Modelo linear da função logaritmica
ln Y = 10,13 +0,01 (X)
c.4) Cálculo do coeficiente de correlação
33
r = 0,87
c.5) Cálculo do coeficiente de determinação
r2 = 0,75
c.6) Análise de variância
Fcal = 54,830
Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y 
em x.
d) Avaliação utilizando regressão da função potencial linearizada
Neste caso, a expressão utilizada já linearizada será:
)()()ˆ( xbLnaLnyLn +=
Para efetuar os cálculos na coluna área deverá ser colocado o valor do logaritmo 
neperiano da área e na coluna do valor deverá ser colocado o logaritmo neperiano 
do valor.
d.1) Cálculo de b
b = 1,22
d.2) Cálculo de a
ln a = 5,86
d.3) Modelo linear da função logaritmica
ln Y = 5,86 +1,22 ln(X)
d.4) Cálculo do coeficiente de correlação
r = 0,93
d.5) Cálculo do coeficiente de determinação
r2 = 0,87
34
Nº Área (m²) Valor (R$) X.Y X² Y²
 ln(X) ln(Y) 
1
 5,
58 
 12,
18 
 67,
92 
 31,
09 
 148,
37 
2
 3,
99 
 10,
71 
 42,
74 
 15,
91 
 114,
80 
3
 4,
23 
 10,
92 
 46,
22 
 17,
93 
 119,
14 
4
 3,
89 
 10,
20 
 39,
71 
 15,
15 
 104,
11 
5
 4,
36 
 11,
16 
 48,
60 
 18,
98 
 124,
46 
6
 3,
48 
 10,
31 
 35,
93 
 12,
14 
 106,
27 
7
 3,
69 
 10,
43 
 38,
49 
 13,
61 
 108,
87 
8
 3,
56 
 10,
54 
 37,
48 
 12,
64 
 111,
15 
9
 3,
71 
 10,
40 
 38,
64 
 13,
79 
 108,
25 
10
 3,
64 
 10,
28 
 37,
38 
 13,
23 
 105,
58 
11
 4,
36 
 10,
97 
 47,
81 
 19,
00 
 120,
30 
12
 4,
19 
 11,
23 
 47,
03 
 17,
55 
 126,
01 
13
 4,
25 
 10,
92 
 46,
37 
 18,
05 
 119,
14 
14
 4,
40 
 11,
67 
 51,
33 
 19,
33 
 136,
29 
15
 4,
40 
 11,
67 
 51,
33 
 19,
33 
 136,
29 
16
 4,
21 
 11,
16 
 46,
96 
 17,
72 
 124,
46 
17
 5,
38 
 12,
37 
 66,
51 
 28,
92 
 152,
95 
18
 3,
40 
 9,
47 
 32,
22 
 11,
57 
 89,
73 
19
 5,
43 
 12,
95 
 70,
36 
 29,
53 
 167,
65 
20
 4,
70 
 11,
41 
 53,
62 
 22,
09 
 130,
13 
Soma
 84,
84 
 220,
94 
 946,
63 
 367,
56 
 2.453,
95 
Média
 4,
24 
 11,
05 
d.6) Análise de variância
Fcal = 124,239
Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y 
em x.
Após os cálculos adota- se o modelo potencial, porque apresenta o maior 
valor do coeficiente de correlação, e de análise de variância (Fcal)
Deve- se efetuar na seqüência os outros testes estatísticos para validação do 
modelo.
d.7) Teste de hipótese para o regressor b
35
 Utilizando- se a expressão (4.15), com nível de confiança de 95%, 
obtém- se
Tcal = 6,15
Da tabela da distribuição t de Student obtém- se:
Ttab = 2,093
Como Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de incerteza de 
5%.
d.8) Intervalo de confiança para o regressor b.
bkni TbL σα )1(2/ −−−=
e,
bkns TbL σα )1(2/ −−+=
Li = 1,22 – 2,101*0,20 = 0,7998
Ls = 1,22 + 2,101*0,20 = 1,6402
d.9) Intervalo de y
Com o modelo linear adotado, calcula- se o valor do apartamento de 120 m 2. 
ln Y = 5,86 +1,22 ln(X)
lnY = 5,86 + 1,22 ln (x)
Li = 122.339,12 + 0,7998* 120
Li = 122.435,09
Ls = 122.339,12 + 1,6402* 120
Ls = 122.535,94
Portanto, com 95% de probabilidade o preço do apartamento estaria contido no 
intervalo delimitado pelo limite superior e o inferior acima.
36
6. REGRESSÕES LINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE BENS
A regressão pode ser definida como sendo o estabelecimento de uma relação 
funcional entreduas ou mais variáveis envolvidas para a descrição de um fenômeno. 
A variável Y é aleatória e pode ser descrita matematicamente pela expressão 
[Marques, 2000]: 
 
Y = f(X) + ε (6.1) 
onde: 
 X é a variável independente ou variável explicativa; 
 Y é a variável dependente ou variável resposta; 
 ε é a componente aleatória da variação de Y; 
 f é a função de regressão. 
 Normalmente, X é uma variável que pode ser controlada pelo pesquisador, 
enquanto Y não é passível de controle. A análise de um gráfico de dispersão pode 
sugerir uma relação funcional entre as variáveis, como por exemplo, uma reta, uma 
exponencial, etc. Surge neste caso o modelo estatístico denominado de regressão 
linear simples. Uma generalização dessa regressão é conhecida como regressão 
múltipla. O modelo estatístico utilizado neste caso será dado por: 
 
yi = a + b1 x 1 + b2 x 2 +... + bu x u + vi (6.2) 
 
onde, a, b1, b2 ... bu são denominados de parâmetros da regressão múltipla, v 
substitui , e será denominado neste trabalho de resíduo. Cabe aqui algumaε 
consideração estatística sobre este modelo, o qual pressupõe que a variável yi é 
aleatória, que a esperança matemática dos resíduos é nula, ou seja, que a média 
dos resíduos é nula, que a variância de vi é constante e igual a σ2 (condição de 
homocedasticidade dos resíduos), que os erros são independentes entre si e que os 
mesmos tenham distribuição normal. Estatisticamente também se supõe que vi é a 
componente aleatória da variação de Y, no entanto, devido a problemas práticos, 
alguns resíduos de erros sistemáticos e erros grosseiros, que interferem no 
processo, fazem com que vi contenha também parte destes. Por este motivo, pode-
se afirmar que o resíduo (v) compõe- se de três componentes: uma aleatória, uma 
sistemática e uma grosseira. 
 No problema proposto neste trabalho, y representa as observações (medidas) 
dos valores de imóveis em moeda corrente, x i representa as variáveis, tais como: 
frente do lote, área, etc, formando um sistema de n equações denominado de 
equações de observações, cujas u incógnitas a, b1, b2, ... bu, são objeto de 
37
determinação. O problema geralmente será resolvido para um número de 
observações maior que o número de incógnitas. De forma matricial, o sistema de 
equações de observação pode ser expresso como [Gemael, 1994]: 
 
 nAu uX1 - nL1 = nV1 (6.3) 
 
onde, nAu é a matriz dos coeficientes das incógnitas, definida utilizando- se as 
derivadas parciais da função em relação às incógnitas e que pode ser escrita como: 
 ∂f / ∂a ∂f / ∂b1 ∂f / ∂b2 ... ∂f / ∂bu 
 1 x 1 x 2 x u
nAu = 1 x 1 x 2 x u
 
 
............................................................
 1 x 1 x 2 x u
uX1 o vetor das incógnitas é dado por:
1XuT = a b1 b2 ... bu
o vetor uL1 das variáveis respostas (observações) é dado por:
 1LnT = y1 y 2 ... y n
o vetor nV1 é o vetor dos resíduos estimados obtido pela expressão:
nV1 = nAu uX1 - nL1
O estimador dos parâmetros, por mínimos quadrados, será dado pela 
expressão:
1Xu = (uAnT nPn nAu)- 1 uAnT nPn nL1 , 
ou, reduzindo a simbologia,
1Xu = uNn- 1 uU1 (6.4)
sendo P a matriz dos pesos, que na maioria dos casos de avaliações coincide com a 
matriz identidade (I), pois considera- se que as observações são provenientes de 
uma mesma população. No entanto, de forma generalizada tem- se:
nPn = σo2 nΣLb n- 1
sendo, σo2 a variância da unidade de peso a priori para a qual arbitra - se o 
valor da unidade. O valor da variância da unidade de peso a posteriori , pode 
ser calculado pela expressão:
38
 1Vn T nPn nV1
σ∗o2 =  (6.5) 
 n – u
A matriz variância - covariância dos parâmetros ajustados será dada 
por:
nΣXa n = σ∗o2 uNu –1
6.1. Testes estatísticos como diretrizes em análise de ajustamento de 
regressões múltiplas
Ao se analisar o ajustamento onde aplicam- se regressões múltiplas às 
avaliações, utilizam- se uma série de testes estatísticos com os mais variados 
objetivos, principalmente no que concerne à validação do modelo adotado. Esta 
questão é estudada através de testes de hipóteses, sendo que a NBR 14653- 2 –
Avaliação de bens - Parte 2 – Imóveis Urbanos, (ABNT,2004) estabelece três níveis 
de significância (α): grau I (10%), grau II (5%) e grau III (1%); os quais são utilizados 
em todos os trabalhos de avaliação. Os principais testes efetivados são os 
seguintes:
a) Teste de qui- quadrado na verificação da bondade do ajustamento
É usado na verificação do ajustamento, utilizando como parâmetro para este 
tipo de aplicação um nível de significância (α) que tem como hipótese básica: 
(H0) σo2 = σ∗o2 , ou seja, a variância de unidade de peso, a priori , é igual 
estatisticamente à variância da unidade de peso a posteriori , no nível de 
significância que foi pré- definido, adotando- se ainda, como hipótese alternativa 
(H1) σo2 ≠ σ∗o2 . O valor de qui- quadrado calculado (χ2c ) é dado pela expressão:
 σ∗o2 (n- u)
 χ2c =  (6.7)
 σo2
A distribuição qui- quadrado χ2, em função dos graus de liberdade (n- u) e do 
nível de significância (α) fornece os valores referentes a:
χ2n- u, 0,5α e χ2n- u, 1- 0,5α
39
A hipótese H0 é aceitável se:
χ2n- u, 0,5 α < χ2c < χ2n- u, 1- 0,5 α (6.8)
b) Coeficiente de correlação linear múltiplo (R) e coeficiente de determinação 
(R2)
O coeficiente de correlação traduz numericamente o quanto as variáveis estão 
linearmente relacionadas entre si. É fornecido matricialmente pela raiz quadrada da 
expressão:
1XuT uAnT nPn nZ1
R2 =  (6.9)
 1ZnT nZ1
com
nZ1 = nL1 - nL*1
todos os elementos do vetor nL*1 são iguais e obtidos pela média aritmética dos n 
valores de y.
O valor de R encontra- se no intervalo:
- 1 ≤ R ≤ 1
já o coeficiente de determinação indica numericamente o percentual do valor de 
avaliações que esta sendo explicitado pelo modelo, encontra- se no intervalo:
0 ≤ R ≤ 1
c) Teste de existência da regressão
Consiste em se estudar a probabilidade dos parâmetros de regressão a, b1, 
b2... bu serem iguais a zero ao mesmo tempo, neste caso não existe regressão. O 
teste é efetivado através da distribuição Fischer- Snedecor. O coeficiente Fcal 
calculado é obtido pela expressão matricial:
 (1XuT uAnT nPn nZ1)(n- k- 1)
Fcal =  (6.10)
 (
 1ZnT nZ1 - 1XuT uAnT nPn nZ1) k
com 
k=u- 1
A hipótese básica é aceita, ou seja, de que haja regressão de y em x1, x2, etc. 
com nível de significância (α) se:
Fcal >F tab 
40
e) Teste da significância dos regressores
Utiliza- se neste caso a distribuição T de Student (unicaudal), tendo como 
hipótese básica que os regressores são diferente de zero a um nível de significância 
α. Os valores calculados para o modelo de melhor ajuste são dados pela expressão:
 b i
Tbi = 
σbi
com base nos valores obtidos da distribuição de Student (T) com entradas 2α e 
graus de liberdade n- k- 1, aceita- se a hipótese

Continue navegando