Baixe o app para aproveitar ainda mais
Prévia do material em texto
AVALIAÇÃO DE IMÓVEIS PELO MÉTODO DOS MÍNIMOS QUADRADOS Carlos Aurélio Nadal Curitiba 2008 Carlos Aurélio Nadal Engenheiro Civil UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS DA TERRA DEPARTAMENTO DE GEOMÁTICA Mestre em Ciências Geodésicas Doutor em Ciências Geodésicas Professor Titular do Departamento de Geomática da UFPR. Catalogação na Fonte Tania Barros Bággio CRB - 9/760 Nadal, Carlos A. Avaliação de imóveis pelo método dos mínimos quadrados/Carlos A. Nadal. 1a Ed. Curitiba, Departamento de Geomática- UFPr: 2008. 49p,:il. Inclui bibliografia 1. Avaliações. 2.Método dos mínimos quadrados. 3. Inferência Estatística. 4. Terrenos urbanos. I. Título CDD 20 - 526.6 SUMÁRIO TÓPICO PÁGINA 1. INTRODUÇÃO 04 2 2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS 06 3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES 12 4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR EM AVALIAÇÕES DE BENS 16 4.1 Regressão Linear Simples 16 4.2 Validação de uma regressão linear simples 23 4.2.1 Coeficiente de correlação (r) 23 4.2.2 Coeficiente de Determinação 24 4.2.3 Erro padrão da estimativa 24 4.2.4 Análise de variância 24 4.2.5 Teste de hipótese para o regressor b 25 4.2.6 Intervalo de confiança para b 26 4.3 Regressões simples não lineares 26 4.3.1 Função logaritmica 26 4.3.2 Função exponencial 26 4.3.1 Função potencial 26 5. EXERCICIO DE REGRESSÃO SIMPLES 27 6. REGRESSÕES LINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE BENS 35 6.1. Testes estatísticos como diretrizes em análise de ajustamento de regressões múltiplas 37 7. EXERCICIO DE REGRESSÃO LINEAR MULTIPLA 42 REFERÊNCIAS 51 1. INTRODUÇÃO O conceito de avaliação imobiliária pode ser entendido como a estimativa do valor de um bem, ou seja, o valor mais provável pelo qual o mesmo possa ser objeto de transação no mercado em que está inserido. A norma brasileira NBR 14653- 1 3 Avaliação de bens, em sua parte 1 (ABNT,2001), que dita os procedimentos gerais para avaliações prescreve como metodologia os métodos: método comparativo de dados do mercado, método involutivo, método evolutivo e método da capitalização da renda. No Método Comparativo de Dados de Mercado, que será o principal objetivo deste trabalho, o valor de mercado dos imóveis é estimado com base nos preços de um grupo de propriedades semelhantes ao bem avaliando transacionadas no mercado imobiliário em um período próximo a data da avaliação. Este método é, indiscutivelmente, o mais empregado em avaliações de imóveis, sendo que para a sua aplicação existem alguns requisitos básicos, entre os quais o fato de que é imprescindível a existência de bens semelhantes ao avaliando que tenham sido comercializados próximos à data da avaliação. Além disso, o avaliador necessita ter acesso às informações sobre as condições das transações e as características dos bens transacionados. Quanto menos comparáveis os elementos tomados como referência, menor será a confiabilidade da avaliação (MILLINGTON, 1994). Devido principalmente à heterogeneidade dos imóveis oferecidos pelo mercado imobiliário, torna- se impossível a comparação direta de preços, mesmo no caso de imóveis semelhantes ao do imóvel a ser avaliado, pois ainda assim, existirão fatores que diferenciam os imóveis entre si, ou as condições de cada transação. Assim, por exemplo suponha que são ofertadas casas iguais em um condomínio fechado, seus valores podem ser diferentes por exemplo em razão da inflação. Pelos motivos acima expostos, é necessário aplicar uma técnica que permita ajustar estas diferenças. A análise de regressão múltipla, que é uma técnica de inferência estatística, vem sendo amplamente empregada para identificar os principais fatores que influenciam a determinação dos preços de imóveis e estimar o valor de mercado das propriedades, tanto nos casos de avaliações individuais quanto nas avaliações em massa. A avaliação de imóveis é utilizada na grande maioria dos negócios, discussões e pendências interpessoais e sociais em nossas comunidades, tais como na compra ou na venda de casas, lojas comerciais, instalações industriais, aluguéis, na reavaliação de ativos de empresas, em atendimento à legislação vigente, na partilha oriunda de heranças, meações ou divórcios, no lançamento de impostos, nas hipotecas imobiliárias, nas divergências que originam ações demarcatórias, possessórias, nas indenizações, nas desapropriações e servidões, enfim, em um número expressivo de ações oriundas de problemas inerentes aos relacionamentos humanos, onde o valor de um bem assume importância fundamental. Nas funções públicas, o Engenheiro encontra grande aplicabilidade na avaliação de bens, principalmente na definição do valor dos aluguéis a ser recebido pelos bens públicos, na definição de valores a serem pagos como aluguéis, compras, desapropriações, entre outras. Apesar do conceito de valor ser de difícil definição, sujeito e suscetível às mudanças filosóficas, torna- se importante no relacionamento humano e social adotar- se alguns critérios para que se exerça um caráter de justiça em sua aplicação prática. Assim, um trabalho de avaliação imobiliária constitui - se de uma seqüência de operações que resultam no que poderia ser chamado de uma “formação de juízo” sobre o valor de um imóvel ou um direito sobre ele. O conceito de que o valor é aquele fornecido para um dado instante, único, não importando qual a finalidade da avaliação. Esse valor corresponde ao preço que se definiria, para um determinado imóvel, em um mercado de concorrência perfeito, sujeito às seguintes premissas: a) homogeneidade dos bens levados a mercado; 4 b) números elevados de compradores e vendedores (o mercado não pode por eles ser alterado); c) sem influência externa; d) conhecimento pleno e absolutos sobre o mercado, sobre os bens e das tendências de avaliação por parte dos compradores e vendedores; e) vendedores e compradores oferecendo liquidez com liberdade plena de entrada e saída do mercado. A determinação do valor é de grande interesse para os agentes do mercado mobiliário, servindo para apoiar a tomada de decisão em diferentes áreas, tais como: operações de garantia no sistema financeiro, transações de compra e venda, transações de locação, decisões judiciais, tributação de imóveis urbanos e decisões de investimento (DANTAS, 1998). Os trabalhos de avaliações foram ampliados com a aprovação do Estatuto da Cidade, lei federal na qual diferentes instrumentos de política urbana são regulamentados, entre os quais o solo criado, a transferência de potencial construtivo e a aplicação do Imposto sobre a Propriedade Predial e Territorial Urbana (IPTU) com alíquotas progressivas no tempo, visando ao cumprimento da função social da propriedade. Para garantir a eficácia na aplicação de qualquer destes instrumentos é necessário que sejam obtidas estimativas precisas sobre o valor de mercado dos imóveis. Como discutido por De Cesare (2000a), as falhas no processo avaliatório podem ser geradas pelo uso de métodos inadequados para o estudo em questão,pelas limitações das técnicas empregadas, pela omissão de atributos importantes no processo de valoração, ou ainda pela falta de compreensão do avaliador do fenômeno em análise. Como conseqüência destas falhas, podem ser citados os seguintes exemplos: a) venda de um bem por preço abaixo do seu valor ou a sua exposição no mercado por um período maior do que o necessário trazendo prejuízos financeiros ao vendedor. b) Avaliações em desapropriações podem ser estabelecidas por preços acima ou abaixo do valor de mercado, causando a dilapidação do patrimônio privado, partilhas podem ser realizadas de forma a beneficiar involuntariamente uma ou mais das partes envolvidas, ou o enriquecimento indevido de proprietários privados com recursos públicos. c) Injustiças na distribuição da carga tributária. Para minimizar os erros e as distorções no processo avaliatório, é imprescindível saber quais são os principais atributos que influenciam a formação do valor dos imóveis e a forma de interação entre os mesmos. Enfim, a impossibilidade de considerar e mesmo de identificar todos os atributos que influenciam o valor de um bem e a inexatidão contida na mensuração dos atributos determinantes para a formação do valor estão entre as principais razões pelas quais o valor revela- se como uma função aleatória. Variações na intensidade de motivações, preferências, aspirações e expectativas, resultam em variações de caráter aleatório nos preços praticados no mercado. Existem, inclusive, diferenças no nível de informação entre compradores e vendedores que participam do mercado de forma não freqüente, como conseqüência os preços de transações resultam de negociações individuais entre compradores e vendedores. 2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS 5 Neste trabalho, não se pretende discorrer teoricamente sobre estatística, mas somente utilizar- se de conceitos desta ciência com a finalidade de aplicá- los a casos de avaliações de imóveis. Durante um processo de medição, entendendo- se com tal a obtenção de uma medida sem correções, que pode ser denominada de observação, incorre- se aos inevitáveis erros de observação. Denomina- se dado ao resultado do tratamento de uma observação (por aplicação de uma técnica ou de um modelo matemático) para retirada de erros sistemáticos. A informação é o resultado do tratamento de dados (via modelo matemático/estatístico). Por exemplo, na avaliação de bens, quando obtemos o valor do aluguel de um imóvel, temos uma observação, ao efetuarmos uma vistoria no imóvel, para confirmação da existência, das condições e da validação do valor obtido, esta observação transforma- se em dado, e após a aplicação de inferência estatística pode ser denominada de informação que é o resultado da avaliação. Ao consumidor final, ao gestor público, ao interessado em um processo, interessa fundamentalmente a informação e sua validação. A NBR-14653- 1 (ABNT,2001) traz algumas definições importantes do ponto de vista estatístico: amostra: Conjunto de dados de mercado representativos de uma população. amostragem: Procedimento utilizado para constituir uma amostra. dado de mercado: Conjunto de informações coletadas no mercado relacionadas a um determinado bem. tratamento de dados: Aplicação de operações que expressem, em termos relativos, as diferenças de atributos entre os dados de mercado e os do bem avaliando. Também, interessa- nos de perto o conceito de resolução, que pode ser adaptado da metrologia industrial onde é definido como o menor valor de uma medida que um instrumento fornece, já para a avaliação de imóveis, entendendo- se como tal a capacidade de separação de observações. É fácil observar que uma régua de desenho, graduada no milímetro tem resolução de 1mm, ou seja a melhor medida que pode ser efetivada com esta é da ordem do milímetro. Ao aumentar- se a resolução instrumental, melhora- se a separação das observações. Assim por exemplo, a medida que aumentam- se as variáveis observadas num imóvel, por exemplo, número de vagas de garagens, existência ou não de suíte, distância ao centro comercial, etc., a observação vai sendo diferenciada de outra. Na teoria das medidas o conceito de Exatidão , pode ser entendida como o verdadeiro valor de uma grandeza, é, no entanto, uma utopia, pois todas as medidas são eivadas de erros. Assim um resultado pode ter precisão, termo que tem como significado o indicativo de repetibilidade dos resultados, sendo geralmente mostrado como o desvio padrão de uma medida. A acurácia ou acuracidade demonstra o quanto uma medida tendeu à exatidão. Na figura 1 demonstram- se estes conceitos através de tiros efetivados em um alvo. Comparando- se as duas imagens situadas a esquerda da figura, denominadas de baixa resolução e alta resolução, nota- se que as quatro marcas deixadas nos alvos seriam pontuadas diferentemente nestes desenho, demonstrando que ao aumentar- se a resolução (maior número de círculos concêntricos) separa- se as marcas. Na imagem situada no canto superior direito mostram- se marcas concentradas, porem distantes da “mosca”, trata- se portanto de precisão, resultando em informações com desvio padrão de pequena magnitude, já a imagem no canto inferior direito 6 traz as marcas concentradas e localizadas no centro do alvo, trata- se de observações com precisão e acuracia (quase exatas). Como já havíamos afirmado, todas as observações são eivadas de erros. Os erros podem ser classificados como: grosseiros ou faltas, sistemáticos e acidentais. Os erros grosseiros são aqueles oriundos de falhas, falta de atenção do observador e do mau funcionamento de um instrumento, deve ser evitado, pois é de difícil detecção após as medidas, um exemplo deste erro é um erro de anotação onde há a inversão de dígitos; deveria ser anotado 25 e anotou- se 52. Em avaliações, por exemplo, utiliza- se na amostra um imóvel que está sendo alugado por um preço muito superior ao do mercado. O avaliador não prestou atenção no intervalo de tempo que esta ofertado no mercado (está para alugar a mais de um ano), este fato pode configurar um erro grosseiro. Os erros sistemáticos são produzidos por causas conhecidas, podem ser evitados por técnicas especiais de observações ou podem ser modelados matematicamente e eliminados das observações, um exemplo deste tipo de erro é o devido à dilatação térmica de uma trena, o erro de calibração de um distânciometro, etc. No caso de avaliações, por exemplo, utilizaram- se muitos dados na amostra de uma mesma origem (apartamentos para alugar de uma mesma imobiliária que tende a ter os preços superiores ao do mercado). Os erros acidentais ocorrem de maneira aleatória e devem ser tratados estatisticamente. O ajustamento de observações diz respeito a minimização dos erros acidentais das medidas, com a utilização do método dos mínimos quadrados o qual tem como fundamento: a soma dos quadrados dos resíduos é mínima [Gemael, 1994]. 7 Baixa resolução Precisão Alta resolução Acurácia Figura 1 – Resolução, precisão acurácia [Andrade, 1998]. Outra definição muito utilizada nasnormas é a de tolerância que pode ser definida como o erro máximo acidental admissível, geralmente adotado com ±3σ. Utilizando- se o método dos mínimos quadrados, pode- se proceder a propagação de erros acidentais, denominada de propagação de variâncias. Seja F uma função de várias medidas independentes m 1, m 2, m 3, ..., m k e assumindo- se que os erros médios quadráticos (desvios padrões) são conhecidos, e que as medidas estão livres de erros grosseiros e erros sistemáticos, o erro médio quadrático de F (σF) segue a seguinte lei de propagação [Chrzanowski, 1977]: Analisando- se esta lei conclui- se que os erros não de propagam linearmente. Utiliza- se em avaliações de imóveis a teoria da estimação, que é o processo que usa resultados extraídos da amostra para produzir inferências sobre a população da qual foi extraída aleatoriamente a amostra. A inferência estatística é o método que parte do particular para o geral, ou seja, o processo pelo qual são feitas generalizações para a população a partir da amostra. A estimação pode ser subdividida em dois tipos: a estimação por ponto que é aquela que a partir da amostra, procura obter um valor único para um certo parâmetro populacional e a estimação por intervalo que é aquela em que a estimativa de um parâmetro populacional é dada por dois números, entre os quais pode- se considerar que ele esteja situado. Um exemplo de estimativa pontual é a média amostral quando utilizada para representar a média populacional. A estimativa por intervalo pode ser representada pela média associada ao desvio padrão, por exemplo a distância medida de 20,153m ± 0,150m, significando qua a distância esta compreendida entre os valores 20,003m e 20,303m. Tem importância fundamental neste estudo as principais qualidades de um estimador, quais sejam: não tendenciosidade, consistência e eficiência. Interessa- nos de perto a denominada estatística descritiva. Os principais medidores de tendência central de uma amostra são: a média, a mediana e a moda. Denomina- se média a uma medida de tendência central resultante da divisão do somatório das observações dividido pelo número destas: Σ x i = ū (2.1) n Onde: = média aritméticaū x 1, x 2,.... x n = observações n = número de observações geralmente, a média aritmética é utilizada para dados não agrupados ou para dados de mesma confiabilidade. No caso de utilizar- se dados agrupados ou de diferentes confiabilidades pode ser utilizada a média ponderada: 8 ( ) ( ) ( ) ( ) ( ) ... ( ) ( )σ ∂∂ σ ∂ ∂ σ ∂ ∂ σF k k F m m F m m F m m 2 1 2 1 2 2 2 2 2 2 2 = + + + Σ p i x i = ū (2.2) Σ p i Onde p é o peso de uma observação. A Mediana (Md) é o valor que divide uma série ordenada de observações de modo que o número de itens acima desse valor é igual ao número de itens abaixo. Se a amostra contiver um número ímpar de dados, a mediana corresponde ao valor do ponto médio; se contiver número par de dados a mediana é igual a média dos dois valores dos pontos médios. A Moda (Mo) é o valor com freqüência máxima (pode não existir ou haver mais de um valor). As medidas de dispersão, são baseadas nas medidas da amplitude, variância, desvio padrão, quartil, percentil, assimetria e curtose. A amplitude é obtida pela diferença entre os valores correspondentes ao valor máximo (xmáx) e mínimo (xmin) de uma observação: A = x máx - xmin (2.3) A variância é dada pela expressão: Σ v. v σ2 = (2.4) n – 1 onde v é denominado de resíduo e, é definido como: v = x i – ū O desvio padrão ou o erro médio quadrático da média é obtido pela raiz quadrada da variância. O erro médio quadrático de uma observação isolada é dado pela expressão: e = σ. n –1/2 (2.5) O quartil pode ser definido como qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população. Assim, no caso duma amostra ordenada tem- se: a) primeiro quartil (Q1/4 ) , ou quartil inferior que corresponde ao valor aos 25% da amostra ordenada, também denominado de 25º percentil . b) segundo quartil (Q2/4 ) , corresponde a mediana e corresponde ao valor até ao qual se encontra 50% da amostra ordenada também denominado de 50º percentil . c) terceiro quartil (Q3/4 ) , ou quartil superior é o valor a partir do qual se encontram 25% dos valores mais elevados ou corresponde ao valor de 75% da amostra ordenada, denominado de 75º percentil . A diferença entre os quartis superior e inferior chama- se amplitude inter- quartil . Um percentil é uma medida da posição relativa de uma unidade obsservacional em relação a todas as outras. O p- ésimo porcentil tem no mínimo p% dos valores abaixo daquele ponto e no mínimo (100 - p)% dos valores acima. Entende- se por Assimetria , as medidas que possibilitam analisar uma distribuição de acordo com as relações entre suas medidas de moda, média e 9 mediana, quando observadas graficamente. Uma distribuição é dita simétrica quando apresenta o mesmo valor para a moda, a média e a mediana. Ou seja assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de simetria. Este afastamento pode acontecer do lado esquerdo ou do lado direito da distribuição, chamado de assimetria negativa ou positiva respectivamente. Figura 2 – Distribuição com curva assimétrica negativa A assimetria pode ser calculada pela expressão: - Moū AS = (2.6) σ Quando: AS = 0 distribuição simétrica; AS > 0 distribuição assimétrica positiva; AS < 0 distribuição assimétrica negativa. Curtose é o grau de achatamento da distribuição. Ou o quanto uma curva de freqüência será achatada em relação a uma curva normal de referência. Para o cálculo do grau de curtose de uma distribuição utiliza- se o coeficiente de curtose (ou coeficiente percentílico de curtose) (Q3/4 – Q1/4 ) K = (2.7) 2 . (P90 – P10) onde: Q3/4 e Q1/4 são o terceiro e primeiro quartil e P90 e P10 são o décimo e nonagésimo. Quanto a curtose a distribuição pode ser: mesocúrtica ou normal, ou seja, nem achatada, nem alongada com K = 0,263,p ou achatada com k > 0,263 e leptocúrtica ou alongada, com k < 0,263. Outra forma de se medir a dispersão de forma relativa é obtida com o coeficiente de variação (CV). A principal característica do CV é que este elimina o efeito da magnitude dos dados e exprime a variabilidade em relação a média, é dado pela expressão: σ CV = 100% (2.8) 10 x i f i Mo Md ū Eixo d e Cau d a d esviad a p ara esqu erd a ū É importante, em avaliações a estimação por intervalos, na qual constrói - se um intervalo em torno da estimativa por ponto, de modo que esse intervalo tenha uma probabilidade conhecida de conter o verdadeiro valor do parâmetro (Marques, 2000), assim: P (Φ1 u ≤ ≤ Φ2) = 1 - α (2.9) Onde: Intervalo de confiança: Φ1 u ≤ ≤ Φ2 Limites de confiança: Φ1 e Φ2 Nível de confiança: 1 - α A escolha do nível de confiançadepende da precisão com que desejamos estimar o parâmetro, sendo muito comum a utilização dos níveis 95% e 99%. O aumento de confiança no intervalo, implica no aumento de sua amplitude. Convém também discutir as hipóteses estatísticas, que são suposições que fazemos a cerca dos parâmetros de uma população, ao tentar a fixação de decisões. Essas suposições poderão ser verdadeiras ou não. A hipótese pode ser simples se corresponder a um único valor do parâmetro ou composta. A denominada hipótese nula (Ho) ou básica é a hipótese a ser validade pelo teste, sendo que o teste de hipótese estatística é um procedimento estatístico que mediante observações amostrais, permite decidir o aceite ou a rejeição da hipótese nula. A denominada hipótese alternativa (H1) é aquela contrária a hipótese nula. Deve- se observar que indica- se claramente qual é a Ho, e qual é a H1, pois aceitar a primeira, significa rejeitar a segunda e vice- versa. Para compreender cientificamente o assunto sugere- se os livros especializados de estatística, por exemplo, Marques (2000). O teste de hipóteses é utilizado na avaliação para validar os resultados obtidos. 11 3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES Verificar estatisticamente a amostra a seguir, supondo- se que foram recolhidas observações de 20 apartamentos com dois quartos, colocados para alugar no centro de Curitiba, todos semelhantes, com 1 vaga na garagem. Na tabela abaixo mostram- se os valores unitários obtidos em R$/m 2 não tabulados 6,47 6,59 8,96 7,65 7,22 7,09 6,88 8,06 6,55 7,19 6,78 8,16 6,88 7,25 6,88 8,00 6,94 6,88 7,22 8,11 1) Calculo dos indicadores de tendência central Utilizando a tabela a seguir, retirada de planilha eletrônica observaçõe s valor desvio desvio ao R$/m2 v quadrad o 1 6,47 - 0,818 0,66912 4 2 7,22 - 0,068 0,00462 4 3 6,55 - 0,738 0,54464 4 4 6,88 - 0,408 0,16646 4 5 6,94 - 0,348 0,12110 4 6 6,59 - 0,698 0,48720 4 7 7,09 - 0,198 0,03920 4 8 7,19 - 0,098 0,00960 4 9 7,25 - 0,038 0,00144 4 10 6,88 - 0,408 0,16646 4 11 8,96 1,672 2,79558 4 12 6,88 - 0,408 0,16646 4 13 6,78 - 0,508 0,25806 4 14 6,88 - 0,408 0,16646 4 15 7,22 - 0,068 0,00462 4 12 16 7,65 0,362 0,13104 4 17 8,06 0,772 0,59598 4 18 8,16 0,872 0,76038 4 19 8 0,712 0,50694 4 20 8,11 0,822 0,67568 4 soma 145,76 1,33227E- 14 8,27112 1.1) Média aritmética (utilizando a expressão 2.1). Σ x i 145,76 = ū = ∴ =ū 7,29 R$/m 2 n 20 1.2) Mediana Para o cálculo da mediana os valores devem ser ordenados. 6,47 6,55 6,59 6,78 6,88 6,88 6,88 6,88 6,94 7,09 7,19 7,22 7,22 7,25 7,65 8,00 8,06 8,11 8,16 8,96 Como tem- se um número par de dados 7,09 + 7,19 Md = = 7,14 R$/m 2 2 1.3) Moda Mo = 6,88 R$/m 2 (repete- se quatro vezes) 2) Cálculo das medidas de dispersão 2.1) Amplitude (calculada pela expressão 2.3) A = x máx - xmin A = 8,96 – 6,55 A = 2,41 R$/m 2 2.2) Variância (calculada pela expressão 2.4) Σ v. v 8,27112 σ2 = = n – 1 19 13 σ2 = 0,4353 (R$/m 2)2 2.3) Desvio padrão σ = 0,66 R$/m 2 2.4) Erro médio quadrático de uma observação isolada (expressão 2.5) e = σ. n –1/2 = 0,66 x 20 –1/2 e = 0,15 R$/m 2 2.5) Primeiro, segundo e terceiro quartil Q1/4 = 6,88 R$/m 2 Q2/4 = 7,09 R$/m 2 Q3/4 = 7,65 R$/m 2 2.6) Assimetria (expressão 2.6) – Mo 7,29 - 6,88ū AS = = σ 0,66 AS = 0,62 Se AS > 0 a distribuição assimétrica positiva, isto é, a moda e a mediana são menores que a média. 2.7) Curtose (expressão 2.7) Para aplicar essa expressão é necessário a obtenção dos valores dos percentis P90 = 8,11 P10 = 6,55 (Q3/4 – Q1/4 ) 7,65 - 6,88 K = = 2 . (P90 – P10) 2 x (8,11 – 6,55) K = 0,25 Conclui- se que a distribuição será leptocúrtica ou alongada, pois k < 0,263. 2.8) Coeficiente de variação (expressão 2.8) σ 0,66 CV = 100% = 100 7,29ū CV = 9% 14 2.9) Estimativa por intervalo de confiança da média σ σ P[ - —— t ū α ≤ x i ≤ + —— t ū α ] = 1- α √n √n Sendo 1- α denominado de nível de significância, usualmente igual a 95%. α = 0,05 Na tabela de Student para n- 1 =19 (graus de liberdade) t 0,05 = 2,093 σ 0,66 - —— t ū α = 7,29 - ———— 2,093 = R$ 6,98 √n √ 20 σ 0,66 + —— t ū α= 7,29 + ———— 2,093 = R$ 7,60 √n √ 20 Neste ponto pode- se analisar os dados e verificar aqueles que encontram- se no intervalo calculado. No caso desta amostra em particular teríamos muitos dados fora do intervalo calculado a este nível de probabilidade, o que poderia desqualificar a amostra. Os valores acima podem ser calculados diretamente na planilha excel, acionando- se na barra principal “Ferramentas”, nesta escolhe- se “Analise de dados” e nesta escolhe- se “estatística descritiva”. Preenche- se o quadro de estatística descritiva, obtendo- se o resultado. 15 Na Planilha Excel o erro padrão é igual ao erro médio quadrático de uma observação isolada expressão (2.5). A curtose pode ser avaliada da seguinte forma: se k= 0, distribuição normal, K > 0, mais pico que a normal (alongada) e k< 0, menos pico que a normal (achatada). Se a assimetria AS= 0, dados simétricos, AS> 0, assimetria para direita ou positiva, e AS< 0, assimetria para esquerda ou negativa. Os resultados são semelhantes aos calculados anteriormente, apesar de usar parametrização diferente. A partir da analise dos resultados pode- se tirar algumas conclusões sobre a amostra, como por exemplo, a representatividade da média, a qualidade das observações, etc. Propõe- se ao leitor a confecção de histograma de freqüência absoluta e relativa. 4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR SIMPLES EM AVALIAÇÕES DE BENS A regressão linear é utilizada em experimentos que procuram determinar a relação existente entre duas ou mais variáveis. Neste caso, podem ocorrer dois tipos de situação: (a) uma variável (X) pode ser medida acuradamente e seu valor escolhido pelo experimentador. Por exemplo, a dose de uma droga a ser administrada no animal. Esta variável e chamada de variável independente. A outra variável (Y), chamada variável dependente ou resposta, está sujeita a erro experimental, e seu valor depende do valor escolhido para a variável independente. Assim, a resposta (Y) é uma variável dependente da variável independente (X). Este é o caso da regressão. Este mesmo caso ocorre quando a avaliações de bens. (b) As duas variáveis estão sujeitas a erros experimentais, isto é, erros de natureza aleatória, inerentes ao experimento. Por exemplo, produção de leite e produção de gordura medidas em vacas em lactação. Este tipo de associação entre duas variáveis constitui o caso da correlação. 16 Se o problema envolver somente duas variáveistem- se a aplicação de correlação e regressão simples, se no problema for envolvido mais de duas variáveis tem- se a correlação e regressão múltipla. 4.1 Regressão Linear Simples O termo regressão é usado para designar a expressão que relaciona uma variável dependente (Y) em função de outra (X), considerada independente. Diz- se regressão de Y sobre X. Se a relação funcional entre elas é expressa por uma equação de 1º grau, cuja a representação geométrica é uma linha reta, a regressão é dita linear. Postulada a existência de uma relação linear entre duas variáveis, pode- se representar aquele conjunto de pontos pela equação da reta: yi = a + bx i, (4.1) que expressa o valor de Y em função de X. Y é a variável dependente ou regredida, ou resposta X é a variável independente, ou regressora ou explanatória a e b são constantes, a é o intercepto e expressa o valor de y quando x é zero e b é o coeficiente de regressão, coeficiente angular ou inclinação da reta. Um caso específico é obtido para o caso da coordenadas x=0 fazendo com que y=a. Ja no caso de a=0 a reta corta a origem. Da Geometria analítica o problema pode ser resolvido com uma única solução, a partir do conhecimento das coordenadas cartesianas de dois pontos. É o caso, por exemplo, da determinação da equação do valor de um imóvel, se não houvesse erros na amostragem, ou em um mercado perfeito. Neste caso os dois imóveis amostrados abaixo, representariam o mercado. Na figura 3 mostra- se esquematicamente o problema. imóvel Área R$/m2 1 15 0 100 2 18 0 140 17 Figura 3 – Determinação da equação de uma reta A partir dos dados, tem- se o seguinte sistema de equações: 140 = a + b x 180 100 = a + b x 150 Resolvendo obtém- se: a = - 100 (intercepto) b = 1,333 (declividade) i = arc tg 1,33 (função arco tangente) i = 53,06º Desta forma o modelo matemático adotado para este mercado seria: VALOR = - 100 + 1,333 X ÁREA DO IMÓVEL Por exemplo, neste mercado um imóvel cuja área seja 200 m2 será avaliado por R$ 166,60/m 2. No caso mais geral, o problema básico consiste em estimar os parâmetros a e b para que se conheça a equação da reta. Se a e b são estimados estatisticamente, a equação é estimada da reta poderá ser escrita como: ii xbay +=ˆ (4.2) O problema fundamental consiste em ajustar uma regressão linear simples, isto é, a equação de uma reta ajustada aos dados. Y X Y = a + b X 15 0 10 0 18 0 14 0 a i b = tg i 18 Figura 4 – Ajuste de uma reta Não se pode precisar qual das retas é a melhor para representar como modelo de regressão o problema. Na inferência estatística, procura- se o melhor ajuste da reta aos pontos com um critério estatístico que permita a determinação da confiabilidade do modelo adotado. A descrição matemática é dada por: iii vXbaY ++= (4.3) Assim, por exemplo tem- se na tabela abaixo o valor do aluguel em reais (Y) e a área de apartamentos em m 2 (X): Y 487 510 480 625 490 555 612 498 530 490 X 95 84 102 135 92 89 122 95 100 88 487= a + 95b + v1 510= a + 84b + v2 480= a + 102b + v3 625= a + 135b + v4 490= a + 92b + v5 555= a + 89b + v6 612= a + 122b + v7 498= a + 95b + v8 530= a + 100b + v9 490= a + 88b + v10 Escrevendo estas equações na forma matricial: 500,00 550,00 600,00 650,00 700,00 750,00 800,00 850,00 900,00 950,00 1000,00 130 132 134 136 138 140 área dos imóveis al u gu el 19 + = 10 9 8 7 6 5 4 3 2 1 881 1001 951 1221 891 921 1351 1021 841 951 490 530 498 612 555 490 625 480 510 487 v v v v v v v v v v b a ou Y =AX + V Sendo que a, b e os 10 v´s são desconhecidos e não é possível conhece- los, apenas podemos obter suas estimativas. O sistema matematicamente tem incompatibilidades pois apresenta infinitas soluções, não podendo ser calculado com uma única solução algebricamente, podendo- se obter de cada duas equações separadas uma solução. Pode- se estimar a e b é por meio do Método dos Quadrados Mínimos , o qual consiste em minimizar a soma de quadrados dos desvios vi. Como iii yyv ˆ−= . Sendo ii yy ˆ− a diferença entre o valor observado e o estimado pela equação de regressão para cada observação, procura- se, então, estimar a e b, de tal modo que min)ˆ( 2 =−∑ ii yy (4.4) Portanto, - vi = a + bx i –yi e, v2i = (a + bx i –yi)2 Os desvios de Y´s observados para a linha ajustada YYi ˆ− , ou resíduos, podem ser considerados como estimativas dos erros verdadeiros. Para os erros verdadeiros assume- se importantes suposições: 1) Todos têm média igual a zero; 2) Todos têm a mesma variância σ2e; (homogeneidade de variâncias) 3) Todos são não correlacionados; A soma dos quadrados dos desvios será: SQR = Σ( a + bx i –yi)2 20 Para tornar mínima esta soma, quando variam a e b, devemos igualar a zero as derivadas parciais: 0= ∂ ∂ a SQR e 0=∂ ∂ b SQR Obtemos ( )∑ −+=∂ ∂ ii ybxa2 a SQR ( ) iii xybxa2b SQR ∑ −+=∂ ∂ Σ ( a + bx i –yi) = 0 Σ ( a + bx i –yi) x i = 0 a e b são obtidos pelas das equações normais: na + bΣx i = Σyi aΣx i + bΣx 2i = Σx iyi que produzem ( ) ( ) ( ) ( ) ( )∑ ∑− ∑∑−∑∑ = 2 i 2 i iii 2 ii xxn yxxxy a (4.5) ( ) ( ) ( )∑ ∑− ∑∑−∑ = 2 i 2 i iiii xxn yxyxnb (4.6) A obtenção de a se dá mediante a divisão da equação na + bΣx i = Σyi por n n y n xb a ii ∑ = ∑ + n xb n y a ii ∑ − ∑ = xbya −= (4.7) Da equação 4.7, pode- se tirar duas conclusões: a) O ponto determinado pelas médias das variáveis ( )y,x está contido na reta de regressão; b) As diferenças yy − , ou seja, os desvios acima e abaixo de Y podem ser determinados por ( )xxb − Assim, )xx(byy −=− )xx(byy −+= 21 Partindo da equação: )xx(byy −=− e sem alterar a igualdade, multiplicamos por ( )xx − , seus dois membros: 2)xx(b)yy()xx( −=−− esta equação se refere ao desvio de um determinado valor de Y em relação a média Y , assim: ∑ −=∑ −− 2)xx(b)yy()xx( ∑ − ∑ −− = 2)xx( )yy()xx(b = quadradosdesoma produtosdesoma dividindo- se o numerador e o denominador de b por n- 1, vê- se que [ ] 1 )( 1 )()(),( 22 − ∑ − − ∑ −− == n xx n yyxx s YXCovb X b é denominado coeficiente de regressão de Y em X; podemos escrever a soma de quadrados de X da seguinte forma: ( ) n x xxxi ∑ −∑∑ =− 2 22 )( e a soma de produtos (numerador) pode ser desenvolvida: ∑ +−−=∑ −− )yxyxyxxy()yy()xx( ∑ ∑ ∑ +−−= yxnyxxyxy 2n yxn n yx n yx xy ∑∑+∑∑−∑ ∑∑−= ∑ ∑∑−= n yx xy ∑ −= yxnxy então n x x n yx xy b ∑∑ ∑ ∑∑ − − = 2 2 )( ou nx x yxnxy b ∑∑ ∑ − − = 2 2 )( 22 Se dividirmos tanto o denominador como o numerador por n a fórmula de b não ficará alterada. Porém o denominador passará a indicar a variância de X pois: N XX X ∑ − = 2 2 )(σ e o numerador se constituirá o que se denomina de covariância, isto é, a variabilidade média das variáveis X e Y analisadas simultaneamente: N YYXX Cov XYYX ∑ −− == ))(( , σ 2 , X YXCovb σ == A variância de X é estimada por 1 )( 22 − − = ∑ n xx sX E a covariância de x e y é estimada por 1 ))(( , − −− = ∑ n yyxx Cov YX 22 , )1( xX YX sn yxnxy s Cov b − − === ∑ Quando se constata que o coeficiente de regressão de uma variável sobre outra não difere significativamente de zero, significa que os dois caracteres em estudo não estão relacionados. Quando b difere significativamente de zero, seja b<0 ou b>0, existe associação entre os dois caracteres quantitativos. Quando b>0 as variáveis em estudo estão correlacionadas positivamente; o valor de uma variável aumentará com o aumento da outra e diminuirá com a diminuição da outra. Quando b<0, as variáveis estão correlacionadas negativamente, portanto variam em sentidos opostos. Estes últimos conceitos podem ser visualizados no exemplo abaixo: Y 900 850 850 860 870 880 890 1000 X 132 122 112 125 98 114 120 152 875,121=x 5,887=y 4346,2 8 )975(120581 )5,887)(875,121(8869580 )( 222 = − − = − − = ∑∑ ∑ x n x x yxnxy b xbya −= = 887,5- 2,4346 (121,875) = 590,7866 Portanto: y = 590,7866 + 2,4346 x 23 4.2 Validação de uma regressão linear simples 4.2.1 Coeficiente de correlação (r) O coeficiente de correlação traduz numericamente o quanto as variaveis estão relacionadas entre si. O coeficiente de correlação está compreendido no intervalo: - 1 ≤ r ≤ +1 Quando o sinal de r é positivo as variaveis variam no mesmo sentido, ou seja um incremento positivo da variavel explicativa implica num incremento positivo na variavel explicada, já o sinal negativo implica numa variação oposta. Se r = 0, conclui - se que não existe correlação entre as variaveis. De forma pratica pode- se interpretar o coeficiente de correlação conforme a tabela a seguir (IMAPE,1998): r = 0 correlação nula 0 ≤ r ≤ 0,30 correlação fraca 0,30 ≤ r ≤ 0,60 correlação média 0,60 ≤ r ≤ 0,90 correlação forte 0,90 ≤ r ≤ 0,99 correlação fortissima r =1 correlação perfeita O valor de r poderá ser calculado pela expressão: 22 yx xyCov r σσ = (4.8) A Covxy é a covariância de X e Y pode ser obtida pela expressão: ∑ ∑ ∑ = = = −= n i n i n i ii iixy n yx yx 1 1 1cov (4.9) Já, 2xσ é a variância de X , pode ser obtida da expressão: n x x n i in i ix ∑ ∑ = = −= 1 2 1 22 )( σ (4.10) e 2 yσ é a variância de y. n y y n i in i iy ∑ ∑ = = −= 1 2 1 22 )( σ (4.11) O coeficiente de correlação é um parâmetro que possibilita a escolha do melhor modelo de ajuste, mas não é determinante no estudo, pois não permite 24 conclusões definitivas sobre o modelo utilizado. Outras analises serão necessárias, para validar os modelos adotados. 4.2.2 Coeficiente de Determinação O coeficiente de determinação traduz numericamente o percentual do valor de avaliação que está sendo explicado pelo modelo de regressão ajustado. Este coeficiente varia no intervalo [0,1]. Pode ser obtido pelo coeficiente de regressão elevado ao quadrado. 0 ≤ r2 ≤ +1 Outra expressão que fornece o valor do coeficiente de determinação é: ∑ ∑ − − = )( )ˆ(2 yy yy r (4.12) Onde: yˆ é a variável estimada y é a média aritmética de y a variável explicada 4.2.3 Erro padrão da estimativa Ao ajustar uma reta, espera- se que ela explique o grupo de valores amostrados. Embora a reta de regressão tenha sido obtida minimizando a soma dos quadrados dos desvios, sempre haverá uma variabilidade dos dados ao redor da reta, exceto se os dados fizerem parte da própria reta de regressão. O desvio padrão dos dados ao redor da reta de regressão é denominado erro padrão da estimativa (Se) cuja medida é obtida da variância com (n- 2) graus de liberdade definida com a fórmula: 2 )ˆ( 1 − − = ∑ = n yy Se n i ii (4.13) O conceito do erro padrão da estimativa é equivalente ao do desvio padrão que mede a variabilidade dos valores da amostra ao redor da média aritmética desses valores. 4.2.4 Análise de variância O processo de avaliação por análise de regressão não se encerra com o cálculo do valor estimado de Y, obtido do modelo de melhor ajuste, além dos coeficientes de correlação e determinação. Outras analises deverão ser efetivadas para aferir o modelo, tendo em vista o objetivo final das avaliações que é a definição do valor de mercado. A análise de variância objetiva a verificação da existência da equação de regressão, estudando a probabilidade do coeficiente de regressão b ser estatisticamente nulo, quando não haveria regressão. Utiliza- se neste caso o teste estatístico com a distribuição de Fischer- Snedecor (tabelada nos manuais de estatística). Calcula- se o coeficiente F da regressão pela expressão: 25 k kn yy yy Fcal 1 )ˆ( )ˆ( 2 2 −− × − − = ∑ ∑ (4.14) Onde k é o número de variáveis independentes, na regressão linear simples k=1 n é o número de dados da amostra A hipótese nula neste caso é a de que existe regressão de y em x. Na tabela de Fischer- Snedecor o valor de Ftab para um determinado nível de significância é obtido. Se Fcal > Ftab aceita- se a hipótese nula, de que há regressão pois b≠0, com a significância correspondente ao valor tabelado. Se Fcal < Ftab rejeita- se a hipótese de que há correlação. A partir deste teste pode- se exprimir a confiabilidade do modelo, que será fornecida pela expressão: c = 100% - α (4.15) onde α é o nível de significância adotado. 4.2.5 Teste de hipótese para o regressor b O regressor b é determinante para a equação de regressão, pois se b for igual a zero implica que o valor de Y está sendo determinado por uma constante “a”, que é o intercepto da reta de regressão. Na prática significa que a variável X não é importante na formação do valor de Y e portanto, não há regressão de Y em X. A hipótese básica neste caso é que b≠0 (o coeficiente b é diferente de zero), para isso utiliza- se a distribuição de Student (tabelada nos livros de estatística). Calcula- se o valor de T para o modelo de melhor ajuste, pela expressão: b calc bT σ = (4.16) Onde bσ é o desvio padrão de b, dado pela expressão: x b σ σ σ = Onde: 2 )ˆ( 1 2 − − = ∑ = n yy n iσ e, n x x n i in i ix ∑ ∑ = = −= 1 2 1 2 )( σ O Tcalc deverá ser comparado com o Ttab a um determinado nível de significância; se o Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de incerteza do valor tabelado. Por outro lado se Tcal < Ttab não se pode afirmar que b≠ 0. 4.2.6 Intervalo de confiança para b 26 O intervalo de confiança é construídoem torno da estimativa por ponto, de modo que esse intervalo tenha uma probabilidade conhecida de conter o verdadeiro valor do parâmetro. Em engenharia de avaliações este intervalo muitas vezes é denominado de campo de arbítrio do Engenheiro de Avaliações. É dentro deste intervalo que o valor do bem avaliando deve ser arbitrado. Os limites inferior (Li) e superior (Ls)do intervalo são dados pelas expressões: bkni TbL σα )1(2/ −−−= e, (4.17) bkns TbL σα )1(2/ −−+= 4.3 Regressões simples não lineares Em muitos casos a relação entre a variável explicativa e a explicada da- se na forma não linear. Algumas destas relações podem, por transformação de variaveis passar a ter o formato linear. 4.3.1 Função logaritmica A função logartimica pode ser observada na equação: bay xee = ˆ Sendo e a base dos logaritmos neperianos. A transformada linear da função logarítmica resulta em: )(ˆ xbLnay += 4.3.2 Função exponencial A função exponencial é dada pela equação: xbay +=ˆ A transformada linear da função exponencial resulta em: )()()ˆ( bxLnaLnyLn += 4.3.3 Função potencial A função potencial é dada pela equação: baxy =ˆ A transformada linear da função exponencial resulta em: )()()ˆ( xbLnaLnyLn += 5. EXERCICIO DE REGRESSÃO SIMPLES 27 Um apartamento com área de 120 m 2 deve ser avaliado. A amostra coletada obteve informações sobre 20 apartamentos localizados no mesmo bairro, com o mesmo padrão de acabamento, com mesmo número de suites 01, enfim todos semelhantes e localizados em locais com mesmo tipo de infra- estrutura urbana. A área é uma variavel importante formadora de valor, deve- se entretanto, verificar que as demais variaveis poderiam exercer influência no valor de mercado. Neste caso, simplificadamente usar- se- á a variavel área como única. Nº Área (m²) Valor (R$) X Y 1 264, 00 195.000, 00 2 54, 00 45.000, 00 3 69, 00 55.000, 00 4 49, 00 27.000, 00 5 78, 00 70.000, 00 6 32, 62 30.000, 00 7 40, 00 34.000, 00 8 35, 00 37.900, 00 9 41, 00 33.000, 00 10 38, 00 29.000, 00 11 78, 18 58.000, 00 12 66, 00 75.000, 00 13 70, 00 55.000, 00 14 81, 17 117.500, 00 15 81, 17 117.500, 00 16 67, 31 70.000, 00 17 216, 56 235.000, 00 18 30, 00 13.000, 00 19 229, 00 420.000, 00 20 110, 00 90.000, 00 Som a 1.730, 01 1.806.900, 00 Para efetuar a regressão nessecitam- se alguns calculos preliminares, constantes na tabela a seguir: a) Avaliação utilizando Regressão linear ii xbay +=ˆ a.1) Cálculo de b 28 n x x n yx xy b ∑∑ ∑ ∑∑ − − = 2 2 )( b = 1227,35 Nº Área (m²) Valor (R$) X Y X.Y X² Y² 1 264, 00 195.000, 00 51.480.000, 00 69.696, 00 38.025.000.000,00 2 54, 00 45.000, 00 2.430.000, 00 2.916, 00 2.025.000.000,00 3 69, 00 55.000, 00 3.795.000, 00 4.761, 00 3.025.000.000,00 4 49, 00 27.000, 00 1.323.000, 00 2.401, 00 729.000.000,00 5 78, 00 70.000, 00 5.460.000, 00 6.084, 00 4.900.000.000,00 6 32, 62 30.000, 00 978.600, 00 1.064, 06 900.000.000,00 7 40, 00 34.000, 00 1.360.000, 00 1.600, 00 1.156.000.000,00 8 35, 00 37.900, 00 1.326.500, 00 1.225, 00 1.436.410.000,00 9 41, 00 33.000, 00 1.353.000, 00 1.681, 00 1.089.000.000,00 10 38, 00 29.000, 00 1.102.000, 00 1.444, 00 841.000.000,00 11 78, 18 58.000, 00 4.534.440, 00 6.112, 11 3.364.000.000,00 12 66, 00 75.000, 00 4.950.000, 00 4.356, 00 5.625.000.000,00 13 70, 00 55.000, 00 3.850.000, 00 4.900, 00 3.025.000.000,00 14 81, 17 117.500, 00 9.537.475, 00 6.588, 57 13.806.250.000,00 15 81, 17 117.500, 00 9.537.475, 00 6.588, 57 13.806.250.000,00 16 67, 31 70.000, 00 4.711.700, 00 4.530, 64 4.900.000.000,00 17 216, 56 235.000, 00 50.891.600, 00 46.898, 23 55.225.000.000,00 18 30, 00 13.000, 00 390.000, 00 900, 00 169.000.000,00 19 229, 00 420.000, 00 96.180.000, 00 52.441, 00 176.400.000.000,00 20 110, 00 90.000, 00 9.900.000, 00 12.100, 00 8.100.000.000,00 Soma 1.730, 01 1.806.900, 00 265.090.790, 00 238.287, 18 338.546.910.000,00 Médi a 86, 50 90.345, 00 a.2) cálculo de a xbya −= a = - 15821,56 a.3) Modelo linear (linha reta) 29 Y = - 15821,56 +1227,35X a.4) Cálculo do coeficiente de correlação 22 yx xyCov r σσ = r = 0,87 a.5) Cálculo do coeficiente de determinação r2 = 0,76 a.6) Análise de variância k kn yy yy Fcal 1 )ˆ( )ˆ( 2 2 −− × − − = ∑ ∑ Mais alguns cálculos auxiliares são necessários: Nº Área (m²) Valor (R$) X Y Y^ Y^- Ymed (Y^- Ymed)² (Y- Y^)^2 1 264,00 195.000,00 308.199, 36 217.854, 36 47.460.522.911,0 8 12.814.095.488, 96 2 54,00 45.000,00 50.455, 45 - 39.889, 55 1.591.176.424,9 0 29.761.903, 83 3 69,00 55.000,00 68.865, 73 - 21.479, 27 461.359.178,0 6 192.258.379, 14 4 49,00 27.000,00 44.318, 69 - 46.026, 31 2.118.421.460,65 299.936.929, 84 5 78,00 70.000,00 79.911, 89 - 10.433, 11 108.849.689,42 98.245.653, 48 6 32,62 30.000,00 24.214, 66 - 66.130, 34 4.373.221.608,2233.470.136, 14 7 40,00 34.000,00 33.272, 52 - 57.072, 48 3.257.268.026,34 529.227, 83 8 35,00 37.900,00 27.135, 76 - 63.209, 24 3.995.408.063,60 115.868.869, 97 9 41,00 33.000,00 34.499, 87 - 55.845, 13 3.118.678.376,10 2.249.614, 55 10 38,00 29.000,00 30.817, 82 - 59.527, 18 3.543.485.684,0 4 3.304.453, 51 11 78,18 58.000,00 80.132, 82 - 10.212, 18 104.288.663,2 3 489.861.628, 23 12 66,00 75.000,00 65.183, 67 - 25.161, 33 633.092.484,1 8 96.360.317, 82 13 70,00 55.000,00 70.093, 08 - 20.251, 92 410.140.314,1 5 227.801.026, 27 14 81,17 117.500,00 83.802, 60 - 6.542, 40 42.802.993,8 0 1.135.514.746, 35 15 81,17 117.500,00 83.802, 60 - 6.542, 40 42.802.993,8 0 1.135.514.746, 35 16 67,31 70.000,00 66.791, 50 - 23.553, 50 554.767.270,6 7 10.294.459, 77 17 216,56 235.000,00 249.973, 78 159.628, 78 25.481.348.698,8 1 224.214.208, 92 18 30,00 13.000,00 20.999, 00 - 69.346, 00 4.808.867.744,2 5 63.983.997, 74 19 229,00 420.000,00 265.242, 04 174.897, 04 30.588.975.513, 94 23.950.025.375, 34 30 20 110,00 90.000,00 119.187, 16 28.842, 16 831.870.061, 46 851.890.175, 28 Som a 1.730,01 1.806.900,00 133.527.348.160, 68 41.775.181.339, 32 Fcal = 57,534 Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y em x. b) Avaliação utilizando regressão logaritmica linearizada Neste caso, a expressão utilizada já linearizada será: )(ˆ xbLnay += Para efetuar os cálculos na coluna área deverá ser colocado o logaritmo neperiano da área. Nº Área (m²) Valor (R$) X.Y X² Y² Ln(X) Y 1 5, 58 195.000, 00 1.087.310, 08 31, 09 38.025.000.000, 00 2 3, 99 45.000, 00 179.504, 28 15, 91 2.025.000.000, 00 3 4, 23 55.000, 00 232.875, 86 17, 93 3.025.000.000, 00 4 3, 89 27.000, 00 105.079, 15 15, 15 729.000.000, 00 5 4, 36 70.000, 00 304.969, 62 18, 98 4.900.000.000, 00 6 3, 48 30.000, 00 104.547, 77 12, 14 900.000.000, 00 7 3, 69 34.000, 00 125.421, 90 13, 61 1.156.000.000, 00 8 3, 56 37.900, 00 134.747, 69 12, 64 1.436.410.000, 00 9 3, 71 33.000, 00 122.547, 88 13, 79 1.089.000.000, 00 10 3, 64 29.000, 00 105.490, 00 13, 23 841.000.000, 00 11 4, 58.000, 252.822, 19, 3.364.000.000, 31 36 00 80 00 00 12 4, 19 75.000, 00 314.224, 11 17, 55 5.625.000.000, 00 13 4, 25 55.000, 00 233.667, 24 18, 05 3.025.000.000, 00 14 4, 40 117.500, 00 516.594, 12 19, 33 13.806.250.000, 00 15 4, 40 117.500, 00 516.594, 12 19, 33 13.806.250.000, 00 16 4, 21 70.000, 00 294.651, 62 17, 72 4.900.000.000, 00 17 5, 38 235.000, 00 1.263.798, 90 28, 92 55.225.000.000, 00 18 3, 40 13.000, 00 44.215, 57 11, 57 169.000.000, 00 19 5, 43 420.000, 00 2.282.163, 24 29, 53 176.400.000.000, 00 20 4, 70 90.000, 00 423.043, 23 22, 09 8.100.000.000, 00 Soma 84, 84 1.806.900, 00 8.644.269, 16 367, 56 338.546.910.000, 00 Média 4, 24 90.345, 00 b.1) Cálculo de b b = 127.728,93 b.2) Cálculo de a a = - 451.485,68 b.3) Modelo linear da função logarítmica Y = - 451.485,68 +127.728,93 ln(X) b.4) Cálculo do coeficiente de correlação r = 0,84 b.5) Cálculo do coeficiente de determinação r2 = 0,71 b.6) Análise de variância Fcal = 44,481 Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y em x. c) Avaliação utilizando regressão da função exponencial linearizada Neste caso, a expressão utilizada já linearizada será: ))(ln()ln()ˆln( xbay += 32 Para efetuar os cálculos na coluna valor deverá ser colocado o logaritmo neperiano do valor. Nº Área (m²) Valor (R$) X.Y X² Y² X Y 1 264, 00 12, 18 3.215, 72 69.696, 00 148, 37 2 54, 00 10, 71 578, 58 2.916, 00 114, 80 3 69, 00 10, 92 753, 14 4.761, 00 119, 14 4 49, 00 10, 20 499, 98 2.401, 00 104, 11 5 78, 00 11, 16 870, 19 6.084, 00 124, 46 6 32, 62 10, 31 336, 28 1.064, 06 106, 27 7 40, 00 10, 43 417, 36 1.600, 00 108, 87 8 35, 00 10, 54 368, 99 1.225, 00 111, 15 9 41, 00 10, 40 426, 57 1.681, 00 108, 25 10 38, 00 10, 28 390, 45 1.444, 00 105, 58 11 78, 18 10, 97857, 49 6.112, 11 120, 30 12 66, 00 11, 23 740, 87 4.356, 00 126, 01 13 70, 00 10, 92 764, 06 4.900, 00 119, 14 14 81, 17 11, 67 947, 59 6.588, 57 136, 29 15 81, 17 11, 67 947, 59 6.588, 57 136, 29 16 67, 31 11, 16 750, 93 4.530, 64 124, 46 17 216, 56 12, 37 2.678, 27 46.898, 23 152, 95 18 30, 00 9, 47 284, 18 900, 00 89, 73 19 229, 00 12, 95 2.965, 09 52.441, 00 167, 65 20 110, 00 11, 41 1.254, 83 12.100, 00 130, 13 Soma 1.730, 01 220, 94 20.048, 18 238.287, 18 2.453, 95 Média 86, 50 11, 05 c.1) Cálculo de ln b ln b = 0,01 c.2) Cálculo de a ln a = 10,13 c.3) Modelo linear da função logaritmica ln Y = 10,13 +0,01 (X) c.4) Cálculo do coeficiente de correlação 33 r = 0,87 c.5) Cálculo do coeficiente de determinação r2 = 0,75 c.6) Análise de variância Fcal = 54,830 Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y em x. d) Avaliação utilizando regressão da função potencial linearizada Neste caso, a expressão utilizada já linearizada será: )()()ˆ( xbLnaLnyLn += Para efetuar os cálculos na coluna área deverá ser colocado o valor do logaritmo neperiano da área e na coluna do valor deverá ser colocado o logaritmo neperiano do valor. d.1) Cálculo de b b = 1,22 d.2) Cálculo de a ln a = 5,86 d.3) Modelo linear da função logaritmica ln Y = 5,86 +1,22 ln(X) d.4) Cálculo do coeficiente de correlação r = 0,93 d.5) Cálculo do coeficiente de determinação r2 = 0,87 34 Nº Área (m²) Valor (R$) X.Y X² Y² ln(X) ln(Y) 1 5, 58 12, 18 67, 92 31, 09 148, 37 2 3, 99 10, 71 42, 74 15, 91 114, 80 3 4, 23 10, 92 46, 22 17, 93 119, 14 4 3, 89 10, 20 39, 71 15, 15 104, 11 5 4, 36 11, 16 48, 60 18, 98 124, 46 6 3, 48 10, 31 35, 93 12, 14 106, 27 7 3, 69 10, 43 38, 49 13, 61 108, 87 8 3, 56 10, 54 37, 48 12, 64 111, 15 9 3, 71 10, 40 38, 64 13, 79 108, 25 10 3, 64 10, 28 37, 38 13, 23 105, 58 11 4, 36 10, 97 47, 81 19, 00 120, 30 12 4, 19 11, 23 47, 03 17, 55 126, 01 13 4, 25 10, 92 46, 37 18, 05 119, 14 14 4, 40 11, 67 51, 33 19, 33 136, 29 15 4, 40 11, 67 51, 33 19, 33 136, 29 16 4, 21 11, 16 46, 96 17, 72 124, 46 17 5, 38 12, 37 66, 51 28, 92 152, 95 18 3, 40 9, 47 32, 22 11, 57 89, 73 19 5, 43 12, 95 70, 36 29, 53 167, 65 20 4, 70 11, 41 53, 62 22, 09 130, 13 Soma 84, 84 220, 94 946, 63 367, 56 2.453, 95 Média 4, 24 11, 05 d.6) Análise de variância Fcal = 124,239 Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y em x. Após os cálculos adota- se o modelo potencial, porque apresenta o maior valor do coeficiente de correlação, e de análise de variância (Fcal) Deve- se efetuar na seqüência os outros testes estatísticos para validação do modelo. d.7) Teste de hipótese para o regressor b 35 Utilizando- se a expressão (4.15), com nível de confiança de 95%, obtém- se Tcal = 6,15 Da tabela da distribuição t de Student obtém- se: Ttab = 2,093 Como Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de incerteza de 5%. d.8) Intervalo de confiança para o regressor b. bkni TbL σα )1(2/ −−−= e, bkns TbL σα )1(2/ −−+= Li = 1,22 – 2,101*0,20 = 0,7998 Ls = 1,22 + 2,101*0,20 = 1,6402 d.9) Intervalo de y Com o modelo linear adotado, calcula- se o valor do apartamento de 120 m 2. ln Y = 5,86 +1,22 ln(X) lnY = 5,86 + 1,22 ln (x) Li = 122.339,12 + 0,7998* 120 Li = 122.435,09 Ls = 122.339,12 + 1,6402* 120 Ls = 122.535,94 Portanto, com 95% de probabilidade o preço do apartamento estaria contido no intervalo delimitado pelo limite superior e o inferior acima. 36 6. REGRESSÕES LINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE BENS A regressão pode ser definida como sendo o estabelecimento de uma relação funcional entreduas ou mais variáveis envolvidas para a descrição de um fenômeno. A variável Y é aleatória e pode ser descrita matematicamente pela expressão [Marques, 2000]: Y = f(X) + ε (6.1) onde: X é a variável independente ou variável explicativa; Y é a variável dependente ou variável resposta; ε é a componente aleatória da variação de Y; f é a função de regressão. Normalmente, X é uma variável que pode ser controlada pelo pesquisador, enquanto Y não é passível de controle. A análise de um gráfico de dispersão pode sugerir uma relação funcional entre as variáveis, como por exemplo, uma reta, uma exponencial, etc. Surge neste caso o modelo estatístico denominado de regressão linear simples. Uma generalização dessa regressão é conhecida como regressão múltipla. O modelo estatístico utilizado neste caso será dado por: yi = a + b1 x 1 + b2 x 2 +... + bu x u + vi (6.2) onde, a, b1, b2 ... bu são denominados de parâmetros da regressão múltipla, v substitui , e será denominado neste trabalho de resíduo. Cabe aqui algumaε consideração estatística sobre este modelo, o qual pressupõe que a variável yi é aleatória, que a esperança matemática dos resíduos é nula, ou seja, que a média dos resíduos é nula, que a variância de vi é constante e igual a σ2 (condição de homocedasticidade dos resíduos), que os erros são independentes entre si e que os mesmos tenham distribuição normal. Estatisticamente também se supõe que vi é a componente aleatória da variação de Y, no entanto, devido a problemas práticos, alguns resíduos de erros sistemáticos e erros grosseiros, que interferem no processo, fazem com que vi contenha também parte destes. Por este motivo, pode- se afirmar que o resíduo (v) compõe- se de três componentes: uma aleatória, uma sistemática e uma grosseira. No problema proposto neste trabalho, y representa as observações (medidas) dos valores de imóveis em moeda corrente, x i representa as variáveis, tais como: frente do lote, área, etc, formando um sistema de n equações denominado de equações de observações, cujas u incógnitas a, b1, b2, ... bu, são objeto de 37 determinação. O problema geralmente será resolvido para um número de observações maior que o número de incógnitas. De forma matricial, o sistema de equações de observação pode ser expresso como [Gemael, 1994]: nAu uX1 - nL1 = nV1 (6.3) onde, nAu é a matriz dos coeficientes das incógnitas, definida utilizando- se as derivadas parciais da função em relação às incógnitas e que pode ser escrita como: ∂f / ∂a ∂f / ∂b1 ∂f / ∂b2 ... ∂f / ∂bu 1 x 1 x 2 x u nAu = 1 x 1 x 2 x u ............................................................ 1 x 1 x 2 x u uX1 o vetor das incógnitas é dado por: 1XuT = a b1 b2 ... bu o vetor uL1 das variáveis respostas (observações) é dado por: 1LnT = y1 y 2 ... y n o vetor nV1 é o vetor dos resíduos estimados obtido pela expressão: nV1 = nAu uX1 - nL1 O estimador dos parâmetros, por mínimos quadrados, será dado pela expressão: 1Xu = (uAnT nPn nAu)- 1 uAnT nPn nL1 , ou, reduzindo a simbologia, 1Xu = uNn- 1 uU1 (6.4) sendo P a matriz dos pesos, que na maioria dos casos de avaliações coincide com a matriz identidade (I), pois considera- se que as observações são provenientes de uma mesma população. No entanto, de forma generalizada tem- se: nPn = σo2 nΣLb n- 1 sendo, σo2 a variância da unidade de peso a priori para a qual arbitra - se o valor da unidade. O valor da variância da unidade de peso a posteriori , pode ser calculado pela expressão: 38 1Vn T nPn nV1 σ∗o2 = (6.5) n – u A matriz variância - covariância dos parâmetros ajustados será dada por: nΣXa n = σ∗o2 uNu –1 6.1. Testes estatísticos como diretrizes em análise de ajustamento de regressões múltiplas Ao se analisar o ajustamento onde aplicam- se regressões múltiplas às avaliações, utilizam- se uma série de testes estatísticos com os mais variados objetivos, principalmente no que concerne à validação do modelo adotado. Esta questão é estudada através de testes de hipóteses, sendo que a NBR 14653- 2 – Avaliação de bens - Parte 2 – Imóveis Urbanos, (ABNT,2004) estabelece três níveis de significância (α): grau I (10%), grau II (5%) e grau III (1%); os quais são utilizados em todos os trabalhos de avaliação. Os principais testes efetivados são os seguintes: a) Teste de qui- quadrado na verificação da bondade do ajustamento É usado na verificação do ajustamento, utilizando como parâmetro para este tipo de aplicação um nível de significância (α) que tem como hipótese básica: (H0) σo2 = σ∗o2 , ou seja, a variância de unidade de peso, a priori , é igual estatisticamente à variância da unidade de peso a posteriori , no nível de significância que foi pré- definido, adotando- se ainda, como hipótese alternativa (H1) σo2 ≠ σ∗o2 . O valor de qui- quadrado calculado (χ2c ) é dado pela expressão: σ∗o2 (n- u) χ2c = (6.7) σo2 A distribuição qui- quadrado χ2, em função dos graus de liberdade (n- u) e do nível de significância (α) fornece os valores referentes a: χ2n- u, 0,5α e χ2n- u, 1- 0,5α 39 A hipótese H0 é aceitável se: χ2n- u, 0,5 α < χ2c < χ2n- u, 1- 0,5 α (6.8) b) Coeficiente de correlação linear múltiplo (R) e coeficiente de determinação (R2) O coeficiente de correlação traduz numericamente o quanto as variáveis estão linearmente relacionadas entre si. É fornecido matricialmente pela raiz quadrada da expressão: 1XuT uAnT nPn nZ1 R2 = (6.9) 1ZnT nZ1 com nZ1 = nL1 - nL*1 todos os elementos do vetor nL*1 são iguais e obtidos pela média aritmética dos n valores de y. O valor de R encontra- se no intervalo: - 1 ≤ R ≤ 1 já o coeficiente de determinação indica numericamente o percentual do valor de avaliações que esta sendo explicitado pelo modelo, encontra- se no intervalo: 0 ≤ R ≤ 1 c) Teste de existência da regressão Consiste em se estudar a probabilidade dos parâmetros de regressão a, b1, b2... bu serem iguais a zero ao mesmo tempo, neste caso não existe regressão. O teste é efetivado através da distribuição Fischer- Snedecor. O coeficiente Fcal calculado é obtido pela expressão matricial: (1XuT uAnT nPn nZ1)(n- k- 1) Fcal = (6.10) ( 1ZnT nZ1 - 1XuT uAnT nPn nZ1) k com k=u- 1 A hipótese básica é aceita, ou seja, de que haja regressão de y em x1, x2, etc. com nível de significância (α) se: Fcal >F tab 40 e) Teste da significância dos regressores Utiliza- se neste caso a distribuição T de Student (unicaudal), tendo como hipótese básica que os regressores são diferente de zero a um nível de significância α. Os valores calculados para o modelo de melhor ajuste são dados pela expressão: b i Tbi = σbi com base nos valores obtidos da distribuição de Student (T) com entradas 2α e graus de liberdade n- k- 1, aceita- se a hipótese
Compartilhar