Modelo de Precificação de Apartamentos na Cidade de João Pessoa Alisson de Oliveira Silva1, Carlos S. A. dos Santos2,Luana C. M. da Silva1 e Wanessa W. L. Freitas1 1 Universidade Federal da Paraíba, Departamento de Estatística 2 Universidade Federal de Campina Grande, Centro de Ciências e Tecnologia Agro-Alimentar Resumo O mercado imobiliário é um dos segmentos que mais crescem atualmente, sendo de fundamental importância para o crescimento e desenvolvimento de uma região. No Brasil, é possível verificar um grande avanço neste setor, apresentando-se como um dos mais produtivos da economia na geração de negócios, emprego e renda. Em João Pessoa (PB), segundo dados do Sindicato da Indústria da Construção Civil (Sinduscon-JP) apontam que as vendas de imóveis na cidade vêm crescendo de forma acentuada nos últimos anos. Diante deste crescimento, torna-se de fundamental importância a determinação técnica do valor de apartamentos na cidade de João Pessoa, de forma a auxiliar na tomada de decisões. A partir da modelagem via GAMLSS, verificou-se que as variáveis área do imóvel, número de vagas na garagem foram os atributos mais importantes para formação do valor dos imóveis na cidade de João Pessoa. Palavras-Chave Mercado Imobiliário, Equação de preços hedônicos, GAMLSS. I. INTRODUÇÃO O mercado imobiliário é um dos segmentos que mais crescem atualmente, sendo de fundamental importância para o crescimento e desenvolvimento de uma região. No Brasil, verifica-se um grande avanço neste setor, apresentando-se como um dos mais produtivos da economia na geração de negócios, emprego e renda. No primeiro semestre de 2009, segundo a Associação de Entidades de Crédito Imobiliário e Poupança(Abecip), aproximadamente treze bilhões de reais em recursos da poupança foram destinados ao financiamento da casa própria e mais de 2 bilhões de dólares circulam em transações imobiliárias, situandoo Brasil à frente de outros países, como Argentina, México e Chile. Dessa forma, a determinação dovalor de imóveis tornou-se um parâmetro de extrema importância em diversos segmentos da sociedade,em particular, órgãos governamentais e privados tais como: prefeituras (elaboração de plantas genéricasde valores, cobrança de IPTU e ITBI, desapropriações); Serviço de Patrimônio da União (cobrança delaudêmio, foro); Receita Federal (cobrança de impostos sobre ganhos de capital, verificação da possibilidade de transações infra ou super valoradas que envolvam lavagem de dinheiro); INCRA (pagamentode desapropriações rurais para instituição da reforma agrária); Poder Judiciário (avaliações para subsidiar decisões judiciais); Agentes Financeiros (garantia de financiamento, limite de operações de crédito,leilões) e empresas privadas (operações de compra e venda, análise de viabilidade de empreendimentos)[5]. Vários estudos na literatura nacional vêm sendo desenvolvidos, com o objetivo de flexibilizar a modelagem da equação de preços hedônicos [2]-[3]-[4], de modo que osmodelos construídos expliquem de maneira fidedigna a dinâmica existente no mercado imobiliário. Maisrecentemente, FLORENCIO [6], propôs um modelo Aditivo Generalizado para Posição, Escalae Forma, para construção da equação de preços hedônicos para terrenos na cidade de Aracajú. Em João Pessoa (PB), segundo dados do Sindicato da Indústria da Construção Civil (Sinduscon-JP), apontam que as vendas de imóveis na cidade vêm crescendo de forma acentuada nos últimos anos.Segundo a Pesquisa de Mercado de Lançamentos Imobiliários, feita a pedido do sindicato, em 2005 omercado imobiliário apurou R$ 185 milhões, já em 2010 foram registradas vendas equivalentes a R$ 1,46bilhão. Diante deste crescimento, torna-se fundamental a determinação técnica do valorde apartamentos na cidade de João Pessoa, de forma a auxiliar na tomada de decisões, cabendo à engenharia de avaliações enquanto ciência do valor, coletar, organizar e analisar dados do mercado imobiliário. Porém, geralmente dados do mercado imobiliário apresentam não normalidade e heterocedasticidade, tornandoseinviável a utilização de modelos clássicos de regressão para avaliação de imóveis, uma vez que a nãoverificação dessas suposições podem comprometer as conclusões tomada com bases nesses modelos. Desse modo, o presente trabalho tem como objetivo, utilizar uma classe mais geral de modelos proposta por Rigby & Stasinoupolos [8], denominada de Modelos Aditivos Generalizados para Posição,Escala e Forma (GAMLSS), para construção de um modelo de precificação para os apartamentos na cidadede João Pessoa. II. MATERIAIS Os dados básicos para a realização da modelagem foram coletados obedecendo ao critério de Amostragem Probabilística Estratificada, obtidos através de pesquisas junto às imobiliárias da cidade de JoãoPessoa, obtendo um total de 250 imóveis entre novos e antigos. A divisão dos estratos (bairros) foirealizada conforme a oferta de imóveis nesses bairros segundo as imobiliárias (imóveis a venda). A variável resposta (dependente) éo preço (y), que representa o valor de venda do apartamento em reais. Foram estabelecidas seis variáveis independentes: número de dormitórios (x1), área total (x2), número de suítes (x3), número de banheiros (WC) (x4), Pólo de valorização (x5) e número de vagas na garagem(x6). III.GAMLSS Na estrutura de regressão dos Modelos Aditivos Generalizados para Posição, Escala e Forma (GAMLSS) [8] os p parâmetros 𝜃𝜃 𝑇𝑇 = �𝜃𝜃1 , … , 𝜃𝜃𝑝𝑝 � de uma função densidade de probabilidade 𝑓𝑓(𝑦𝑦/𝜃𝜃) são modelados utilizando termos aditivos. Aqui, presume-se que para 𝑖𝑖 = 1, … , 𝑛𝑛 as observações 𝑦𝑦𝑖𝑖 são independentes e condicionais a 𝜃𝜃 𝑖𝑖 , com função densidade 𝑓𝑓(𝑦𝑦/𝜃𝜃 𝑖𝑖 ), onde 𝜃𝜃 𝑖𝑖𝑖𝑖 = �𝜃𝜃𝑖𝑖1 , … , 𝜃𝜃𝑖𝑖𝑖𝑖 � é um vetor de pparâmetros relacionado às variáveis explicativas e efeitos aleatórios. Seja 𝑦𝑦 𝑇𝑇 = �𝑦𝑦1 , … , 𝑦𝑦𝑝𝑝 � o vetor de observações da variável resposta. Considere ainda, para 𝑘𝑘 = 1, … , 𝑝𝑝, uma função de ligação monótono 𝑔𝑔𝑘𝑘 (. ) relacionado o 𝑘𝑘-ésimo parâmetro 𝜃𝜃𝑘𝑘 às variáveis explicativas e efeitos aleatórios por meio de um modelo aditivo dado por: 𝐽𝐽 𝑔𝑔𝑘𝑘 (𝜃𝜃𝑘𝑘 ) = 𝜂𝜂𝑘𝑘 = 𝑋𝑋𝑘𝑘 𝛽𝛽𝑘𝑘 + ∑𝑗𝑗 𝑘𝑘=1 𝑍𝑍𝑗𝑗𝑗𝑗 𝛾𝛾𝑗𝑗𝑗𝑗 (1) em que 𝜃𝜃𝑘𝑘 e 𝜂𝜂𝑘𝑘 são vetores n x 1, 𝛽𝛽𝑘𝑘 é um vetor de parâmetros desconhecidos de tamanho 𝐽𝐽𝑘𝑘 e 𝑋𝑋𝑘𝑘 e 𝑍𝑍𝑗𝑗𝑗𝑗 são matrizes contendo as variáveis explicativas. Os parâmetros em GAMLSS são estimados através maximização da função verossimilhança penalizada. Para checar a adequação do modelo são usadas técnicas gráficas baseadas nosresíduos proposto por Dunn&Smyth [7]. Para seleção do melhor modelo, utiliza-se os critérios de AIC, BIC e GD. IV. RESULTADOS E DISCUSSÕES Inicialmentefoi feito um estudo descritivo da variável resposta, a fim de verificar o perfil do preço dos imóveis e com isso propor algumas distribuições para a variável dependente (preço do imóvel emreais). Verificou-se que o preço médio dos apartamentos na capital paraibana é de aproximadamente 218.317,00 reais, com um desvio padrão de 124.684,5, gerando assim um coeficiente de variação de 57,11%, indicando assimque existe uma variabilidade considerável nos preços dos apartamentos. Com relação à assimetria ecurtose, podemos verificar uma assimetria positiva, e uma curtose indicando que a distribuição tem um achatamento leptocúrtico. Com isso, algumas distribuições constantes no pacote gamlss da plataforma R com suporte positivo, foram definidas, tais como: Gama, Gaussiana Inversa, Gama Generalizada, etc. TABELA IESTATÍSTICAS DESCRITIVAS DA VARIÁVEL RESPOSTA Estatística Estimativa Média Mínimo 218.316,9 36.000 Máximo Mediana Desvio padrão 760.000 200.000 124.684,5 Assimetria 1,7327 Curtose 4,1459 Para selecionar as covariáveis significativas para predição do preço dos apartamentos, utilizou-se o método stepwise com auxilio da função stepGAIC, que seleciona o conjunto de variáveis que minimizam o critério de informação de AKAIKE generalizado. Dessa forma, apenas as variáveis área do imóvel, número de WCs e número de vagas na garagem foram significativas ao nível de 5% para os modelos ajustados com base nas distribuições definidas. Dentre os modelos ajustados, o modelo com distribuição Gama Generalizada, função de ligação identidade, suavizador spline cúbico com 3 graus de liberdade na variável área do imóvel, configurou-se como melhor modelo utilizando os critérios AIC, BIC e GD. Porém, através da análise residual, verificouse que apesar do bom ajuste da distribuição, os resíduosnão estavam dispersos de forma satisfatória. Isso se deve a grande variabilidade de preços encontrados no mercado imobiliário pessoense. De forma a tentar reduzir essa variabilidade, foi feita uma transformação logarítmica nos preços dos apartamentos. Verificou-se a partir do histograma que esta transformação tornou a distribuição dos dados simétrica. Assim, algumas distribuições de probabilidade adequadas para modelar variáveis com simetria foram propostas para modelar o logaritmo do preço dos apartamentos tais como: normal, logística, t, t generazaliza, skew t, etc. Dentre os modelos ajustados, utilizando-se os critérios AIC, SBC e GD o modelo com distribuição Skew t, ligação logarítmica, configurou-se como o mais adequado para estimação do log dos preços dos imóveis. Para esse modelo apenas as variáveis área do imóvel e número de vagas na garagem foram significativas, cujos sinais das estimativas dos parâmetros encontram-se como o esperado no mercado imobiliário, o que não foi visto para os demais modelos ajustados. Além disso, para tonar o modelo mais flexível, utilizou-se um suavizador spline cúbico na variável área do apartamento em m2. Para verificação da adequação do modelo utilizou-se o gráficos dos resíduos versus valores ajustados (Fig.1), gráfico de probabilidade normal (Fig.2) e Worm-plot.Do gráfico ilustrado na Fig.1, verifica-se que os pontos encontram-se dispersos de forma aleatória para o modelo ajustado, indicando um bom ajuste. Para os demais modelos, verificouse uma tendência nesse gráfico sugerindo que para apartamentos mais caros o erro de predição era reduzido, enquanto que para apartamentos com preço mais baixo o erro era considerável. Através do gráfico de probabilidade normal e do Worm-plot, verifica-se que a distribuição ajustou-se satisfatoriamente aos dados. Para o modelo ajustado, obteve-se um pseu-R2 de 0,73, ou seja, as duas covariáveis explicam 73% da variação do preço dos apartamentos em João Pessoa. Para o modelo clássico de regressão obteve-se um R2 de 68%, o que mostra um ganho em predição com o uso do modelo proposto. Já para o modelo com distribuição Gama Generalizada mencionado anteriormente, obteve-se um pseudo-R2de 71%. construída a curva suavizada para a variável área do imóvel, permitindo verificar a contribuição desta para o logaritmo do preço dos apartamentos ao longo de todos os seus possíveis valores. Assim, a partir da Fig. 5, verifica-se uma contribuição positiva para a variável resposta a partir de uma área de100 m2. Para apartamentos com área inferior a este valor, verifica-se uma contribuição aproximadamente nula para formação do valor dos apartamentos. Dessa forma, verifica-se o ganho em predição do modelo Skew t em relação aos demais. Além disso, para este modelo, as suposições foram verificadas, principalmente no que diz respeito ao comportamento dos resíduos, de forma que predições com o modelo proposto serão mais precisas, reduzindo possíveis vieses. Fig. 1. Gráfico dos resíduos versus valores ajustados Após o ajuste do modelo, torna-se fundamental analisar a relação existente entre regressando e regressores através dosinal das estimativas dos parâmetros relacionados às covariáveis. TABELA IIESTIMATIVAS DOS PARÂMETROS DO MODELO Variáveis Estimativa Erro-padrão p-valor Intercepto 2.445 0.004 0.000 cs(Área,df=3) 0.001 0.000 0.000 Garagem 0.016 0.003 0.000 Fig. 2. Gráfico de probabilidade Fig. 4. Curva suavizada da variável área do imóvel V. CONCLUSÕES Fig. 3. Worm-plot dos resíduos Desse modo, a TABELA II, sumariza as estimativas dos parâmetros para o modelo Skew t ajustado aos dados. Para a variável área do imóvel, verifica-se um sinal positivo, indicando que quanto maior a área do imóvel, mais caros são os apartamentos, o que é esperado no mercado imobiliário. Para a variável número de vagas na garagem, nota-se um sinal positivo, o que sugere que apartamentos com mais vagas na garagem são mais caros. Como complemento, foi O presente trabalho teve como objetivo a construção de um modelo preditivo para o valor de apartamentos na cidade de João Pessoa-PB, com base na classe de modelos GAMLSS, de forma a reduzir possíveis erros de especificação distribucionais, e funcionais impostas por modelos mais restritivos como LM e GLM. Após a modelagem de diversos modelos, derivados da combinação entre funções de ligação, distribuições de probabilidade e termos de suavização, verificou-se através dos critérios AIC, BIC e GD, que o modelo com distribuição gama generalizada obteve melhor resultado. No entanto, através da análise de diagnóstico, observou-se que os resíduos não estão dispersos de forma satisfatória. Desse modo, aplicou-se uma distribuição log na resposta e assumiu-se uma distribuição Skew t com ligação log, produzindo resultados satisfatórios. Verificou-se do modelo um aumento no poder de predição, sinalizado pelo PseudoR2, cuja estimativa foi de 73%. Além disso, através das estimativas dos parâmetros permitiu-se identificar padrões de associação entre regressando e regressores. De uma forma geral, verifica-se que a classe GAMLSS configura-se como modelos alternativos mais flexíveis que os modelos tradicionalmente utilizados na avaliação técnica de imóveis, permitindo a construção de modelos mais fidedignos à realidade encontrada nos mercados imobiliários. [4] DANTAS, R. A. & CORDEIRO G.M. (2001). Evaluation of the Brazilian city of Recife’s condominiummarket using generalized linear models. The Appraisal Journal 69, 247-257. [5] DANTAS, R.A., MAGALHAES, A. M., VERGOLINO, J. R. O. (2003). Modelos espaciais aplicados ao mercado de apartamento do Recife. In: XI COBREAP-Congresso Brasileiro de Engenharia de Avaliações e Perícias, Belo Horizonte. Anais do IBAPE. v. 1. p. 150170. [6] DUNN, P.K. & SMYTH, G.K. (1996). Randomisedquantile residuals. Journal of Computationaland Graphical Statistics 5, 236_244. [7] FLORENCIO, L., CRIBARI-NETO, F., OSPINA, R.Real Estate Appraisal of Land Lots Using GAMLSS Models. Chilean Journal of Statistics, v. 3, p. 75-91, 2012. [8] RIGBY, R.A. STASINOPOULOS, D.M. (2005). Generalized additive models for location, scale and shape (with discussion), Applied Statistics 54, 507554. REFERÊNCIAS [1] AKAIKE, M. Information measures and model selection. (1983). Bulletin of the International Statistical Institute 50, 277-290. [2] DANTAS, R. A.& CORDEIRO G.M. (1988). Uma nova metodologia para avaliação de imóveis utilizando modelos lineares generalizados. Revista Brasileira de Estatística 191, 27-46. [3] DANTAS, R. A. & CORDEIRO, G.M. (2000). Uma avaliação do mercado de apartamentos do Recife utilizando modelos lineares generalizados. XIX Congresso Panamericano de Avaliações, Margarita, Venezuela.