AVALIAÇÃO DE VENDAS DE IMÓVEIS USANDO MODELO
PROBIT
Francisco José Sales Rocha
Professor Assistente III Universidade Federal do Ceará.Doutorando em Economia, PIMES - UFPE
Manoel Estevão da Costa, 84, APTO.06, IPUTINGA,Recife , PE .50670-590. [email protected]
Rubens Alves Dantas
Professor do Departamento de Engenharia de Produção da UFPE. Doutorando em Economia, PIMES-UFPE
.Rua Gildo Neto, 62, Tamarineira,Recife, PE, Brasil- CEP 52.050-130. [email protected]
ABSTRACT
This paper presents a new methodology for evaluation of the speed of commercialization of
Real State using the model PROBIT, in function of your physical, localization and
economical characteristics. It is of highest importance for decision of investors',
constructors, real estate credit banks and other agents of the real estate market. In an
application to real data accomplished in Recife, it is verified that the position of an
apartment of distant for near of the beach, the marginal probability of sale it increases
from 16% to those possess state of bad conservation and of 39% when the conservation
state is good. It is also concluded that an increase exists in the probability of sales of 27%
for the distant apartments of the beach, when the conservation state varies of bad for good,
while this probability is from 50% to the ones that they are near the beach. The results
demonstrate the potentiality of the statistical tools used to detect the probability of sales of
real estates, technique until then not spread in real state sector in Brazil.
Keywords: Sales of Real State, Probit Model, Engineering Of Evaluations.
1. Introdução
É de conhecimento comum que dentre as diversas variáveis responsáveis pela
valorização de um imóvel, a localização é a mais importante. Desta forma, entre dois
imóveis com preços e demais características semelhantes, com exceção da localização, é
provável que o mais bem localizado seja vendido num prazo mais curto, isto é, tenha uma
velocidade de comercialização maior. Uma informação de grande interesse para os agentes
do mercado imobiliário diz respeito a quantificação desta probabilidade. Este trabalho
apresenta uma metodologia para avaliação desta probabilidade utilizando-se o modelo
PROBIT, cuja descrição resumida será apresentada na seção 2. Na seção 3 a metodologia é
aplicada a uma amostra de dados reais situados na praia de Boa Viagem, Recife-PE, onde
estas probabilidades são estimadas levando-se em conta também o estado de conservação
do imóvel, outro fator determinante na velocidade de comercialização. Na última seção
serão apresentadas as conclusões.
2 O Modelo Teórico de Variável Dependente Binária: PROBIT
Nesta classe de modelos, a variável dependente, y, pode assumir somente dois
valores. Dessa forma, a mesma pode representar a ocorrência de um evento ou a escolha
entre duas alternativas. Por exemplo, pode-se estar interessado em modelar a probabilidade
de venda de um imóvel, y, em função de um vetor, x, de variáveis explicativas formadas
pelas suas características físicas, locacionais e econômicas. O objetivo do modelo pode ser
quantificar a relação entre as variáveis explicativas e a probabilidade de venda do imóvel;
ou analisar qual o efeito marginal, em termos probabilísticos, de uma dada variável
explicativa, sobre esta probabilidade, como por exemplo sua localização em relação ao
contexto urbano.
Admita que a variável dependente, y, assume os valores zero (imóvel não vendido) e
um (imóvel vendido). Uma regressão linear simples de y em função de x, que representa
um Modelo de Probabilidade Linear, não é apropriada, pois os termos de erros não
possuem distribuição normal, mas binomial e são heterocedásticos, podendo ainda ocorrer
que as probabilidades condicionais calculadas não pertençam ao intervalo fechado 0 e 1.
Portanto, deve-se trabalhar com uma especificação projetada para controlar as exigências
de modelos com variáveis dependentes binárias. Suponha que a probabilidade de se
observar yt=1 é dada pelo modelo PROBIT (função de distribuição cumulativa da
distribuição normal padrão), ou seja,
'
Pr ob( yt = 1) = ∫ −β∞x Φ (t )d t = Φ ( β ' x)
(2.1)
Onde a função Φ (.) é a notação usual para a distribuição normal padrão cumulativa; e
β é o vetor de parâmetros das variáveis explicativas consideradas.
Com base em (2.1), pode-se estimar, via máxima verossimilhança, os parâmetros do
modelo e obter:
∧
Φ( x ' β )
(2.2)
A interpretação dos valores dos coeficientes estimados é complicada, mas o efeito
marginal na probabilidade condicional da variável dependente (com yt=1) provocado por
uma dada variável explicativa binária que assume valores zero e 1, como por exemplo:
x2=1 ou x2=0 é dado por:
Prob(yt=1, x2=1) menos Prob(yt=1, x2=0), ou seja,
∧
∧
Φ ( x ' β / x2 = 1) - Φ ( x ' β / x2 = 0)
(2.3)
Após se estimar o modelo PROBIT, a qualidade dos resultados obtidos deve ser
analisada com base nos seguintes elementos:
a) estatística de teste LR (Razão de Verossimilhança) que testa a hipótese nula de que as
variáveis explicativas em conjunto não têm efeito sobre y;
b) os resultados obtidos só são válidos se os termos de erros do modelo ajustado, via
máxima verossimilhança, são homocedásticos. Caso isso não se verifique, tem-se que
os estimadores gerados são inconsistentes. Dessa forma, faz-se necessário testar a
hipótese nula de termos de erros homocedásticos. Isto pode ser feito por meio do teste
de heterocedasticidade do Multiplicador de Lagrange (ou teste LM), usando o método
da regressão artificial proposto por Davidson e MacKinon (1993, seção 15.4), que se
desenvolve da seguinte forma:
Passo 1: Determina-se a variável causadora da heterocedasticidade. Por exemplo, a
variável x2;
Passo 2: Ajusta-se a seguinte regressão, via Mínimos Quadrados Ordinários:
∧
brmr_y = h [fac, x2*fac, x3*fac, x4*fac, x5*fac, x6*fac, x7*fac, x8*fac, x2*(- x ' β )*fac]
Onde,
brmr_y : são os resíduos padronizados da regressão estimada via máxima verossimilhança;
∧
∧
∧
∧
∧
e fac = @dnorm(- x ' β )/[ p *(1- p )]0.5, sendo p = Φ ( x ' β ) ;
Passo 3: com base no passo 2, obtém-se a soma dos quadrados dos valores ajustados;
Passo 4: Sob a hipótese nula, constrói-se a seguinte estatística de teste:
LM = soma dos quadrados dos valores ajustados ≈ χ 12
Critério do teste: Se a estatística LM calculada for maior que o valor crítico da χ12
tabelada, então rejeita-se a hipótese nula de termos de erros homocedasticos; caso
contrário, aceita-se a hipótese nula.
3. O Modelo Empírico
3.1 Descrição da Amostra
Analisa-se uma amostra formada por 59 dados de mercado de apartamentos, extraída
do banco de dados do setor de Engenharia da Caixa Econômica Federal, situados em Boa
Viagem, um dos bairros mais valorizados do Recife, capital do estado de Pernambuco,
Brasil, banhado por uma das mais belas praias do País – a Praia de Boa Viagem. Verificouse na amostra coletada que apenas 41% dos dados encontram-se próximos à praia e ainda
32% correspondem a apartamentos vendidos estando o restante em oferta. Além dos preços
dos apartamentos a amostra traz informações a respeito das suas características físicas tais
como: o estado de conservação, o número de vagas de estacionamento, a área privativa, a
idade do prédio e ainda o pavimento em que se encontra a unidade.
Considera-se como variável dependente, y, a natureza do evento, assumindo valor
1(um) quando se refere a apartamento vendido e zero para apartamentos que ainda estão
em oferta. Para explicar as variações sofridas pala variável dependente foram consideradas
as seguintes variáveis explicativas: preço observado no mercado (PREÇO), localização do
prédio no bairro (SETOR), pavimento em que se encontra o apartamento (NÍVEL), número
de vagas de estacionamento (VAGAS), área privativa (PRIVAT), estado de conservação
(CONS) e idade do prédio(IDADE), conforme discriminadas no quadro a seguir:
Variáveis
Descrição
PREÇO
preço do apartamento observado no mercado em R$;
SETOR
variável dummy, assumindo 1 se próximo à praia e zero em caso contrário;
NIVEL
pavimento onde se situa a unidade no prédio
VAGAS número de vagas de estacionamento pertencentes à unidade;
PRIVAT variável indicativa da área privativa da unidade medida em m2;
CONS
variável qualitativa que representa a conservação do prédio e da unidade.
IDADE
variável correspondente à idade do prédio em anos, a partir do seu habite-se;
Quadro 3.1- Definição das variáveis utilizadas no modelo
3.2 O Modelo Estimado
A equação geral do Modelo em função das variáveis explicativas adotadas é
representada por:
'
Pr ob( y t = 1) = ∫ −β∞x Φ (t )d t = Φ ( β ' x) ou
Φ ( β ' x) = Φ ( β 1+ β 2CONS+ β 3IDADE+ β 4NIVEL+ β 5PRECO+ β 6PRIVAT
β 7SETOR+ β 8VAGAS)
(2.1)’
O Modelo estimado para a amostra coletada é dado por:
∧
∧
∧
∧
∧
∧
Φ ( x ' β ) = Φ ( β 1+ β 2CONS+ β 3IDADE+ β 4NIVEL+ β 5PRECO
∧
∧
∧
β 6PRIVAT+ β 7SETOR+ β 8VAGAS)
(2.2)’
Os efeitos marginais na probabilidade condicional da variável dependente (com yt=1)
provocado pela variável SETOR quando a mesma assume valores um e zero,
respectivamente, são dados por:
∧
∧
Φ ( x ' β / SETOR = 1) - Φ ( x ' β / SETOR = 0)
∧
∧
∧
∧
∧
∧
Φ [ β 1+ β 2CONS+ β 3IDADE+ β 4NIVEL+ β 5PRECO β 6PRIVAT
∧
∧
∧
∧
∧
∧
+ β 7 (SETOR=1)+ β 8VAGAS] – Φ [ β 1+ β 2CONS+ β 3IDADE+ β 4NIVEL
∧
∧
∧
∧
+ β 5PRECO β 6PRIVAT+ β 7 (SETOR=0)+ β 8VAGAS]
(2.3)’
Substituindo-se os parâmetros estimados, via o programa EVIEWS (Econometric Views),
na equação (2.3)’ obtém-se:
Φ [-1,293086 + 0,00657*CONS - 0,013112*IDADE + 0,094342*NIVEL –
0,0000434*PRECO + 0,026706*PRIVAT + 0,093737*VAGAS] Φ [-2,313588 + 0,00657*CONS - 0,013112*IDADE + 0,094342*NIVEL –
0,0000434*PRECO + 0,026706*PRIVAT +0,093737*VAGAS]
(2.4)
No presente trabalho, a estatística LR é igual a 15,46. Como o valor crítico da χ 72
tabelada é 14,067, a um nível de significância de 5%, então rejeita-se a hipótese nula de
que as variáveis explicativas em conjunto não têm influência sobre y; e a estatística LM
calculada é igual a 0,302444 e 0,213724, assumindo-se, respectivamente, PRIVAT e
SETOR como possíveis variáveis causadoras de heterocedasticidade. Como o valor crítico
para a estatística χ12 tabelada é 3,841, a um nível de significância de 5%, então não se deve
rejeitar a hipótese nula de termos de erros homocedásticos. Logo, concluí-se que os
resultados gerados pelo modelo são bastante robustos (ou confiáveis).
3.3 Análise dos Resultados
Os resultados sumarizados encontram-se no quadro 3.2, onde os mesmos estão
calculados para as situações limites do estado de conservação abrangidos pelo espaço
amostral, isto é para um estado de conservação nas condições ruim e bom, para
apartamentos localizados distante (SETOR=0) e próximos da praia (SETOR=1), tomando
por base a equação (2.4). Verifica-se que variando a posição de um apartamento de distante
para próximo da praia, a probabilidade (marginal) de venda aumenta de 16% para aqueles
que possuem estado de conservação ruim e de 39% quando o estado de conservação é bom,
mantendo-se as condições médias das demais variáveis explicativas adotadas. Este
resultado indica que, no segmento de mercado em estudo, o público comprador de
apartamento mais próximos à praia é mais exigente com relação ao estado de conservação,
isto é a função de utilidade do consumidor é crescente com o estado de conservação, na
medida em que o apartamento se aproxima da praia. Chega-se a esta mesma conclusão
quando se mantém a posição do apartamento constante em relação à praia e se faz varia o
estado de conservação. Existe um aumento na probabilidade de vendas de 27% para os
apartamentos distantes da praia, quando o estado de conservação varia de ruim para bom,
enquanto que esta probabilidade é de 50% para os que estão próximos à praia.
Posição em Relação à Praia
Estado de
Conservação
Distante
Próximo
Ruim
0,03
0,19
Bom
0,30
0,69
Incremento
0,27
0,50
Quadro 3.2 - Resumo das Probabilidades de Vendas
Incremento
0,16
0,39
Uma visualização para vários níveis de estados de conservação,eixo horizontal, pode
ser observada na figura 3.1. A linha tracejada indica a variação destas probabilidades para
apartamentos distantes da praia enquanto a linha cheia representa esta mesma variação para
os que estão próximos dela. O eixo vertical indica a probabilidade de venda do
apartamento.
80
60
40
PROB1
PROB0
20
0
100
150
200
250
300
CONS
Figura 3.1 – Variação das probabilidades de vendas de apartamentos
4. Conclusões e Recomendações
A metodologia apresentada para quantificar a probabilidade de vendas de imóveis em
função das suas características, utilizando o modelo PROBIT, pode servir de grande ajuda
para tomadas de decisão de investidores, incorporadores, bancos de crédito imobiliário e
demais agentes do mercado imobiliário. O estudo realizado no Recife para apartamentos,
em relação às variáveis localização e estado de conservação, pode ser aplicado para
quaisquer outros tipos de bens, fazendo-se as devidas adequações. Os resultados
demonstram a potencialidade do ferramental estatístico utilizado para detectar a velocidade
de comercialização de imóveis, técnica até então não difundida na análise do setor
imobiliário no Brasil.
5. Bibliografia
Davidson, Russell and James G. Mackinnon (1993) - Estimation and Inference in
Econometrics, Oxford University Press.
Dantas, R. A. (1998) – Engenharia de Avaliações – Uma Introdução à Metodologia
Científica – Editora PINI - São Paulo.
Greene, W. H. “Econometric Analysis” New York, MacGrall-Hill,1997.
Gujarati, D. “Basic Econometrics.” New York, MacGrall-Hill, 1995.
Johnston, J. and Dinardo, J. “Econometrics Methods.” New York, MacGrall-Hill, 1997.
Judge et al. 1986. The Theory and Practice of Econometrics. New York: John Wiley and
Sons.
OBSERVAÇÃO: sessão temática: 7.1 Avaliação de Mercado.
Download

Avaliação de vendas de imóveis usando modelo probit