Probit ordenado Alguns exemplos • Artigo: Corbi e Menezes-Filho (2006). Os determinantes empíricos da felicidade no Brasil. REP, vol. 26, n. 4, out-dez. • Investigar os determinantes empíricos da felicidade no Brasil através de uma base de dados ainda pouco utilizada no país, o World Values Survey (Pesquisa Mundial de Valores). • Analisar a associação de algumas variáveis sócioeconômicas, tais como renda, desemprego, educação, sexo, estado civil e idade, com a felicidade dos indivíduos. A renda e o desemprego serão examinados de forma a compreendermos de que maneira eles podem influir no nível de felicidade dos indivíduos. Medida de Felicidade • O modelo de probit ordenado é um modelo multinomial, e sua variável dependente assume valores que estabelecem um certo ordenamento dos dados, não de forma linear, mas sim de forma a ranquear os possíveis resultados. • A variável latente F associa números às respostas individuais, da seguinte forma: 1 para “infeliz”, 2 para não “muito feliz”, 3 para “feliz” e 4 para “muito feliz”. Multinomial: exemplo Banco de dados • Várias marcas de um produto estão no mercado. • Iremos explicar as escolhas dos consumidores por estas marcas considerando as seguintes variáveis explicativas: sexo (female) e idade (age). • Por exemplo, há um estudo que afirma que as mulheres escolhem mais cameras digitas Kodak e que homens preferem Canon. describe Contains data from mlogit.dta obs: 735 brand choices vars: 3 19 Jan 2006 09:43 size: 5,145 (99.4% of memory free) (_dta has notes) -----------------------------------------------------------------------------storage display value variable name type format label variable label -----------------------------------------------------------------------------brand byte %9.0g female byte %8.0g age byte %9.0g -----------------------------------------------------------------------------Sorted by: age mlogit brand female age, base(1) • • • • • • • • • • • • • • • • • • • • • • • • Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Multinomial logistic regression -795.89581 -709.10396 -703.08391 -702.97081 -702.9707 Number of obs = 735 LR chi2(4) = 185.85 Prob > chi2 = 0.0000 Log likelihood = -702.9707 Pseudo R2 = 0.1168 -----------------------------------------------------------------------------brand | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------2 | female | .5238143 .1942466 2.70 0.007 .143098 .9045307 age | .3682065 .0550031 6.69 0.000 .2604024 .4760106 _cons | -11.77466 1.77461 -6.64 0.000 -15.25283 -8.296483 -------------+---------------------------------------------------------------3 | female | .4659414 .2260895 2.06 0.039 .022814 .9090688 age | .6859082 .0626265 10.95 0.000 .5631626 .8086539 _cons | -22.7214 2.058027 -11.04 0.000 -26.75505 -18.68774 -----------------------------------------------------------------------------(brand==1 is the base outcome) git brand female age, base(1) Alguns resultados • Para a mudança de uma unidade da variável idade, o log da razão entre as duas probabilidades, P(brand=2)/P(brand=1), irá aumentar em 0.368 e o log da razão das duas probabilidades P(brand=3)/P(brand=1) irá aumentar em 0.686. • Podemos dizer que, em geral, as pessoas mais velhas irão preferir brand 2 ou 3. • A razão entre a probabilidade de escolher uma categoria e a probabilidade de escolher a categoria de referência é denominada de risco relativo (odds). • Os resultados podem ser interpretados em termos de risco relativo. • Podemos dizer que para mudança de uma unidade da idade, esperamos que o risco relativo de escolher brand 2 ao invés de brand 1 aumente de exp(.3682) = 1.45. O risco relativo é maior para pessoas mais velhas. • Para a variável female, a razão do risco relativo de escolher brand 2 ao invés de 1 para mulheres e homens é exp(.5238) = 1.69. • Rrr no mlogit dá o risco relativo no Stata. (mlogit, rrr) 0 .2 .4 .6 .8 1 line p1 age if female ==0 || line p1 age if female==1, legend(order(1 "male" 2 "female")) 25 30 35 age male female 40