MINISTÉRIO DA FAZENDA ESCOLA DE ADMINISTRAÇÃO FAZENDÁRIA – ESAF IX PRÊMIO TESOURO NACIONAL- 2004 TEMA 3: Tributação, Orçamentos e Sistemas de Informação sobre Administração Financeira Pública. SUBTEMA 3.6 - Previsão de arrecadação tributária. TÍTULO DA MONOGRAFIA: MODELOS DE TRIBUTAÇÃO ÓTIMA DA RENDA: O CÁLCULO DE ALÍQUOTAS MARGINAIS ASSINTÓTICAS PARA O BRASIL NO ANO DE 2000. OUTUBRO/2004 SUMÁRIO Página LISTA DE QUADROS, GRÁFICOS E TABELAS RESUMO ABSTRACT iii iv v 1. INTRODUÇÃO 01 2. MODELO CLÁSSICO DE TRIBUTAÇÃO ÓTIMA DA RENDA 2.1 - Introdução 2.2 - Revisão da Literatura 2.3 - Modelo Clássico Mirrlees (1971): Uma visão geral 2.3.1 Análise Matemática 2.4 - Conclusão 10 10 11 22 24 40 3. MODELO CLÁSSICO REVISITADO: TRIBUTAÇÃO ÓTIMA DA RENDA UTILIZANDO ELASTICIDADES - MODELO SAEZ PARA RENDIMENTOS ELEVADOS 3.1 - Introdução 3.2 - O Modelo Saez para rendimentos elevados 3.2.1 Derivação do Modelo 3.2.2 Resultados empíricos para os EUA 3.3 - Conclusão 42 4. APLICAÇÃO DO MODELO SAEZ PARA RENDIMENTOS ELEVADOS: CÁLCULO DE ALÍQUOTAS MARGINAIS ASSINTÓTICAS PARA O BRASIL NO ANO DE 2000 4.1 - Introdução 4.2 - Alíquota Ótima sobre Rendimentos Elevados 4.2.1 Descrição dos Dados 4.2.2 O quociente zm/z* 4.2.3 Resultados empíricos Brasil 4.3 Conclusão 54 5. CONCLUSÃO 63 REFERÊNCIAS BIBLIOGRÁFICAS APÊNDICE ANEXO 69 73 81 ii 42 43 43 50 53 54 55 55 57 59 62 LISTA DE QUADROS, FIGURAS, GRÁFICOS E TABELAS Página QUADROS Quadro 1 - Propriedades do Modelo Clássico Quadro 2 - Importância do Efeito Renda para o desenho tributário ótimo nas faixas de rendimentos elevados FIGURAS Figura 1 - Perturbação na alíquota tributária sobre rendas elevadas GRÁFICOS Gráfico 1 - Quociente zm/z* entre R$ 0 e R$ 10 milhões/ano (Ano 2000 Brasil) Gráfico 2 - Quociente zm/z* entre R$ 0 e R$ 40 mil/ano (Ano 2000 - Brasil) Gráfico 3 - Quociente zm/z* entre R$ 13 mil e R$ 10 milhões/ano (Ano 2000 - Brasil) TABELAS Tabela 1 - Alíquotas tributárias ótimas para contribuintes com rendimentos elevados: caso americano Tabela 2 - Indicadores básicos da DIRPF 2001 Tabela 3 - Resumo sintético dos dados da DIRPF 2001 Tabela 4 - Alíquotas Ótimas sobre rendimentos elevados para o ano de 2000 - Brasil iii 17 20 46 57 58 58 51 55 56 61 RESUMO Palavras-chave: tributação ótima da renda, alíquota marginal assintótica, elasticidades, distribuição empírica de rendimentos. O objetivo central do trabalho é obter alíquotas ótimas para as faixas de renda mais elevadas - alíquota assintótica -, utilizando distribuições empíricas de rendimentos e parâmetros realistas de elasticidades. Para tanto, são desenvolvidos os modelos: clássico (Mirelees, 1971) e de perturbação (Saez, 2001), que explicam a tributação ótima da renda, com vistas a realizar simulações numéricas (calibragens) para o caso da alíquota assintótica para o Brasil, a partir dos dados contidos nas Declarações do Imposto de Renda Pessoa Física relativas ao ano de 2000. Os resultados alcançados sugerem que a alíquota assintótica média, 37,3%, é maior do que a praticada em 2003, 27,5%, como também do que aquela inicialmente estabelecida em 1995, 25%. Além disso, quando não há dedução do imposto indireto, que distorce a escolha entre lazer e consumo, a alíquota assintótica ótima para o caso americano (1992), segundo Saez (2001) igual a 50%, é similar à calculada para o Brasil nas mesmas condições, 46%, embora a estabilidade da distribuição empírica de rendimentos americana seja maior do que a brasileira. iv ABSTRACT Keywords: optimal income taxation, asymptotic marginal rate, empirical earning distribution. The main objective of this work is to obtain an optimal tax rate for high-income earners, using empirical earning distributions and a range of realistic elasticity parameters. Therefore, are developed the Mirrlees (1971) model of determining the optimal income tax rates and Saez (2001) variant, which uses elasticities to derive optimal income tax rates. Moreover, simulations using the Saez model are presented to derive high-income optimal tax rates - asymptotic rates - for the Brasilian case in 2000. The results suggests that, on average, the Brasilian marginal optimal asymptotic rate, 37,3%, is substancially higher than the actual tax rate, 27,5%. Furthemore, assuming that there are no other taxes distorting the leisureconsumption choice, the optimal asymptotic rate for the American case, 50%, following Saez (2001), is very similar to the Brasilian case, 46%, although the American empirical income distribution is more stable than of Brasilian’s one. v 1. Introdução “Taxation, as Justice Holmes put it, is the price paid for civilization”.1 “We shall deal with our economic system as it is and is may be modified, not as it might be if we had a clean sheet of paper to write upon; and step by step we shall make it what it should be”. Woodrow Wilson.2 “Os principais defeitos de nossa sociedade são sua incapacidade de oferecer emprego e sua distribuição injusta de riqueza e renda... Na Grã-Bretanha, especialmente desde o fim do século XIX, algo foi feito para corrigir disparidades muito grandes de riquezas. Imposto sobre a renda e sobre a transmissão de herança e gastos públicos com serviços sociais contribuíram para esse resultado”. John Maynard Keynes.3 Uma das principais reformas que está sendo enfrentada pelo atual governo é a tributária. Em princípio, os objetivos centrais de uma reforma tributária deveriam ser o de aumentar a eficiência econômica e reduzir as desigualdades sociais, a partir da correção das distorções existentes no atual sistema. A proposta encaminhada pelo Governo Federal ao Congresso Nacional, ao final do mês de abril de 2003, engloba efetivamente esses dois objetivos. De um lado, o desenho geral da reforma discute a questão da eficiência em cima, principalmente, da reengenharia do Imposto de Circulação de Mercadorias e Serviços de transporte interestadual e intermunicipal e de comunicação (ICMS). Este redesenho do ICMS consiste da uniformização das legislações estaduais, com regulação do imposto exclusivamente por normas de caráter nacional, uniformização das alíquotas que serão em número máximo de cinco e cobrança na origem. 1 Richard MUSGRAVE, Public Finance and Public Choice:Two Contrasting Visions of the State, p. 75. Martim FELDESTEIN, On The Theory of Tax Reform, Journal of Public Economics 6 (1976), p. 77. 3 VALOR ECONÔMICO.EU&Fim de Semana. São Paulo, 14, 15, 16 e 17 de nov. de 2002. INÉDITO: Trecho de depoimento de Keynes, recolhido por um funcionário do governo Rooselvet e entregue ao Presidente em 1936 (Tradução de Celso M. Paciomik). p. 20. 2 1 De outro, centraliza o debate do tema da eqüidade a partir da autorização expressa da progressividade do Imposto sobre Transmissão intervivos, por ato oneroso, de Bens Imóveis ou de direitos sobre esses (ITBI), da seletividade do ICMS, propondo a aplicação da menor alíquota nas operações com gêneros alimentícios de primeira necessidade e da progressividade do Imposto sobre a Propriedade Rural (ITR) e sobre a Transmissão causa mortis e Doação de quaisquer bens ou direitos (ITCD). Ao final do mês de setembro de 2004, ou seja, após um ano e seis meses do envio pelo Governo federal do projeto de reforma constitucional ao Congresso Nacional, constata-se que o ganho de eficiência com a reforma - representado pela unificação do ICMS - ainda não foi aprovado4. Com isso, recrudesce a guerra fiscal entre os Estados, evidenciado-se atualmente a disputa tributária entre o estado de São Paulo e o Distrito Federal/Goiás. Por outro lado, os maiores ganhos de eqüidade - progressividade do ITBI e ITC - foram rejeitados pelo Congresso, restando apenas a possibilidade de progressividade no ITR. Alguns especialistas criticam a proposta, argumentando que ela é algo tímida em face das ineficiências do atual sistema e que ela poderia ser mais arrojada no que tange aos aspectos da melhoria da eficiência tributária. Curiosamente, não há críticas firmes sobre os aspectos relativos à eqüidade da proposição, que hoje se resumi à progressividade do ITR . Por outro lado, verifica-se uma estridência recorrente quando o governo acena com a possibilidade de propor elevação da 4 A Câmara dos Deputados ainda irá apreciar a Proposta de Emenda Constitucional nº 255/04 (PEC 255), que se encontra tramitando nessa Casa, com o restante e o mais polêmico do proposto originalmente na Reforma Tributária. Entre os pontos mais espinhosos e importantes estão a unificação da legislação do ICMS, a definição do número de alíquotas e se a cobrança será no estado de origem ou de destino e a criação do Fundo Nacional de Desenvolvimento Regional. Após votação em dois turnos na Câmara, a matéria será depois submetida à apreciação do Senado Federal também em dois turnos. 2 alíquota máxima do Imposto de Renda da Pessoa Física (IRPF), para não deixar dúvidas acerca de seu real compromisso com a progressividade da carga tributária. Esse comportamento estridente se justificaria, na argumentação de Werneck (2003), pois o incremento da alíquota máxima resultaria em ganhos de receita reduzidos, “... E recairia basicamente sobre assalariados de renda mais alta que não têm possibilidade de oferecer seus serviços através de pessoas jurídicas, de forma a conseguir abrigo sob um regime de taxação mais branda”. De qualquer forma, não se pode negar o empenho firme do governo eleito em 2002, no sentido de concretizar a aprovação de sua proposta de reforma, diferentemente do governo passado que, embora afirmasse que a reforma tributária fosse prioridade, não a tivesse implementada nos oitos em que esteve no poder. A razão para esse desfecho, porém nunca confessada formalmente, era a incerteza de que o novo sistema tributário pós-reforma pudesse garantir o montante de receitas auferidas ano após ano com seguidos recordes de arrecadação, mantidos até o exercício de 2004. De fato, o governo atual adota como estratégia para a reforma aquela explicitada por Feldstein (1975): “Reformas tributárias ótimas precisam ter como marco inicial a existência de um sistema em vigor e o fato de que mudanças factíveis são vagarosas e graduais”. Esse mesmo autor, além disso, afirma que a necessidade de mudanças graduais é também enfatizada por Rawls, quando esse último diz: “Sim, o passo da mudança e de reformas específicas exigidas num dado momento histórico dependem das condições correntes“ [Rawls (1971, p.261)]. Segundo Feldstein (1975), existem diferenças entre uma reforma tributária ótima e um desenho tributário ótimo. A reforma tributária ótima depende de seu 3 ponto de partida, ou seja, da estrutura existente e é geralmente gradual, enquanto o desenho tributário ótimo depende do contexto histórico para sua introdução, sendo, na verdade, um objetivo de médio e longo prazo, e tendo como característica intrínseca ser once-and-for- always. Em que pese a importância da reforma tributária em andamento, a nossa preocupação se dirige ao desenho tributário ótimo. Com efeito, a literatura acerca da tributação ótima da renda, de acordo com Auerbach e Hines (2001), mostra que historicamente muitos membros dos governos têm percebido que somente um desenho mais progressivo5, ou seja, alíquotas marginais crescentes sobre a renda, poderia fornecer um grau apropriado de progressividade para aqueles que se encontram no topo da pirâmide de distribuição da renda, aumentando, assim, o potencial de redistribuição da tributação direta: melhoria da eqüidade. Na realidade, o centro do debate do desenho tributário ótimo repousa sobre o trade-off entre eficiência e eqüidade, como relembra Saez (2000). A progressividade permite que o governo possa redistribuir melhor a renda, transferindo-a dos mais ricos para os mais pobres, porém a tributação progressiva com alíquotas marginais elevadas impõe custos sobre a eficiência da economia. Com efeito, alíquotas altas podem afetar os incentivos para o trabalho, e, em conseqüência, reduzir a base tributária ao produzir gravames excessivos - ineficiências - significativos. 5 Na realidade, a definição mais correta de sistema progressivo é aquele em que a alíquota média é crescente, não exigindo necessariamente que a alíquota marginal o seja. Um exemplo concreto dessa definição é dado em Fullerton e Metcalf (2002): Seja o montante de tributo T devido sobre a renda Y seguinte função linear da renda: T=m(Y-A), em que m é a alíquota tributária marginal e A a renda mínima > 0 (desconto padrão). Se a renda atinge patamar abaixo de A, então T pode ser negativo (o contribuinte recebe uma transferência do governo). Com efeito, esse possui uma alíquota média que inicia com um valor infinitamente negativo, cresce para zero quando o nível de renda é igual a A e continua a crescer com a renda (aproximando-se de m assintoticamente). De qualquer forma, adotamos nesse trabalho que a progressividade está ligada a alíquotas marginais crescentes, mais intuitivas para o homem da rua. 4 Nesse contexto, o estudo do desenho tributário ótimo, representado pelas alíquotas tributárias ótimas, em especial as relativas às rendas mais elevadas, se reveste de importância. De um lado, porque permite racionalizar o debate sobre a questão da progressividade sob o prisma da eficiência e eqüidade e, de outro, porque firma um compromisso de se buscar um objetivo de médio e longo prazo para uma transformação otimizada do modelo tributário. Cabe ressaltar, por oportuno, que o estudo da alíquota tributária ótima sobre a renda implica, pelo menos nesse trabalho, olhar sobre o tema abstraindo-se de questões referentes aos custos administrativos, financeiros e de compliance na modelagem da tributação ótima, que poderiam inibir o escopo da progressividade (Arnott, 1994), e também temáticas relativas aos efeitos do capital humano, ao seguro como bem público, à mudança tecnológica, à incerteza, e à economia informal, que exigiriam uma progressividade ainda mais forte (Haveman, 1994). De qualquer forma, é importante lembrar, como fez Haveman6, as palavras de um grande estudioso da matéria, Joseph Pechman (1990), em seu discurso como Presidente da Associação Americana de Economia, quando resumiu sua posição acerca da progressividade do imposto de renda: “Most people support tax progressivity on the ground that taxes should be levied in accordance with ability to pay, which is assumed to raise more than proportionately with income. Economists have... had trouble with the ’ability to pay’ concept...I believe that the person on the street is right and that we should continue to rely on the income tax to raise revenue in an equitable manner.’’. 6 Modern Public Finance (9. Optimal Taxation and Public Policy), p. 255:256. 5 O atual sistema de tributação da renda (IRPF) foi estabelecido pela Lei nº 9.250, de 26 de dezembro de 1995. As únicas modificações de fundo realizadas nesse modelo, desde sua implantação em 1996, foram a correção monetária das faixas de renda para o exercício de 2002 e o aumento da alíquota mais elevada de 25% para 27,5% desde 1998, após longos debates no Congresso Nacional, sendo que atualmente possui três faixas de renda e de incidência de valores de alíquotas marginais (isenção, 15% e 27,5%)7. As discussões das modificações no Congresso Nacional, até o final do ano de 2003, se travaram entre a esquerda, defendendo as correções das faixas e a redução da alíquota mais elevada, e o governo, que propunha a defesa do status quo, ou seja, a manutenção dos parâmetros tais como eram. Curiosamente, o governo defendia sua posição com o argumento ou temor de que qualquer alteração nos parâmetros reduziria a arrecadação da Receita Federal e, não, como seria de esperar, com base na defesa da eqüidade vertical (progressividade). Hoje, paradoxalmente, a esquerda, leia-se o Governo federal, resiste a correção das faixas e a redução da alíquota mais elevada, enquanto a oposição, antiga situação, luta pela mudança do status quo. Uma pergunta natural decorrente desse imbróglio seria: A alíquota de 27,5% é elevada e a de 25% seria ótima? Freqüentemente a questão da tributação ótima sobre a renda, em particular sua maior progressividade, é simplesmente retirada dos debates, como vimos anteriormente. Uma explicação para isso é dada pelo ex-presidente Fernando 7 A partir do segundo semestre de 2004, o Governo federal ajustou residualmente para maior a faixa de isenção. 6 Henrique Cardoso8, quando avalia o tema da distribuição de renda: “... Como é que o governo faz distribuição de renda? Por um lado, pagando os salários do funcionalismo público... Por outro lado, há transferência direta da renda aos menos favorecidos. Hoje, tudo que o governo federal arrecada de imposto de renda, de pessoa física e jurídica, é redistribuído sob a forma de dinheiro para os mais pobres... No Brasil há uma forte reação contra a distribuição de renda. Qualquer tentativa de aumentar o imposto de renda, por exemplo, é imediatamente sabotada“. Neste sentido, acreditamos que devem ser realizados esforços sistemáticos para derivar os modelos concretos e de simples manipulação de tributação ótima da renda, com vistas a aumentar sua utilização em estudos empíricos e, por conseqüência, evitar que os debates sobre esse tema sejam tradicionalmente centrados somente na eficiência (deadweight burden). Aliás, é bom citar nesse ponto a lembrança de Atkinson (1990) acerca da idéia de Okun, em seu famoso livro Equality and Efficiency: The Big Trade-off, quando admite a existência de dois objetivos fundamentais na tributação ótima, porém separados, o da eficiência e o da equidade: “If both equality and eficiency are valued, and neither takes absolute priority over the other, then, in places when the conflicts, compromises ought to be struck. In such cases, some equality will be sacrificed for the sake of efficiency, and some efficiency for the sake of equality” (1975, p.88). Os modelos apresentados no presente trabalho adotam como macroobjetivo a maximização de uma função de bem-estar social, donde há de vir, por decorrência, a 8 VEJA. São Paulo, 20 de nov. de 2002, número 1.778, Depoimento. FHC, oito anos depois (entrevista do Presidente Fernando Henrique Cardoso ao jornalista Roberto Pompeu de Toledo. p.92). 7 derivar conjuntamente os objetivos de eqüidade e eficiência, ao contrário da idéia de Okun que explica o atual nível dos debates: defesa intransigente da eficiência na discussão da alíquota tributária daqueles com rendas mais elevadas. A ênfase do trabalho, segundo preceito de Saez (2000), é, portanto, nos pesos marginais sociais (tipo da função de bem-estar social a ser maximizada), nas elasticidades comportamentais e na distribuição empírica da renda como proxy da distribuição de habilidades na população, conceitos e parâmetros chaves para os trabalhos aplicados relativos ao tema da tributação ótima da renda. Ademais, devemos examinar o papel crítico que a forma da distribuição empírica da renda assume no estabelecimento das alíquotas tributárias ótimas, como sugere Saez (2000), tendo em vista a nossa persistente, porém injusta, desigualdade na distribuição de renda, e avaliar a necessidade de ajustar o atual regime de alíquotas e faixas de incidência. Destarte, o objetivo do trabalho é descrever os modelos - clássico (Mirrlees) e de Saez para rendimento mais elevados - que explicam a tributação ótima da renda, utilizando calibragens9 numéricas para o caso brasileiro no exercício de 2000, para mostrar que há respostas para o questionamento de qual seria a alíquota ótima nas faixas de renda mais elevadas. Para tanto, organizamos o trabalho em três capítulos. No primeiro capítulo, apresentamos, de início, uma revisão da literatura sobre a tributação ótima da renda, e, em seguida, derivamos o modelo clássico elaborado por Mirrlees (1971), mediante o emprego da análise matemática. No segundo capítulo, desenvolvemos o modelo de Saez (2000), o qual utiliza as elasticidades e a distribuição empírica de rendimentos para derivar a tributação 9 Definimos calibragem como um procedimento de simulação numérica empregada como alternativa a análise econométrica tradicional, no qual a teoria econômica apresenta um papel mais proeminente do que o usual, ofertando ingredientes para um modelo de equilíbrio geral desenhado para responder uma pergunta econômica específica. Esse modelo é então “calibrado” por meio do uso de valores de parâmetros iguais a valores médios conhecidos ou que não mudaram muito ao longo do tempo ou a estimativas empíricas de trabalhos microeconômicos. 8 ótima da renda. Com efeito, derivamos o modelo de Saez sob o prisma especial da tributação linear da renda aplicada aos rendimentos mais elevados: alíquota assintótica ótima, incluindo seus resultados empíricos. O terceiro capítulo apresenta a aplicação do modelo Saez para o caso brasileiro, mostrando os resultados de calibragens numéricas simples para a alíquota assintótica ótima do IRPF sobre grandes fortunas no ano de 2000. Essas simulações tentam responder diretamente se as alíquotas máximas de 25% e 27,5%, utilizadas nos últimos sete anos, incluindo 2004, são efetivamente ótimas. Finalmente, na última parte deste trabalho, são feitas algumas observações sobre as calibragens realizadas e sobre os modelos empregados, à guisa de conclusão. 9 2. Modelo Clássico de Tributação Ótima da Renda 2.1 Introdução Todo tributo no mundo real, com exceção dos chamados lump-sum, distorce o comportamento das pessoas. Não obstante, a sociedade, representada pelo Governo, precisa coletar receitas para atender os seus diversos objetivos sociais. Tendo em vista que o tributo dá origem a reduções na eficiência econômica, o tema das distorções introduzidas (e corrigidas) pela tributação está no centro da análise das finanças públicas. As ineficiências produzidas são conhecidas como perdas de peso morto (deadweight losses) ou gravame excessivo oriundo da tributação, pois implicam custos adicionais para os contribuintes e para a sociedade quando se arrecadam receitas mediante o emprego de tributos que distorcem as decisões econômicas. Os impostos invariavelmente geram perdas de bem-estar porque as obrigações tributárias são funções do comportamento individual das pessoas. Os tributos chamados de lump-sum são eficientes, porém de limitada aplicabilidade, pois eles não variam com os indicadores de capacidade de pagamento, tais como renda e consumo que são funções das decisões dos agentes econômicos. Por conseguinte, a heterogeneidade dos consumidores e a impossibilidade de se observar completamente as diferenças individuais justificam a adoção de um desenho tributário sujeito às restrições usuais impostas pelo conjunto de instrumentos tributários (Auerbach e Hines, 2001). Estabelecer um sistema tributário ótimo, portanto, significa manter as distorções tributárias num patamar mínimo, submetido a restrições originárias da necessidade de elevar e/ou manter a receita e de garantir uma carga tributária equânime. 10 Em resumo, a literatura da tributação ótima identifica sistemas tributários que minimizem a carga excessiva da tributação, sujeita a várias restrições relacionadas aos instrumentos tributários, às informações disponíveis aos governos e a diferentes hipóteses sobre a heterogeneidade da população e ao funcionamento dos mercados privados (Auerbach e Hines, 2001). Nesse sentido, o presente capítulo pretende mostrar, em seguida, um histórico da literatura sobre a tributação ótima da renda e desenvolver o modelo clássico sob o prisma analítico. 2.2 Revisão da Literatura O desenho acerca de tributações ótimas, historicamente, se concentra em três vertentes principais. A primeira, iniciada pelo trabalho seminal de Ramsey (1927) e seqüenciado de forma notável por Diamond e Mirrlees (1971), dedica-se ao desenho ótimo das tributações sobre bens e serviços. A segunda, tendo como representante inicial Pigou (1947) e outros, analisa o emprego de tributos para responder dois tipos de falhas de mercado: financiamento de bens públicos não provisionados pelo setor privado e correção de externalidades associadas a mercados privados incompletos. Por último, e que nos interessa mais de perto, as contribuições, iniciadas por Mirrlees (1971), que considera o caso mais geral da tributação ótima não linear sobre a renda, enfatizando o papel de tais tributos no tratamento de questões distributivas. A discussão da tributação ótima da renda tornou-se concreta a partir do trabalho seminal de Mirrlees (1971), o qual estabeleceu os pilares fundamentais para o estudo desse tema. Com efeito, esse modelo pioneiro assumia as seguintes hipóteses simplificadoras: (i) inexistência de problemas relativos a intertemporalidade; (ii) ignorância de diferenças oriundas do tamanho e composição da família, de gostos e 11 nas transferências voluntárias; (iii) os indivíduos determinam a quantidade e o tipo de trabalho que fornecem otimizando uma função utilidade, ou seja, pela racionalidade, supondo que o bem-estar é uma função dos níveis individuais de utilidade e que a quantidade de trabalho ofertada pode variar entre limites consideráveis sem afetar o preço pago por isso; (iv) não existe a possibilidade de migração para fugir do desenho tributário ótimo; (v) o governo possui informação perfeita sobre os agentes econômicos, inexistindo incertezas sobre as rendas percebidas pelos indivíduos; (vi) são feitas algumas simplificações com intuito de se facilitar as operações matemáticas, por exemplo: existência de um tipo único de trabalho, presença de somente um bem representativo do consumo e estabelecimento de que o bem estar seja expresso pela soma das utilidades individuais, quando a função utilidade individual, a mesma para toda a população, é cuidadosamente escolhida; e (vii) os custos de administração do desenho tributário ótimo são desprezíveis. Segundo Heady (2000), as duas hipóteses nucleares deste modelo clássico seriam: (1) o único desincentivo produzido pela tributação é o número de horas ofertado por cada trabalhadora; e (2) as diferenças nos salários de diferentes trabalhadoras são originárias pelas diferenças em suas produtividades fixas (habilidades). Por oportuno, cabe ressaltar que a tributação ótima da renda, em especial o modelo clássico de Mirrlees, tem tido um efeito profundo e duradouro no campo teórico e prático da economia aplicada. De fato, esse tema deixou cinco contribuições significativas: (a) integração da eqüidade e eficiência, a partir do uso de uma função de bem estar social cardinal; b) formulação do problema da tributação ótima dentro de um escopo de equilíbrio geral à lá Arrow-Debreu; (c) promoveu o primeiro tratamento sobre assimetria de informação, estimulando, assim, as aplicações da economia da informação; (d) proporciona uma visão mais 12 racional e rica do papel do governo numa economia de mercado; e (e) oferece fundamentos rigorosos para a teoria do second best (Arnott, 1994). Com base nesse modelo, Mirrlees (1971) e Atkinson (1973) realizaram simulações numéricas em relação à tributação não linear da renda, enquanto Stern (1976) estabeleceu simulações no caso linear, todos eles chegando a conclusões sobre os níveis de alíquotas ótimas e sobre a forma do desenho tributário. Com efeito, as principais conclusões das simulações numéricas de Mirrlees (1971) podem ser resumidas da seguinte maneira: (i) o desenho tributário ótimo é aproximadamente linear; (ii) as alíquotas marginais ótimas são relativamente baixas; e (iii) o desenho tributário ótimo, surpreendentemente, não é progressivo em toda a sua extensão, quando avaliado da perspectiva de alíquotas marginais crescentes. Por outro lado, Atkinson (1973) notou que as alíquotas marginais ótimas não são tão reduzidas como relatado por Mirrlees (1971) e que o desenho tributário está longe de ser linear nas faixas de renda que cobrem a maior parte da população, quando se usa uma função utilidade do tipo Rawlsiana (max-min) ao invés de se usar objetivos meramente utilitaristas. Cabe ressaltar que tanto Atkinson como Mirrlees usaram em seus cálculos uma função utilidade do tipo log-linear, o que implica a adoção de uma elasticidade de substituição unitária entre o consumo e o lazer. Nas investigações de Stern (1976), ele adota uma elasticidade de substituição, ε, igual a 0,5, em face de estudos empíricos anteriormente elaborados, 13 correspondente a parte backward bending 10 da curva de oferta de trabalho em que a elasticidade da oferta do trabalho é negativa. Esse procedimento faz com que ele encontre novos resultados que demonstram que as alíquotas tributários ótimas num modelo linear sejam consideravelmente mais elevadas daquelas encontradas por Mirrlees, mesmo empregando objetivos igualitários moderados. Por sua vez, Tuomala (1990) investiga as modificações nas conclusões de Mirrlees (1971) e Atkinson (1973) quando se utiliza uma função utilidade com ε = 0,5, considerando-o o parâmetro apropriado, nos cálculos numéricos. Neste caso, as alíquotas marginais não são tão reduzidas e a forma do desenho tributário ótimo é substancialmente não linear para a maioria da população, não sendo inclusive necessário se adotar objetivos igualitários do tipo Rawlsiano para se obter resultados dessa natureza. Portanto, dada uma estimativa razoável (empírica) da elasticidade de substituição entre consumo e lazer e objetivos sociais utilitaristas, pode-se afirmar que as alíquotas marginais sejam elevadas nas faixas de renda menores e médias e que o desenho tributário siga um comportamento de não linearidade. De outra sorte, Tuomala (1990) demonstra que é realmente muito local a conclusão de que a alíquota tributária ótima sobre as rendas mais levadas deva ser igual a zero. Na verdade, Diamond (1998) nos diz que assumindo que exista um 10 A curva de oferta de trabalho é positivamente inclinada para quantidades de horas trabalhadas relativamente pequenas e negativamente inclinada para quantidades elevadas de horas de trabalho. Em outras palavras, os trabalhadores ofertam quantidades maiores de trabalho (horas trabalhadas) em resposta a salários mais elevados, quando seu nível de remuneração não é elevado. Entretanto, quando os salários alcançam faixas elevadas, aumentos adicionais na remuneração induzem os trabalhadores a reduzirem o número de horas trabalhadas. A curva de oferta, portanto, volta sobre si mesma. A razão para a inclinação negativa, no segmento em que ela pende para trás (backward bending), deriva da existência do trade-off entre trabalho e lazer. Os trabalhadores decidem gastar parte de seu salário mais elevado comprando mais lazer e, logo, trabalhando menos. O resultado disso é que salários mais elevados decrescem a quantidade de trabalho ofertada. 14 máximo finito para a distribuição das habilidades, a alíquota marginal deveria ser zero no nível de renda em que a habilidade fosse máxima, conforme demonstrado por Sadka (1976) e Seade (1977). O argumento para esse fato é quase intuitivo. Caso a hipótese de Tuomala (1990) não fosse verdadeira, então, segundo Diamond (1998), estendendo a função tributária para as rendas mais elevadas com alíquota tributária zero iria nos levar a que os detentores de maiores rendas trabalhassem mais, aumentando o bem estar social sem perder qualquer receita tributária. Além disso, essa condição não necessariamente nos conduz a qualquer informação acerca de alíquotas ótimas sobre uma região significativa de faixas elevadas de renda, pois as alíquotas ótimas somente se aproximam de zero em regiões muito perto do topo da distribuição de habilidades. Nesse contexto, é bom lembrar a firmação de Tuomala (1990): “Nessa questão nos alcançamos uma conclusão muito definitiva: esse resultado é realmente muito local”. Por outro lado, Saez (2000) nos recorda que Mirrlees não derivou este resultado intuitivo porque ele considerava a distribuição de habilidade não limitada. A fim de investigar se o modelo de Mirrlees (1971) - em que apenas as condições de primeira ordem são levadas em consideração - é suficiente para garantir a implementação do sistema tributário dele decorrente, Udo Ebert (1991) estuda as condições de segunda ordem do modelo. Com efeito, ele afirma que mesmo Mirrlees (1976), ao estudar o problema acima mencionado, chega à conclusão de que um sistema tributário não-linear é passível de implementação se e somente se: a) as condições de primeira ordem são satisfeitas; e b) a renda bruta ótima resultante é uma função não decrescente da habilidade. Essa segunda condição garante que os indivíduos mais hábeis também recebam as maiores 15 rendas. Na verdade, segundo Udo (1991), Mirrlees aparentemente assume a condição b acima como sendo satisfeita automaticamente. Diante disso, Udo (1991) propõe que se leve formalmente em consideração as condições de segunda ordem no modelo de Mirrleees para que efetivamente se possa garantir a implementação do sistema tributário derivado desse modelo. Destarte, Udo (1991) apresenta três novas propriedades para o modelo clássico de Mirrlees sobre a tributação ótima não linear da renda, além das cinco existentes, ao se levar em conta as condições de segunda ordem do modelo. O quadro 1 a seguir mostra as propriedades do modelo clássico. Diamond (1998) afirma novamente que foram feitos esforços consideráveis para gerar simulações numéricas no modelo clássico, tendo sido iniciados pelas experiências de Mirrlees (1971). Ele ressalta que nessas simulações, Mirrlees assume uma função utilidade u = log(c) + log(1-l), em que c é o consumo e l a oferta de trabalho (em termos percentuais), uma função de bem-estar social G(u) = - e-bu/b (b>0) e uma distribuição log-normal de habilidades. Além disso, Diamond (1998) assevera que outras experiências de simulações numéricas se seguem (Atkinson, Stern e Tuomala): sempre indicando uma trajetória próxima da linearidade e decrescente ao longo da distribuição de renda para os desenhos tributários, cujos resultados mais analíticos estão apresentados no quadro 1. Quadro 1 - Propriedades do Modelo Clássico Propriedade Descrição Autor 16 1 A alíquota marginal é não negativa Mirrlees (1971) 2 A alíquota marginal é menor do que 100% Mirrlees (1971) 3 A alíquota marginal do indivíduo mais hábil é zero Seade (1977) 4 Se não ocorrer bunching11 no nível mais baixo da renda, a alíquota marginal do indivíduo menos hábil é zero Seade (1977) 5 Para cada nível de renda z compreendido entre os extremos da distribuição de habilidades, a alíquota marginal é estritamente positiva Seade (1982) 6 Se o fenômeno de bunching ocorrer no nível mais baixo da distribuição de renda, a alíquota marginal é estritamente positiva no final do intervalo de bunching Udo (1991) 7 Se a utilidade marginal do trabalho for zero toda vez que o indivíduo não esteja trabalhando [u(c,0) = 0 " c > 0] e se o menor nível da renda for também zero [z(nMIN) = 0], então não poderá existir bunching a esse nível menor de renda Udo (1991) 8 Não existe a possibilidade de bunching no nível superior da renda Udo (1991) Fonte: Udo Ebert, A reexamination of the optimal nonlinear income tax, Journal of Public Economics 49 (1992), p. 58-60. Porém, Diamond (1998) também chama a atenção para o caso de outras simulações numéricas, em particular a de Kanbur e Tuomala (1994), as quais apontam para um comportamento do desenho tributário ótimo diferente dos anteriores, incluindo um comportamento padrão marcadamente de formato U invertido. O estudo de Kanbur e Tuomala (1994) investiga o fato de que na maioria dos países as alíquotas tributárias marginais crescem com a renda, enquanto a literatura sobre os resultados numéricas da tributação ótima da renda sugere que o 11 Segundo Lollivier (1983), o caso em que a condição de primeira ordem do problema da tributação não linear da renda de per se provavelmente não conduz a uma solução ótima, em razão da 17 desenho ótimo deveria ser ligeiramente decrescente. Na verdade, esses autores realizam simulações numéricas em que empregam uma distribuição de habilidades w (taxa salarial) log-normal com desvio padrão σ igual a 0,7 e 1, diferentemente do estudo clássico de Mirrlees que utiliza um valor igual a 0,39. De fato, os novos valores de σ são compatíveis com Índices de Gini acima de 0,37, ou seja, consistentes para países com desigualdades acentuadas na distribuição de renda, como o Brasil. Em resumo, os autores chegam à conclusão de que o desenho das alíquotas tributárias ótimas é muito sensível à desigualdade de renda, ou seja, quanto maior a desigualdade na renda mais progressiva deve ser o desenho tributário, compatibilizando, assim, a literatura econômica com a realidade dos desenhos tributários existentes na maioria dos países. Por sua vez, Diamond (1998) deixa cristalino que as simulações numéricas são sensíveis simultaneamente aos fatores relacionados à função utilidade adotada e à família de distribuição de habilidades assumida, abrindo, assim, as portas para a possibilidade de diferentes conclusões sobre o desenho tributário ótimo. Logo, conclui que é de extrema importância o formato de distribuição das habilidades para a tributação ótima não linear da renda. Por último e mais estimulante, Diamond (1998) examina as condições para que as alíquotas tributárias marginais ótimas sejam crescentes para níveis de renda elevadas e declinantes num intervalo que contenha a habilidade modal, utilizando o modelo clássico de Mirrlees com preferências quase lineares. Com efeito, Diamond (1998) ao analisar o caso das alíquotas tributárias assintóticas, de acordo com a especificação acima, mostra que pode existir o caso de alíquotas marginais elevadas quando: (i) a função utilidade é quase linear, ou seja, ela é linear no consumo [u(c,l) = c + v(1-l)]; (ii) existência de impossibilidade, em certos casos, de perfeita discriminação entre os agentes através do desenho 18 valores plausíveis empíricos para a elasticidade da oferta de trabalho; e (iii) uma distribuição paretiana de habilidades acima da habilidade modal. Por fim, ele enfatiza, mais uma vez, a importância do formato da distribuição de habilidades para as alíquotas tributárias ótimas. Por outro lado, Dahan e Strawczynski (2000) mostram que os efeitos renda desempenham um papel importante na determinação do desenho ótimo da tributação da renda. Em primeiro lugar, eles demonstram que o resultado de alíquotas marginais crescentes sobre a renda, apresentado por Diamond (1998), é dependente da linearidade assumida para o consumo, na função utilidade adotada. Modificando-se essa hipótese e adotando-se uma função não linear logarítmica, que admite a presença de efeitos renda, o resultado será o declínio das alíquotas marginais em níveis mais elevados de renda, como nas simulações feitas pelos os autores. Segundo, eles mostram que a forma do consumo também exerce um papel crítico no modelo clássico de Mirrlees (1971). O desenho tributário da renda é crescente ao invés de decrescente nas faixas elevadas de renda, quando se usa uma forma linear de consumo na função utilidades empregada, ou seja, ausência de efeitos renda. O quadro a seguir resume os resultados encontrados por esses autores. Ao mesmo tempo, Saez (2000) nos lembra que Mirrlees apresentou conjecturas precisas sobre alíquotas ótimas assintóticas, no caso de funções de utilidades separáveis no consumo e no trabalho. Porém, essas ficaram esquecidas por muito tempo, em virtude de dois motivos básicos: a) as conjecturas dependiam da distribuição de habilidades não observáveis e de propriedades da função utilidade que não possuem significados intuitivos óbvios; e b) o resultado de que a alíquota tributário, descreve o fenômeno de bunching. 19 marginal ótima fosse igual a zero para as rendas mais elevadas foi considerado como definitivo por muito tempo, pois a distribuição das habilidades empíricas era considerada limitada. Entretanto, Saez (2000) argumenta que de fato as distribuições ilimitadas são mais interessantes do que as limitadas para a condução de estudos relativos ao problema da alíquota ótima para rendas elevadas. Além disso, ele procura examinar com profundidade e pionerismo o relacionamento entre as regras de tributação ótima da renda e o conceito de elasticidade, de extrema importância para os estudos microeconômicos, permitindo, assim, estabelecer uma ponte entre os trabalhos aplicados e a literatura teórica. Quadro 2 - Importância do Efeito Renda para o desenho tributário ótimo nas faixas de rendimentos elevados Autor Forma do Forma do trabalho (y) na consumo (c) na função função utilidade utilidade Distribuição das habilidades (w) Desenho tributário ótimo nas faixas elevadas de renda Mirrlees (1971) Logarítmica Logarítmica Lognormal Regressivo Diamond (1998) Logarítmica Linear Pareto Progressivo Dahan e Strawczynski (2000) Logarítmica Logarítmica Pareto Regressivo Dahan e Strawczynski (2000) Logarítmica Linear Lognormal Progressivo Fonte: Momi Dahan e Michel Strawczynski. Optimal Income Taxation: Na Example with a U-Shaped Pattern of Optimal Marginal Taz Rates: Coment, The American Economic Review, vol.90, no.3 (2000), p. 685 20 Assim, pela primeira vez, com Saez (2000), existe a nítida preocupação de se utilizar nas simulações numéricas um enfoque mais positivo do que a do modelo clássico - em sua essência mais normativo -, a partir da utilização de distribuições de habilidades, tendo a distribuição empírica da renda como proxy, e das estimativas para as elasticidades, obtidas nos estudos disponíveis. Em sintonia, Roberts (2000) alega que, no modelo clássico, o maior problema enfrentado pela análise da tributação ótima da renda, em particular quando o desenho tributário é não linear, é o conjunto de fórmulas usada para caracterizar o desenho ótimo, pois este é definido em termos de complexas funções, cuja interpretação econômica direta é limitada (Atkison e Stiglitz 1979). Tais expressões não possuem a clareza nem a simplicidade que têm as elasticidades da oferta que aparecem no conjunto de fórmulas da tributação linear. Por essa razão, esse autor propõe uma abordagem mais transparente do problema da tributação não linear, cujas expressõs tenham a clareza e o significado econômico encontrados nas regras de tributação linear. Para tal, ele elabora uma análise compreensível de perturbações no desenho tributário que, quando desdobrado por uma expansão de Taylor, é capaz de produzir um formulário apropriado para a tributação ótima da renda. Além disso, Roberts (2000) afirma que o trabalho desenvolvido por Saez (2000) também utiliza a idéia de perturbação para derivar desenhos tributários não lineares sobre a renda. Acrescenta, ainda, que Saez reconhece que não é preciso restringir o modelo a distribuições na população baseadas em parâmetros não observáveis, tais como habilidades, como no modelo clássico. Na verdade, Saez 21 deriva formulas tributárias numéricas usando a distribuição empírica da renda, oriunda de dados fornecidos pelo órgão da receita federal americana (Internal Revenue Service - IRS) e, assim, acaba por oferecer uma melhoria sobre as soluções numéricas anteriores de Mirrlees (1971), Tuomala (1990) e Kanbur e Tuomala (1994). 2.3 Modelo Clássico sobre Tributação Ótima da Renda de Mirrlees (1971): Uma Visão Geral O modelo de Mirrlees (1971) foi elaborado no sentido de tentar responder a seguinte questão (Homburg, 2001) : De que forma o desenho tributário sobre a renda deve ser construído para se levar em conta o trade-off entre eqüidade e eficiência? Nesse sentido, Mirrlees constitui o modelo padrão para analisar a tributação ótima da renda que leva em conta alguns aspectos essenciais desse tema, em especial a escolha entre trabalho e lazer e as habilidades (capacidades) diferentes dos trabalhadores. De acordo com Myles (1995), o mérito da economia de Mirrlees, na qual seu modelo esta inserido, decorre da maneira em que captura as mais importantes características do problema do desenho tributário ótimo. Com efeito, essas características são as seguintes: (i) existência de desigualdade na distribuição de renda para que seja introduzida a motivação da eqüidade na tributação; (ii) os agentes diferem entre si apenas em relação à renda que percebem, cuja distribuição é endógena ao modelo, e a tributação da renda precisa afetar a oferta de trabalho para que as decisões dos agentes tenham impacto sobre a eficiência; e (iii) a economia precisa ser razoavelmente flexível para que nenhuma restrição a priori possa ser imposta sobre o desenho tributário. 22 Para simplificar e focar a análise, assume-se que a economia é competitiva e que os indivíduos na economia diferem entre si apenas pelo grau de habilidade no emprego, que determina seu salário-hora e, portanto, sua renda. O nível de habilidade é uma informação privativa do indivíduo e não é conhecida pelo governo. O único instrumento tributário do estado é o tributo sobre a renda, utilizado em virtude de duas razões: a) a utilização da tributação lump-sum é inexeqüível; b) assume-se que não é possível ao estado observar separadamente o número de horas trabalhadas e a renda por hora. Portanto, dado que somente a renda total é observável, logo ela tem que servir de base para o sistema tributário. Por outro lado, a função tributária sobre a renda é escolhida para maximizar o bem-estar social, condicionada a alcançar o nível de receitas requerido. A generalidade do modelo clássico, fonte de muitas das dificuldades envolvidas em levá-lo a uma solução, deriva do fato de que nenhuma restrição é estabelecida a priori para as possíveis candidatas a função tributária ótima (Myles, 1995). O modelo tem como objeto central a otimização da função tributária da renda, escolhida de tal sorte que venha a maximizar a o bem-estar social. Com efeito, essa maximização é sujeita a duas restrições. A primeira restrição é decorrente de que a função tributária da renda precisa conduzir a um resultado que satisfaça a exeqüibilidade produtiva ou, equivalentemente, cumpra com a receita governamental requerida. A segunda restrição que precisa ser atendida é de certa forma mais complexa e a maneira com que ela é manuseada é de central importância para a análise. Para ela ser melhor compreendida deve-se utilizar uma interpretação alternativa da otimização. Ao invés de enxergar o problema da otimização como sendo a escolha do governo de uma função tributária da renda, ele pode ser encarado como uma dotação para cada indivíduo de um par de bens - renda bruta e consumo. Dessa 23 forma, a restrição adicional seria, então, que cada família deveria encontrar o melhor par (renda bruta e consumo), visando a atender o seu próprio interesse, dentre aqueles previstos pelo governo, ao invés de um par designado a outra família. Em outras palavras, o par previsto deve ser aquele que maximiza a utilidade da família, escolhido no conjunto de pares disponíveis. Dado a esta sua natureza, a restrição é alcunhada de auto-seleção (Myles, 1995). 2.3.1 Uma Análise Matemática Os agentes possuem habilidades específicas, sendo que essas são mensuradas através da produtividade marginal daqueles, ou seja, pelo escalar w (salário-hora). Essa habilidade é distribuída na população com função densidade f(w), assumindo-se f(w) > 0 para w < w < w^, em que w > 0 e w^ ≤ ∞. Ademais, lembremos que, ao trabalhar y unidades de tempo, o agente forneçe yw unidades de trabalho e produz yw unidades do bem consumo. Como o consumo, c, é o numerário, w representa a taxa salarial e z = yw é a renda bruta antes da tributação. Portanto, um indivíduo com habilidade w maximiza sua função utilidade u(c,y) = u(c,z,w) = u(c,z/w) sujeita a restrição orçamentária c=z-τ(z), ou seja, a renda individual líquida. Esse problema é descrito pela expressão (1). max u(c,y) sujeito à c=z-τ(z), z=wy (1) A solução do problema é dada por12 : cz = − 12 uy ucw ⇒ cz = − uz uc (2) Ver no item 1 do Apêndice a solução passo a passo. 24 Definindo Φ = -uy/ucw = -uz/uc (3) como a taxa marginal de substituição entre o consumo c e a renda antes da tributação (renda bruta z), é requerido que Φw = ∂Φ/∂w < 0, ou seja, que os agentes econômicos respeitem a condição de monoticidade [Seade(1982)], pois, segundo Mirrlees (1971:181 e 182), trata-se de uma condição necessária para o estabelecimento da tributação ótima. A monotonicidade do agente é equivalente à condição de que o consumo irá aumentar à medida que a taxa de salário se eleva na ausência de tributação. Além disso, a monotonicidade implica que a cada ponto do espaço (c,z) a curva de indiferença da trabalhadora com habilidade w1, passando por esse ponto, é mais inclinada do que a curva de uma trabalhadora com produtividade marginal w2 se w2 > w1, tendo em vista que a taxa marginal de substituição é o gradiende das curvas de indiferença. Dito de outra forma, a condição impõe que a curva de indiferença de uma trabalhadora com habilidade w que passa num ponto do espaço (c,z) gira estritamento no sentido do relógio a medida que cresce w. Portanto, a condição suficiente para existência da condição de monotonicidade do agente é que o consumo não seja um bem inferior (Myles, 1995). Note-se que a condição de primeira ordem para a maximização da utilidade, expressa pela equação (2), nos indica o trade-off entre o consumo e o trabalho, com o qual se defronta a trabalhadora na margem. Nesse contexto, o objetivo do governo é maximizar o bem-estar coletivo, expresso por meio de uma função de bem-estar Bergson-Samuelson W, para um dado nível de arrecadação R=zG, em que zG representa os gastos do governo, então o problema da economia é dado por: max W = ∫ W (u )f (w )dw 25 sujeito à13: R = ∫ τ( z(w ))f (w )dw = ∫ [ z(w ) − c (w )]f (w )dw = 0 (4) Pode-se visualizar a restrição orçamentária acima apresentada - restrição da receita (arrecadação) governamental exigida -, utilizando a demanda e a oferta individual e integrando-as sobre a população inteira. Nesse sentido, é possível definir a oferta efetiva total de trabalho, Z, como ∫ z(w)f(w)dw e a demanda agregada, C, em que C= ∫ c(w)f(w)dw. A restrição orçamentária, então, exige que a alocação escolhida deve ser factível em termos de produção. Essa condição pode ser descrita em termos de quantidade por C ≤ F(Z), em que F corresponde à restrição linear de produção da economia. Esta definição de viabilidade leva em conta a receita governamental requerida (gastos do governo), expressa como a quantidade de trabalho consumida pelo governo (renda bruta consumida pelo governo), zG, já que podemos podemos escrever C ≤ F^(Z-zG) = F(Z). Em adição à restrição relativa aos recursos da economia apresentada acima, existe uma restrição referente à compatibilidade de incentivos, chamada de autoseleção (self-selection). Com efeito, ao escolher o desno tributário ótimo, o governo deve levar em conta o fato de que, para uma dada tributação, cada trabalhadora escolhe uma cesta de bens que é otima para ela. Em outras palavras, a estrutura tributária ótima pressupõe que cada trabalhadora acredite que seja do seu próprio interesse (isto é, maximize sua função de utilidade) escolher o par renda-consumo (z,c) que o governo deseja que elas selecionem como seus. 13 Assumindo que a receita total seja igual a zero (R = 0), significa que o governo procura maximizar uma determinada função de bem-estar social de utilidades individuais, sujeita à restrição de que o consumo c seja equivalente à renda bruta z (antes da tributação). 26 Portanto, as reações individuais das trabalhadoras tem que se levada em conta a priori. Mirrlees (1976) propõe o seguinte método para representar essa restrição. Seja (c(w),z(w)) o plano ótimo para uma trabalhadora com habilidade w, tal como desejado pelo governo. Essa trabalhadora escolhe esse plano se o mesmo for melhor do que todos os outros planos possíveis, ou seja, u(c (w ), z(w )) ≥ u(c (w 0 , z(w 0 ))∀w 0 ∈ [w ,w ^ ] (5) Isto significa que o plano ótimo corresponde àquele que assegura que, para uma trabalhadora com habilidade w, a utilidade é maximizada [equação (1)]. A restrição de compatibilidade de incentivos pode ser definida também da seguinte maneira: uma trabalhadora com habilidade w não almeja os ganhos de outra com um nível de habilidade diferente. Isto significa que alguém, cuja produtividade marginal é w, teria que trabalhar w0/w vezes a mais do que outro com habilidade w0 para auferir os mesmos ganhos. Assim, o requisito de que o plano ótimo seja individualmente racional para uma trabalhadora com habilidade w0 significa que a utilidade u(c(w0),z(w0)) alcance um máximo em w0=w. Com efeito, isso pode ser expresso em termos da condição de primeira ordem, du du = = uw (c (w ), z(w )) dw 0 dw (6) ou ⎛ ∂u ⎞ dc ⎛ ∂u ⎞ dz = 0 ⇒ u c .c ' (w ) + u z , z ' (w ) = 0 +⎜ ⎜ ⎟ ⎟ ⎝ ∂c ⎠ dw 0 ⎝ ∂z ⎠ dw 0 (7) 27 Essa condição indica que a trabalhadora não pode aumentar sua utilidade mediante uma variação local na oferta de trabalho. Portanto, considerando que as preferências são idênticas, a variação na utilidade quando a taxa salarial aumenta é simplesmente a derivada da função utilidade em relação a w, mantendo c e z constantes (fixas): ⎛ z⎞ du ⎜ c , ⎟ ⎝ w ⎠ = ∂u ( c , y ) = ∂u . ∂c + ∂u . ∂y = u .0 + u . − z = − yu y c y dw ∂w ∂c ∂w ∂y ∂w w w2 (8) Além disso, a condição de segunda ordem para a restrição de seleção própria é satisfeita se: ⎛ du d ⎜⎜ ⎝ dw 0 dw 0 ⎞ ⎟⎟ d ⎛⎜ du ⎞⎟ ⎠ = ⎝ dw ⎠ = u (c (w ), z (w )) ww dw (9) ou d [u c .c ' (w ) + u z .z' (w )] ≥ 0 ⇔ u cw .c ' (w ) + u zw .z' (w ) ≥ 0 dw (10) De (10) temos que: c ' (w ) = − u z z ' (w ) uc (11) → (10) : −u cw . (11) ⎡ ⎤ u z .z' (w ) u + u zw .z' (w ) ≥ 0 ⇒ ⎢− u cw z + u zw ⎥.z' (w ) ≥ 0 uc uc ⎣ ⎦ − [Φ w .u c ].z' (w ) ≥ 0 14 (12) (13)14 Φ=-uz/uc ⇒ Φw=(-uzw.uc +uz.ucw ) /u2c ⇒ Φw=1/uc[ucw.(uz/uc)-uzw] ⇒ -Φw.uc=[-ucw.(uz/uc)+uzw] 28 Tendo em vista que Φw < 0 (condição de monotonicidade do agente) e uc > 0, então z’(w) ≥ 0. Portanto, qualquer função tributária que conduza a um resultado que atenda a equação (7) e z’(w) ≥ 0 irá, por consequência, satisfazer a restrição de auto-seleção. Além disso, se z’(w) ≥ 0, uc > 0 e uz < 0, então de (7) temos que c’(w) ≥ 0. Logo, a restrição de compatibilidade de incentivos requer que tanto a renda bruta como o consumo sejam não decrescentes em w, ou seja, trabalhadoras com mais habilidade (w) têm maior renda e possuem consumo mais elevado. Podemos agora descrever o modelo clássico de Mirrlees de maneira precisa. O problema econômico é descrito pela escolha do governo de um desenho tributário da renda que maximize o bem-estar social sujeito à restrição orçamentária, tal como apresentado em (4), sob a condição de seleção própria mostrada em (6) ou (7) e de que as cestas ótimas de bens sejam continuamente diferenciáveis em quase todo o intervalo. Em outras palavras, nesse modelo o ótimo é caracterizado por um par de funções, u(w) e y(w), que maximiza o bem-estar social sujeito à restrição da produção factível dado por (4) e as condições de maximização da utilidade individual apresentadas em (8). A solução deste problema tanto pode ser dada pela escolha de uma cesta ótima (c,z), como também pode ser vista como uma escolha do nível de utilidade U e da oferta de trabalho y (por exemplo, y é igual ao número de horas trabalhadas), sendo que U=u(c,y) e z=yw. Nesse contexto, o problema de otimização enunciado pode ser formulado como um problema de princípio máximo, também conhecido como o princípio máximo de Pontryagin. Na verdade, o problema de princípio máximo se origina do problema do controle, sendo que ele pode ser definido resumidamente, de acordo 29 com Dixit (1990: 145-153)15 e Fuente (2000: 549), da forma que segue, adaptada para o nosso tema. Inicialmente, considere um sistema econômico cuja evolução no tempo ou, como no nosso caso, evolução em relação ao nível da taxa salarial (produtividade marginal) ou habilidade w pode ser controlada, pelo menos parcialmente, pelas ações de um tomador de decisão, no caso o governo. Essa estruturação especial do problema geral de otimização é decorrente da existência de relacionamentos estoque-fluxos entre as variáveis em sucessivos pontos no tempo ou da função densidade de habilidades. De um lado, a cada ponto no tempo ou a cada habilidade w, o estado do sistema pode ser descrito por um vetor peculiar de variáveis reais, x(w) ∈ Rn, o qual chamamos de vetor estado. Este possui dimensões de variáveis do tipo estoque. De outro lado, a cada instante ou a cada w o governo escolhe um vetor de controle ou de variáveis de decisão, u(w) ∈ Rm, que tem dimensões de variáveis do tipo fluxo. Dessa forma, o estado corrente do sistema ou a habilidade específica atual (estoque presente) e as escolhas dos controles (fluxos) conjuntamente determinam o valor do vetor estado para o instante ou habilidade seguinte, de acordo com uma lei de movimento (possivelmente dependente do tempo ou da habilidade) dada por: x (w + ∆w ) = Q( x (w ),u(w )w ) + x (w ) ⇒ dx (w ) = Q( x (w ),u(w ),w dw (14) Portanto, diferentes escolhas de variáveis de controle e do estoque inicial das variáveis de estado irão produzir diferentes trajetórias ou caminhos para o sistema. Essa é, por consequência, a primeira restrição do problema de princípio máximo. Em 15 O modelo que iremos apresentar do princípio máximo é aquele em que o tempo ou a habilidade são considerados como variáveis contínuas. 30 adição à restrição que governa as variações nos estoques - variáveis estado podem existir outras restrições em todas ou algumas variáveis de estado ou de controle, relativas a algum período de tempo ou intervalo de habilidade, tais como: G( x (w ), u(w ),w ) = 0 (15) Assumimos que o tomador de decisão tem preferências definidas sobre as diversas trajetórias que podem ser representadas por uma função objetivo ou de retorno esperado, aditiva no tempo ou em relação à habilidade w, descrita por: W = ∫ F ( x (w ), u(w ),w )dw (16) Logo, o problema do princípio máximo é : max W = ∫ F ( x (w ), u(w ),w )dw sujeito à: dx (w ) = Q( x(w ), u(w ), w );G( x(w ), u(w ), w ) = 0 dw x (w ) = x 0 ; x (w ^ ) = x 1 A solução do problema do Princípio Máximo é dado por16: dα(w ) = −H x * ( x, α,w ) dw (17) dx (w ) = −H α * = ( x, α,w ) dw (18) 16 Ver a solução no item 2 do Apêndice. 31 Os resultados encontrados podem ser resumidos da seguinte maneira. As condições necessárias de primeira ordem para o problema de princípio máximo são dadas por: para cada w, u maximiza o Hamiltoniano H(x,u,α,w), sujeito à restrição de um único período G(x,u,w) = 0; e as mudanças em x e α ao longo da distribuição de w são comandadas pelas equações diferenciais (17) e (18). O princípio máximo apresenta seu grande mérito conceitual na interpretação econômica da condição de maximização. É cristalino que não deveríamos escolher u(w) para maximizar F(x(w),u(w),w), pois sabemos que a escolha de u(w) afeta x em w+dw, via a expressão (14), e, portanto, afeta os termos da função objetiva em w+dw. Um exemplo concreto deste fenômeno pode ser retirado da interpretação da questão da produção: um boom no consumo hoje iria aumentar a utilidade presente, porém significaria um estoque de capital menor no futuro e, portanto, menos consumo e menos utilidade no futuro. Com efeito, esse fenômeno nos mostra a necessidade de se captar os efeitos futuros ou ao longo da distribuição de habilidades que naturalmente são representados pelo uso do preço sombra sobre o estoque. O efeito de u(w) em x(w+dw) equivale ao impacto sobre Q(x(w),u(w),w) e o resultado da mudança na função objetiva é representado pela multiplicação de Q pelo preço sombra α(w+dw) de x(w+dw). Isso nada mais é do que o segundo termo da definição do hamiltoniano. Destarte, o hamiltoniano nos oferece um modo simples de alterar a função objetiva 32 em determinada habilidade para levar em conta as conseqüências futuras da escolha da variável controle u(w) no espectro de habilidade específico w. A expressão (17), também possui uma interpretação econômica interessante. Uma unidade marginal de x produz um retorno marginal Fx(x(w),u(w),w) λGx(x(w),u(w),w) dentro de um espectro de habilidade w. Isto é, levando-se em conta o custo sombra (shadow cost) da restrição, associado à uma habilidade específica, e o estoque extra Qx(x(w),u(w),w) da habilidade seguinte, valorizada por α(w+dw). Com efeito, isto pode ser pensado como sendo um dividendo. A variação do preço sombra dα(w)/dw é como um ganho de capital, exceto pelo fato de que os preços são representados pelo seus valores presentes. Logo a variação contém um fator de desconto extra que captura a taxa de juros ou o custo de oportunidade de carregar u(w) de um espectro para outro de habilidade. Quando u(w) é otimizada, o retorno marginal total, ou a soma de seus componentes, deve ser zero. Isto é exatamente o que (17) expressa, quando escrita da seguinte forma: H x* ( x, u, α,w ) + dα(w ) = dw [Fx ( x(w ),u(w ),w ) − λGx ( x(w ,u(w ),w )] + α(w )Qx ( x(w ),u(w ),w ) + dα(w ) = 0 dw (19) Em outras palavras, os preços sombras assumem valores, de forma a eliminar os excessos de retorno, por manutenção do estoque, estabelecendo, assim, a condição intertemporal de não arbitragem. Em verdade, os resultados obtidos por meio do princípio de máximo não são simples como os apresentados, pois as integrais não podem ser diferenciadas de uma maneira ordinária com respeito a uma variável em uma determinada habilidade específica ou instante de tempo. Portanto uma teoria de otimização rigorosa no 33 tempo contínuo ou sobre uma distribuição contínua de habilidades, representada pela renda, é muito complicada. Porém, atalhos como os derivados acima conduzem a resultados úteis. Por fim, aplicações práticas do princípio de máximo têm como ponto central a derivação das equações diferenciais (17) e (18) e a soluções das mesmas para as condições apropriadas nos intervalos w=w e w= w^. Recordando o nosso problema original de tributação ótima não linear da renda, porém usando como restrição somente a condição de primeira ordem para a oferta de trabalho, teremos: max W = ∫ W (u )f (w )dw (MBS ) sujeito à : R = ∫ [z(w ) − c (w )]f (w )dw = 0(RO ) yu y zu du =− = − z (MIUouCPO ) dw w w intervalo entre w e w^ as condições de transversalidade α(w) = α(w^) = 0 Neste contexto, a variável estado é dada pela função utilidade u(w) e a variável oferta de trabalho y(w)17 é a variável controle. Por sua vez, adotamos os multiplicadores de Lagranje λ e α(w) como sendo o preço sombra da restrição orçamentária e variável de coestado (preço sombra da Condição de Primeira Ordem -CPO), respectivamente. Para simplificar o problema de otimização do governo, 17 Como y não é verificável, a variável de controle é na verdade z(w), ou seja, a renda antes da tributação. 34 podemos expressar c como uma função de u e z. Esta inversão é possível, pois u(w) é monotonicamente crescente em c(w). Sendo c=h(u,z) e du/dw=g(u,z), então a diferenciação de h e g em relação a z e u produz os seguintes resultados: hz = - uz/uc = Φ, hu = 1/uc, gz = (uwcΦ + uwz) = - ucΦw, gu = uwc/uc (20) Seguindo o princípio de máximo e adotando o hamiltoniano como sendo: H = {W (u ) + λ[ z(w ) − h(u, z )]}f (w ) − α(w )g (u, z ) Então, encontramos as seguintes expressões para para a solução do problema da tributação ótima18: dα(w ) dα(w ) = 0 ⇔ Wu f (w ) − α(w )g u − λhu f (w ) − =0⇔ dw dw dα(w ) Wu f (w ) − λhu f (w ) − − α(w )g u = 0 dw Hu − (21) (20) → (21): − dα(w ) α(w )uwc ⎡ λ⎤ − + ⎢Wu − ⎥f (w ) = 0 dw uc uc ⎦ ⎣ H z = −α(w )g z + λ(1 − h z )f (w ) = 0 (22) (23) (20) → (23): α(w )u c Φ w + λ[1 − Φ ]f (w ) = 0 (24) Podemos reescrever a condição principal de otimização da tributação não linear da renda (36), como: 18 A solução é apresentada no item 3 do Apêndice. 35 [1 − Φ ] = −α(w ) u c Φ w λf (w ) (25) Lembrando que Φ = cz = 1 - τ’(z), a expressão (25) torna-se, então: τ' ( z ) = −α(w ). uc Φ w λf (w ) (26) A expressão acima informa que a alíquota marginal tributária ótima sobre a renda é crescente em α(w)ucΦw e decrescente em λf(w). Além disso, a renda z é uma função estritamente crescente da habilidade w, quando a condição de segunda ordem não está ativa. Em outras palavras, podemos afirmar que essa alíquota é a distorção no preço relativo da renda z que a trabalhadora com habilidade w deveria se defrontar no ponto ótimo. Multiplicando o lado direito da expressão (26) por Φ.w/Φ.w, adotando ψ = - Φw.w/Φ e lembrando que Φ = 1 - τ’(z), temos: τ' ( z ) ⎡ α(w )u c ⎤ ψ =⎢ [1 − τ' (z )] ⎣ λ ⎥⎦ wf (w ) (27) A expressão acima diz que a alíquota marginal tributária ótima é decrescente em wf(w). Na verdade, esse efeito tem um significado muito cristalino: quanto maior for a efetiva oferta de trabalho submetida a alíquota marginal tributária numa dada habilidade w, maior será o excesso de carga associada a essa alíquota tributária. Por outro lado, a alíquota marginal tributária ótima é crescente em relação a α(w)uc/λ] e a ψ. A interpretação desses dois termos e de seus efeitos é facilitada para o caso especial em que a função utilidade é quase linear: u(c,y) = c + ν(1-y), em que ν é uma função estritamente côncava. 36 Neste caso temos que19: ψ= 1 +1 ε (28) em que ε é a elasticidade compensada da oferta de trabalho em w. Portanto, elasticidades da oferta de trabalho mais elevadas geram valores inferiores de ψ que, por sua vez, implicam menores alíquotas marginais. Esse comportamento é esperado dado ao fato de que elasticidades da oferta de trabalho mais elevadas estão também associadas a aumentos mais acentuados de gravame excessivo por unidade de receita gerada. Finalmente, os efeitos do termo α(w)uc/λ, podem ser vistos a partir da seguinte equação, supondo também que a função utilidade seja quase linear20: ∞ ∞ α(w ) ⎡ W (w ) ⎤ ⎡Wu (w ) ⎤ [ ] f ( w ) d ( w ) 1 F ( w ) = ∫ ⎢1 − u = − − ⎥ ⎢ λ ⎥f (w )dw ∫ λ λ ⎦ ⎦ w⎣ w⎣ (29) em que F(.) é afunção acumulada de densidade, tendo como base f(.). A expressão (29) iguala o valor social, ponderado pelo custo marginal dos fundos λ de se elevar uma unidade monetária adicional de receita, a partir do acréscimo da alíquota tributária marginal, num determinado nível de taxa salarial w. O valor social contido na equação (29) possui dois componentes: • primeiro, representado pelo termo [1 - F(w)], é o montante de receita auferida, equivalente aos tributos coletados de todos aqueles que pagam o 19 20 Ver a derivação da expressão de ψ no item 4 do Apêndice. A derivação da equação está no item 4 do Apêndice. 37 tributo adicional - aqueles cujas taxas salariais são no mínimo tão altas como w; e ∞ • segundo, ⎡Wu (w ) ⎤ f (w )dw , corresponde ao valor, novamente em termos λ ⎥⎦ w ∫ ⎢⎣ de unidades de receita, da perda de bem-estar social dos indivíduos que pagam o tributo adicional. Com efeito, cada um dos termos acima apresentados se reduzem com o aumento de w, pois coletamos menos receitas e impomos menor carga tributária ao aumentarmos os tributos em um número menor de pessoas. Note-se, porém, que a diferença entre esses termos é que se torna relevante no problema de tributação ótima. A pergunta básica seria: Qual seria o padrão de comportamento da diferença entre os termos, ao longo da distribuição de w? De fato, a diferença deveria ser positiva se as alíquotas tributárias são positivas e convergeria para zero, quando ∞ w → ∞. Se Wu declina com w, então o segundo termo, ⎡Wu (w ) ⎤ f (w )dw , ou seja, o λ ⎥⎦ w ∫ ⎢⎣ custo social de um aumento na alíquota tributária marginal em w, converge para zero mais rapidamente do que o primeiro termo, 1 - F(w). Portanto, deve existir um intervalo sobre o qual a diferença entre os dois termos aumenta. A intuição seria que alíquotas tributárias marginais elevadas aplicadas em níveis elevados de renda seriam ineficientes porque elas produziriam pouca receita, enquanto que alíquotas tributárias marginais muito elevadas, aplicadas em faixas de renda baixas são iníquas, pois elas impõem um ônus fiscal excessivo sobre aqueles, cuja utilidade marginal social da renda, Wu(w) é elevada. Neste contexto, o melhor compromisso poderia ser aumentar a alíquota tributária marginal sobre os níveis de renda médios. Nesses níveis, as obrigações tributárias não recairiam sobre aqueles para quem a 38 carga tributária elevada gera um custo social elevado, porém é onde as alíquotas tributárias elevadas permitem ainda incrementar consideravelmente as receitas. Destarte, o padrão exato que o termo a esquerda da expressão (29) irá seguir à medida que aumentarmos w depende da função de bem-estar social e do formato da distribuição de salário na economia. Mesmo que esse termo realmente indique que as alíquotas tributárias marginais deveriam recair sobre a média/moda da distribuição de salário, é exatamente neste ponto que o outro termo na expressão (27), wf(w), impõe um efeito maior de redução da alíquota tributária marginal. Portanto, não é possível dizer muito sobre a forma geral da programação ótima da alíquota marginal sobre a renda. De acordo com Tuomala (1990), pode-se dizer que é da natureza básica dos problemas de tributação da renda a necessidade de se requerer resultados quantitativos, pois meros princípios gerais, como vimos, não são de muita valia. Portanto, é importante ter como objetivo encontrar o modo de como conectar medidas empíricas com propostas numéricas específicas dentro de um arcabouço de modelos tributários ótimos sobre a renda. Como afirma Myles (1995), as questões relativas à demonstração formal de que considerações sobre equidade são relevantes para o aumento das alíquotas marginais (progressividade) e a evidenciar que o critério de eficiência, em especial o efeito da tributação sobre a oferta de trabalho, afeta a escolha do desenho tributário são melhores encaminhadas via simulações numéricas, em decorrência da complexidade analítica do modelo não linear de tributação da renda. 39 Nas principais simulações numéricas feitas por Mirrlees (1971), Atkinson (1972), Stern (1976) e Tuomala (1990) foram utilizadas as seguintes hipóeses: (i) a ∞ 1 função de bem-estar social seria dada por W = ∫ e −βu f (w )dw , forma paramétrica β 0 que permite variações sobre o tipo de função de bem-estar social a ser empregada, a partir de mudanças em β (grau de aversão a desigualdade). Valores elevados de β representam grande preocupação com a eqüidade, enquanto que com β=0 ou β=1 representaria o caso utilitarista. Por outro lado, β=∞ corresponderia a função utilidade rawlsiana (max-min) que impõe peso exclusivo nos pobres, ou seja, somente na melhora dos indivíduos de mais baixa renda; (ii) a função utilidade individual assumida é a Cobb-Douglas, u(c,y) = logc+log(1-y) , em que ε=1, e/ou u(c,y) = (-1/c) - (1/1-y), em que ε=0,5; e (iii) a função distribuição de habilidades adotada é a log-normal com desvio padrão igual 0,39. No final do próximo capítulo apresentaremos um quadro comparativo com os principais resultados das simulações numéricas realizadas por esses autores e Saez (2000). 2.3 Conclusão O modelo clássico da tributação ótima da renda, como vimos, capta aspectos importantes do problema tributário e mesmo assim tem, ainda, a vantagem de permanecer ainda tratável. Além disso, graças ao poder analítico do modelo clássico, a tributação ótima pode ser caracterizada, resultados teóricos foram provados e métodos numéricos aplicados. Com efeito, isso não significa que sua caracterização seja fácil; na verdade, ela requer inovações analíticas que se revelaram ser tão ou mais importantes do que ela própria, como os resultados 40 produzidos pelo modelo (Hammond e Myles, 2000). Segundo Hammond e Myles (2000), após trinta anos do surgimento do modelo clássico (1970-2000), nenhum outro modelo melhor de tributação não linear da renda foi proposto. Ao contrário, novos resultados estão ainda sendo descobertos dentro do escopo original e suas especializações, como os trabalhos de Diamond (1998) e Saez (2000). Então podemos nos perguntar: Qual a razão de estudar o modelo de Saez (2000) já que ele é somente uma extensão do trabalho seminal de Mirrlees (1971)?, mais ainda, Quais são as inovações propostas, por que foram necessárias e quais são suas conseqüências? 41 3. O Modelo Clássico Revisitado: Tributação Ótima da Renda Utilizando Elasticidades – Modelo Saez para rendimentos elevados 3.1 Introdução O argumento central para se buscar uma melhoria no modelo clássico sem dúvida foi o de tornar mais transparente e intuitiva sua apresentação. Com efeito, buscou-se uma forma sistemática de derivar resultados de tributação ótima que pudesse ser facilmente utilizada em estudos aplicados, mediante o emprego de elasticidades comportamentais - conceito chave em trabalhos empíricos -, capaz de produzir um conjunto de equações que tivessem a elegância do modelo da tributação linear da renda. Nesse sentido, Saez (2000) estuda o problema da tributação não linear da renda usando a idéia de perturbação no desenho tributário. A principal inovação proposta por Saez é que ele reconhece, pela primeira vez na literatura, que não é necessário ancorar o modelo de distribuição da população em um parâmetro não observável, como a habilidade, tal como no modelo original de Mirrlees. Ao contrário, uma distribuição mais natural, como a da renda, pode ser utilizada. Com efeito, ele emprega distribuições empíricas da renda para realizar simulações numéricas (calibragens), oferecendo uma melhoria significativa sobre as soluções numéricas elaboradas por Mirrlees (1971) e Tuomala (1990). Além disso, o modelo de Saez (2000) amplia o modelo clássico em quatro novas direções: a) uma fórmula simples para a alíquota tributária ótima sobre as rendas mais elevadas é derivada como uma função dos efeitos renda e substituição e da densidade da faixa mais elevada da distribuição da renda; b) a derivação do 42 conjunto de fórmula do modelo clássico em termos das elasticidades proporciona uma compreensão transparente dos efeitos econômicos chaves subjacentes ao formulário; c) introduz a possibilidade de preferências heterogêneas; e d) as soluções numéricas (calibragens) podem ser facilmente implementadas a partir do uso de distribuições empíricas da renda e de hipóteses realistas sobre parâmetros de elasticidades, dado que as expressões derivadas são relacionadas bem de perto com magnitudes empíricas. Por fim, o modelo de Saez mostra que a forma da distribuição da renda exerce um papel crítico no comportamento das alíquotas tributárias ótimas. 3.2 O Modelo Saez para Rendimentos Elevados Como vimos na apresentação do modelo clássico de Mirrlees, a condição geral de primeira ordem dependem de forma complexa das derivadas da função utilidade u(c,y), que não são relacionadas de uma maneira direta a magnitudes empíricas. Além disso, o modelo, de acordo com Saez (2000), é derivado mediante o uso de instrumento poderoso, porém cego, do princípio máximo de Pontryagin, ou seja, ele não permite elucidar os efeitos econômicos chaves que conduzem ao formulário básico da tributação ótima da renda. 3.2.1 Derivação do Modelo Saez (2000) emprega o método clássico da tributação linear ótima da renda para derivar uma fórmula simples para estabelecer a alíquota tributária ótima sobre os rendimentos mais elevados percebidos pelas trabalhadoras. Com efeito, o modelo considera que o governo fixa uma alíquota única, τ, acima de um determinado valor elevado de rendimento tributável, z*, e então calcula os efeitos no bem-estar social e 43 na receita tributária, usando elasticidades, de um pequeno incremento (perturbação), dτ, em τ. Utilizando o modelo padrão de dois bens, c e z, da teoria do consumidor, cada contribuinte maximiza sua função utilidade individual bem comportada21, u=u(c,z), que depende positivamente do consumo c (estritamente crescente em c) e negativamente do rendimento z (estritamente decrescente em z). Além disso, a habilidade ou o conhecimento profissional individual da trabalhadora, representada pelo salário-hora w, está incorporado à função de utilidade u, em particular no parâmetro z22. Por fim, supõe-se que o contribuinte deve respeitar uma restrição orçamentária linear. Logo, o problema individual do contribuinte é dado por: max u(c,z) sujeito à c=z(1-τ) + R, onde τ é alíquota tributária marginal e R indica o rendimento virtual não oriundo do trabalho23. A solução desse problema é dada por24: u z + (1 − τ)u c = 0 (30) A condição de primeira ordem expressa em (30) implicitamente define as funções de demanda Marshalianas, não compensadas25, de rendimento z=z(1-τ,R) função oferta salarial - e de consumo c=c(1-τ,R) do contribuinte. Por outro lado, se formularmos o problema dual, encontraremos a seguinte solução26: 21 Uma função utilidade u(x,y) é dita bem comportada, neste caso, se ela é contínua, diferenciável e estritamente côncava (no caso rawlsiana é suficiente assumir estrita quase-concavidade) 22 z=ny=wy 23 O rendimento virtual R é o rendimento pós-tributação que a contribuinte obteria se ele declarasse rendimento salarial zero e fosse permitida a ela ficar na mesma faixa de restrição orçamentária dada pela alíquota marginal constante τ. 24 A solução passa a passo é feita no item 5 do Apêndice. 25 Uma função de demanda é hicksiana quando a renda é “compensada” de tal sorte a manter a utilidade constante, admitindo somente efeitos substituição quando os preços variam. Já a demanda marshaliana é não compensada, pois admite efeitos substituição e renda quando os preços variam. 26 Ver item 5 do Apêndice. 44 uZ uC = −(1 − τ ) (31) Da mesma forma, a condição de primeira ordem expressa em (31) define uma função de demanda Hicksiana, compensada, de rendimento zh=zh(1-τ,u*) - função oferta salarial - do contribuinte. A partir de (30) e (31) podemos construir a equação de Slutsky para o caso especial de uma variação do preço tributário 1-τ, também chamada de own-price change, definida por: ∂z[(1 − τ), R ] ∂z h (1 − τ, u *) ⎧ ∂z[(1 − τ), R ] ⎫ + z(1 − τ).⎨ = ⎬ ∂R ∂(1 − τ) ∂(1 − τ) ⎭ ⎩ (32) A equação (32) estabelece a resposta do rendimento tributável z a variação da alíquota tributária marginal τ , composta de um efeito substituição dado pela inclinação da curva de demanda hicksiana e do efeito renda dado pelo parâmetro mais esquerda da expressão em comento. Podemos reescrever na expressão acima da seguinte maneira: ζ NC = ζ C + η ⇒ ζ C = ζ NC − η (33) Na realidade, a expressão (33) é uma forma de reescrever a equação de Slustky em termos de elasticidades, sendo que ζNC nada mais é do que a elasticidade-preço da demanda não compensada da função oferta salarial marshaliana, também chamada de elasticidade-preço do tributo27; η é o parâmetro que captura os efeitos da variação da renda virtual; e, por fim, ζC é a elasticidadepreço da oferta salarial compensada (hicksiana). 27 (1-τ). 45 Supondo-se um incremento dτ na alíquota única, τ, acima de um determinado valor elevado de rendimento tributável, z*, tal perturbação terá dois efeitos sobre a receita tributária (vide Figura 1 a seguir). O primeiro, chamado de efeito mecânico, representa aumento na receita tributária caso não existisse qualquer resposta comportamental. O segundo, chamado efeito comportamento, implica redução na receita tributária, decorrente de ações comportamentais que diminuem os rendimentos. Figura 1 – Perturbação na alíquota tributária sobre rendas elevadas Renda z depois da tributação Antes da reforma Depois da reforma Inclinação 1-τ dR=z*dτ Inclinação 1-τ-dτ z* Renda z antes da tributação Nesse sentido, um indivíduo com rendimento z (acima de z*) irá pagar tributos adicionais no montante de (z-z*)dτ. Α soma total M das receitas adicionais de todo os indivíduos da população com renda acima de z*, cuja média de rendimentos é dada por zm, será igual a: M = z m − z * dτ (34) 46 Por outro lado, a perturbação dτ produz efeitos comportamentais que podem ser decompostos em duas partes: (i) um incremento não compensado na alíquota tributária marginal de dτ em toda população; e (ii) um aumento generalizado no rendimento virtual de dR=z*dτ. A redução total, B28, das receitas tributárias, em razão do efeito comportamental, será a soma dos termos τdz sobre todos os contribuintes com rendimentos superiores que z*, logo: ( ) * NC * * B = − ζ z m − η z τd τ (1 − τ ) (35) Com efeito, ζ*NC é a elasticidade não compensada média ponderada, sendo que a elasticidade ζNC(z) no interior da integral é a elasticidade média dos contribuintes com rendimento z. Por outro lado, η* é o efeito renda médio29. O efeito desta pequena reforma tributária - incremento dτ na alíquota tributária para a parcela da população que percebe rendimentos acima de z* - no bem estar social é dado pelo parâmetro g* que reflete os objetivos redistributivos do governo. Na realidade, o parâmetro g* é definido como sendo a razão entre a utilidade marginal social das contribuintes com rendimento acima de z*, ou seja, as que compõem a faixa de rendimentos mais elevada da população, e o valor marginal dos fundos públicos para o governo. Em outras palavras, g* é definido de tal sorte que o governo é indiferente entre g* reais de gasto social e um real adicional para o consumo das contribuintes 28 Ver dedução no item 6 do Apêndice. Saez (2000) afirma que os pesos estabelecidos para os parâmetros ζNC e η são diferentes, pois ele assume que os contribuintes de mesmo rendimento não precisam ter a mesma elasticidade, o que é relevante nos parâmetros são as elasticidades médias em determinados níveis de rendimento. Além disso, esse mesmo autor assume que o conjunto de contribuintes que porventura passam a contribuir descontinuamente mais, em razão do aumento infinitesimal na alíquota tributária, é desprezível. 29 47 com rendimentos superiores a z*. Neste caso, quanto menor for g*, menor será o peso que o governo dá ao consumo daqueles com rendimentos elevados. Para calcularmos os efeitos no bem estar social, notemos que a função utilidade pode ser descrita com sendo a utilidade individual na escolha ótima da oferta de trabalho para um contribuinte de faixa de rendimento mais elevada, ou seja: u (c, z ) = u [(z(1 − τ, R )(1 − τ ) + R ), z (1 − τ, R )] Utilizando o teorema do envelope, o efeito de uma pequena variação na alíquota tributária na utilidade é du = uc(-zdτ + dR), substituindo dR=z*dτ, logo du = - uc(z - z*)dτ, em que (z - z*)dτ é o aumento nas receitas tributárias devido ao efeito mecânico do incremento infinitesimal na alíquota tributária. Como resultado da definição de g*, cada real adicional arrecadado pelo governo, em virtude da pequena reforma tributária, reduz o bem estar social das contribuintes da faixa mais elevada, em média, de g* . Portanto, a perda total de bem-estar social devida a reforma tributária em apreço será igual a g*M. Logo, o governo estabelece a alíquota tributária τ de tal forma que atenda: (1 − g )M + B = 0 * (36) A expressão acima nos mostra que a alíquota tributária ótima é aquela que equaliza os efeitos sobre a arrecadação, oriundos dos aspectos mecânico e comportamental, ao impacto sobre o bem estar social, em virtude de uma reforma tributária marginal (introdução da perturbação dτ). Nesse sentido, utilizando (34) e (35) em (36), obtemos: (1 − g )(z * m −z * )dτ − (ζ * NC ) z m − η * z * τ dτ =0⇒ 1− τ 48 [( )( ) ] )] 1 − g * z m − z * dτ τd τ = (1 − τ ) ζ *NC z m − η * z * [( (37) Dividindo e multiplicando o lado direito da expressão acima por z*, além de cancelar dτ de ambos os lados da equação, obtemos: ⎡ ⎞⎤ * ⎛ zm ⎢ 1 − g ⎜ * − 1⎟⎥ τ ⎝z ⎠⎦ =⎣ (1 − τ ) ⎡⎛ *NC zm * ⎞⎤ − η ⎟⎥ ⎢⎜ ζ z* ⎠⎦ ⎣⎝ ( ) (38) A expressão (38) nos informa que a alíquota marginal ótima para os contribuintes que percebem rendimentos elevados depende basicamente dos parâmetros comportamentais relevantes: elasticidade e efeitos renda médios dos contribuintes com rendimento acima de z*. Além disso, essa alíquota (τ), como esperado, é uma função decrescente do peso social g* que recai sobre os contribuintes de rendimentos elevados, da elasticidade média ζ*NC e do tamanho absoluto dos efeitos renda η*. De outro lado, porém ainda mais instigante, a alíquota ótima é uma função crescente do parâmetro zm/z*, que está relacionado à forma da distribuição empírica dos rendimentos da população fato este ainda pouco explorado pela literatura tributária. Um resultado interessante da expressão (38) pode ser encontrado quando admitimos que a distribuição de rendimento é limitada. Nesse caso, quando z* se situa bem perto do limite superior, a razão zm/z* tende a um e, portanto, a alíquota marginal é igual a zero, em virtude de que (zm/z* - 1) = 0. Esse resultado corresponde àquele já visto na revisão da literatura, enunciado por Sadka (1976) e Seade (1977): no limite superior da distribuição de rendimentos, a alíquota tributária 49 ótima é igual a zero. A intuição que está por detrás desse resultado clássico é de que o incremento mecânico na receita tributária, M, é desprezível em face da perda de receita B, devida a resposta comportamental, indicando que a alíquota ótima esteja necessariamente perto de zero. 3.2.2 Resultados Empíricos para os EUA Analisando a distribuição de rendimentos da população americana nos anos de 1992 e 1993, Saez (2000) verificou que a razão zm/z* , a partir do rendimento de U$ 150 mil até bem perto do final da distribuição, é razoavelmente constante em torno do valor 2. Ora, distribuições com parâmetro zm/z* constante correspondem às distribuições paretianas. Portanto, as caudas das distribuições empíricas de rendimentos podem ser aproximadas de maneira satisfatória por esse tipo de distribuiçãi, definida como: Prob (rendimento>z) = C/za , com a>1, sendo que a razão zm/z* é constante e igual a a/(a-1). Quanto mais elevado for o parâmetro a, mais curta é a cauda da distribuição de rendimento. Para o caso americano (anos de 1992 e 1993, pelo menos), a razão zm/z* é aproximadamente 2 e, portanto, o parâmetro a, por definição, é também próximo de 2. Admitindo que a elasticidade ζ*NC e os efeitos renda η* convergem a medida que z* aumenta e que a razão zm/z* converge para um limite descrito por a/(a-1), então a alíquota ótima também converge. Utilizando a equação de Slutsky (33), podemos reescrever a expressão (38), em termos dos valores limites das elasticidades e do parâmetro de Pareto a, da seguinte forma30: 30 Ver dedução no item 7 do Apêndice. 50 τ* = (1 − g ) * [ζ * NC ( + ζ C (a − 1) + 1 − g * )] (39) De acordo com Saez (2000), o governo deseja estabelecer aproximadamente uma alíquota linear uniforme, para rendimentos elevados. Portanto, τ* é realmente a alíquota assintótica ótima não linear do problema de Mirrlees. Analisando-se a expressão (39), nota-se que a alíquota τ* depende negativamente da espessura da cauda superior da distribuição, medida pelo parâmetro paretiano a. Trata-se de um resultado intuitivo, pois se a cauda é pouco espessa, então, a arrecadação gerada por aumentos da alíquota superior, que incide sobre contribuintes de alta renda, será pouco significativa. Por outro lado, para uma dada elasticidade compensada, quanto maior for o valor absoluto dos efeitos renda, em relação à elasticidade não compensada, maior será a alíquota tributária assintótica31. Em outras palavras, o mais importante para a tributação ótima é se os contribuintes continuam trabalhando após elevações nas alíquotas tributárias (sem compensação da utilidade). Cabe ressaltar que embora a elasticidade compensada seja crucial para definir o gravame excessivo da tributação, os mesmos valores de ζ C podem conduzir a alíquotas tributárias ótimas bastante díspares. Se g*= 0 implicando, assim, que o governo não valoriza o consumo marginal dos que percebem rendimentos elevados, obtém-se uma alíquota, τ*, que maximiza a arrecadação. Além disso, supondo-se que não existem efeitos renda (ζ C = ζ NC) e fixando a=2 (parâmetro paretiano da distribuição americana), pode-se reescrever a expressão (39) como: 31 Se dividirmos o numerador e o denominador do lado esquerdo da expressão (54) por ζ*C e assumirmos (1-g*)/ζ*C = b, então τ *=b/[b+(ζ*NC/ζ*C)+(a-1)]. Logo quanto menor for (ζ*NC /ζ*C), menor será o denominador e, por conseqüência, maior será τ *. Porém, para que (ζ*NC /ζ*C) seja menor, então (ζ*C /ζ*NC) tem que crescer, logo o valor de 1-η* /ζ*NC tem que aumentar (vide de Slutsky). Isto somente ocorre se o módulo de (-η*), relativamente a ζ*NC, seja maior. 51 τ* = 1 (ζ * ) (40) +1 Saez (2000) denota essa alíquota τ * de alíquota “Laffer”. A expressão acima é uma generalização da conhecida fórmula da alíquota tributária única (flat tax) que maximiza a receita tributária, onde ζ* é a elasticidade média sobre o conjunto dos contribuintes de alta renda. Na literatura empírica sobre o tópico, não existe consenso sobre a magnitude desse tipo de elasticidade. Alguns estudos estimam que essas elasticidades são superiores à unidade enquanto que outros afirmam que esses parâmetros são próximos de zero. Por essa razão, quando do cálculo das alíquotas, ótimas diferentes suposições a respeito da magnitude desse parâmetro serão utilizadas. A Tabela 1 apresenta resultados da simulação numérica realizado por Saez (2000) para alíquotas tributárias ótimas, utilizando a expressão (40) para diversos valores de elasticidades compensadas e não compensadas, parâmetro paretiano a de distribuição dos rendimentos e de utilidade marginal social g*. Tabela 1 - Alíquotas tributárias ótimas para contribuintes com rendimentos elevados g*=0 g*=0,25 ζNC = 0,2; ζC = 0,5; η = - 0,3 ζNC = 0,2; ζC = 0,8; η = - 0,6 ζNC = 0,5; ζC = 0,5; η = 0 ζNC = 0,5; ζC = 0,8; η = - 0,3 A=1,5 69 63 57 53 a=2 59 50 50 43 A=2,5 51 42 44 37 A=1,5 63 56 50 45 a=2 52 43 43 37 a=2,5 44 32 38 31 Fonte: Emmanuel Saez, Using Elasticities to derive Optimal Income Tax Rates, Review of Economic 52 Studies 68 (2001), p. 213. 3.3 Conclusão O Modelo de Saez para a Tributação Ótima da Renda estudado neste capítulo evidencia que a derivação do modelo clássico, utilizando elasticidades, pode proporcionar as seguintes vantagens: a) mostra precisamente como os diferentes efeitos econômicos atuam para a dedução da alíquota tributária ótima e quais são os parâmetros relevantes para o seu cálculo; b) as equações chaves do modelo são expressas em termos de parâmetros observáveis e passíveis de estimação, permitindo que simulações numéricas possam ser realizadas e calibradas, usandose distribuições empíricas de rendimentos; e c) permite um cálculo simples e direto das alíquotas ótimas para rendimentos elevados. Po outro lado, as simulações para o caso norte-americano mostram que a alíquota assintótica ótima para diversos valores dos parâmetros básicos do modelo são sempre superiores a 30%. Com efeito, o cálculo para as alíquotas assintóticas ótimas, relativo aos rendimentos mais elevados, é muito simples e direto, permitindo o uso transparente da distribuição empírica de rendimentos. Neste contexto, o presente trabalho procura aplicar concretamente o Modelo Saez para as faixas de rendimentos mais elevadas, tendo como base a distribuição empírica de rendimentos, relativa ao exercício de 2000, a partir de dados fornecidos pela Secretaria da Receita Federal do Ministério da Fazenda. 53 4. APLICAÇÃO ELEVADOS: DO MODELO CÁLCULO DE SAEZ PARA ALÍQUOTAS RENDIMENTOS MARGINAIS ASSINTÓTICAS PARA O BRASIL NO ANO DE 2000 4.1 Introdução Tendo em vista a complexidade dos modelos de tributação não linear da renda, os elementos chaves que determinam as alíquotas tributárias ótimas, segundo Saez (2001), são as elasticidades, a forma da distribuição de rendimentos e as preferências distributivas do governo, que são melhores examinados por meio de análises numéricas. Como vimos anteriormente, a alíquota marginal assume valores percentuais entre 0 e 100, porém não temos pista alguma sobre o comportamento da alíquota marginal ao longo da distribuição, ou seja, quão longe ou perto ela está desses valores extremos, a não ser exatamente nos pontos extremos da distribuição (a alíquota assume valor zero em ambos casos). De maneira análoga, não conseguimos mostrar formal e categoricamente que, em face de considerações de eqüidade, a alíquota marginal deveria ser crescente nem de que forma é afetada a escolha do desenho tributário quando se examina o critério de eficiência a partir do efeito da tributação na oferta de trabalho. Nesse contexto, torna-se imperativo a simulação numérica (calibragem) para que possamos analisar melhor as questões básicas da tributação ótima da renda. Com efeito, apresentamos na seção seguinte o cálculo da alíquota ótima sobre rendimento elevados, sendo que na primeira subseção descrevemos os dados, depois examinamos a distribuição empírica dos rendimentos tributáveis para o exercício de 2000, em especial o quociente zm/z* e, por fim, calculamos a alíquota 54 tributária assintótica ótima, a qual chamamos de alíquota ótima sobre grandes fortunas, sob diversas condições dependentes dos valores assumidos pelos elementos básicos. 4.2 Alíquota Ótima sobre Rendimentos Elevados 4.2.1 Descrição dos Dados32 Os dados utilizados neste trabalho, constantes do Anexo, foram fornecidos em caráter precário pela Secretaria da Receita Federal. O significado de precário é: a Receita Federal não se responsabiliza pela veracidade das informações e nem por quaisquer resultados obtidos a partir da manipulação dos dados brutos. Os números constantes da tabela do Anexo são relativos às Declarações do Imposto de Renda Pessoa Física 2001 (DIRPF 2001), Ano Base 2000. O número total de declarantes foi de 13.906.145 (treze milhões e novecentos e seis mil e cento e quarenta e cinco) pessoas. Do montante total entregue, 92,06% foi enviado eletronicamente e o tipo de formulário mais utilizado foi o modelo simplificado (62,77%). A Tabela a seguir mostra alguns valores interessantes que retratam de forma sintética a DIRPF 2001. Tabela 2 - Indicadores básicos da DIRPF 2001 Itens Valores em R$ Valores Médios bilhões em R$ Alíquota Efetiva (%) 1. Rendimento Total 403,56 30.407,77 5,36 2. Rendimento Tributável 276,15 21.258,01 7,84 3. Rendimento Tributável Líquido 205,22 16.248,81 10,54 4. Imposto Devido 21,64 4.169,80 - 32 Alguns dos dados foram retirados do seguinte endereço do sitío da Receita Federal na Internet:http://www.receita.fazenda.gov.br/Historico/EstTributarios/ConsolDeclIrpf2001/ConsolidaPF2001.pdf 55 Por sua vez, os dados constantes da tabela a seguir descrevem de forma mais analítica os dados do IRPF 2001, privilegiando a distribuição dos rendimentos por faixa. Cabe ressaltar das informações constantes da tabela 3 que do total de contribuintes no exercício de 2000, aproximadamente 61% ganham até 5 saláriosmínimos por mês (R$ 15 mil por ano), 84% percebem até 10 salários mínimos por mês (R$ 30 mil por ano) e apenas 7,2% recebem mais do que de R$ 4.080,00 por mês (R$ 50.000 por ano). Ademais, verifica-se que uma alíquota sobre grandes fortunas – rendimentos anuais superiores a R$ 1 milhão – abrangeria apenas 1.521 contribuintes, que representa o insignificante percentual de 0,011% do total de contribuintes no exercício de 2000. Tendo em vista o pequeno número de agentes acima dessa faixa renda, a teoria nos diz que os desincentivos (ineficiências) gerados, ao se aplicar uma alíquota mais agresssiva sobre os contribuintes acima dessa faixa de R$ 1 milhão, seriam muitos maiores do que as eventuais receitas adicionais conquistadas. Tabela 3 - Resumo sintético dos dados da DIRPF 2001 Faixa em SM Valor aproximado em R$ mil/ano Total de contribuintes que ganham até a faixa (A) Total de contribuintes que ganham acima da faixa (B) % (A) % (B) Até 1 SM Até 3 SM Até 5 SM Até 9 SM Até 10 SM Até 17 SM Até 26 SM Até 35 SM Até 42 SM Até 87 SM Até 174 SM Até 347 SM Até 1.736 SM Até 3.472 SM 3.000 9.000 15.000 25.000 30.000 50.000 75.000 100.000 120.000 250.000 500.000 1.000.000 5.000.000 10.000.000 1.959.745 3.881.954 8.479.976 10.074.643 11.675.160 12.898.667 13.438.506 13.662.144 13.768.287 13.884.122 13.900.902 13.904.642 13.906.075 13.906.129 11.946.400 10.024.191 5.426.169 3.831.502 2.230.985 1.007.478 467.639 244.001 137.858 22.023 5.243 1.521 70 16 14,093 27,915 60,980 72,447 83,957 92,755 96,637 98,245 99,009 99,842 99,962 99,989 99,999 100,000 85,907 72,085 39,020 27,553 16,043 7,245 3,363 1,755 0,991 0,158 0,038 0,011 0,001 0,000 56 Seguindo os preceito do modelo clássico, podemos inferir que a melhor faixa para se aplicar um aumento na alíquota marginal seria sobre aquelas acima de 9 sálarios-mínimos, ou seja, rendimentos acima de R$ 25 mil/ano (próximo do rendimento tributável médio), pois as obrigações tributárias adicionais recairiam sobre as costas daqueles, aproximadamente 3,8 milhões de contribuintes, para quem o custo social não é tão elevado e proporciona ainda um incremento expressivo nas receitas. 4.2.2 O quociente zm/z* Em primeiro lugar, é importante examinar a razão zm/z*, utilizando a distribuição empírica de rendimentos tributáveis relativa ao IRPF/2001 - Ano Base 2000. Os gráficos 5, 6 e 7 plotam os valores da razão zm/z* comparando-a com a faixa acumulada de rendimento tributável das declarações dos contribuintes, dado esses retirados do IRPF 2001, relativo ao exercício fiscal de 2000. Gráfico 1 Rendim ento Tributável Médio acim a de z* dividida por z* Ano 2000 10,0 9,0 Coeficiente zm/z 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0 1 5,00 10,00 15,00 20,00 75,00 250,00 1.000,00 Rendim ento Tributável z* em R$ m il 57 Gráfico 2 Quocie nte zm/z*, z* e ntre R$ 0 e R$ 40 mil/ano Ano 2000 Coeficiente zm/z* 11 9 7 5 3 1 0 2,00 5,00 8,00 11,00 14,00 17,00 20,00 40,00 Rendimento tributável z* Gráfico 3 Quociente zm/z*, entre R$ 13 mil e R$ 10 milhões Ano 2000 Coeficiente zm/z* 3,00 2,00 1,00 13,00 18,00 40,00 150,00 500,00 7.500,00 Rendimento Tributável z* 58 Os três gráficos mostram as razões zm/z* como função de z* para rendimentos anuais entre R$ 0 e R$ 10 milhões; entre R$ 0 e R$ 40 mil; e entre R$ 13 mil e R$ 10 milhões, respectivamente. De fato, esses três gráficos mostram que a razão parece se estabilizar precocemente a partir de rendimentos acima de R$ 13 mil/ano, em torno de valores entre 2,5 e 2. Entretanto, verificamos uma redução em relação ao parâmetro 2, mergulhando para valores em torno de 1,7, entre os rendimentos anuais acima de R$ 50 mil até acima de R$ 150 mil, voltando a subir em seguida para valores próximos de 2 entre rendimentos anuais acima de R$ 200 mil até R$ 1 milhão, declinando em seguida e estabilizando em torno de 1,64 para rendimentos superiores a R$ 7,5 milhões. Analiticamente vimos que o valor para a faixa mais elevada de rendimentos deveria ser 1, porém o gráfico 3 demonstra que mesmo para rendas anuais de mais de R$ 10 milhões, esse valor (1,64) é mais próximo de 2 do que do valor esperado. Logo, deduzimos que o quociente zm/z* somente deve alcançar valores próximos de um nas proximidades daquele contribuinte com o rendimento mais elevado na distribuição. Conseqüentemente, como Tuomala afirmou, o resultado de alíquota marginal zero apenas se aplica para o contribuinte com o rendimento mais elevado e, portanto, não é de interesse prático. 4.2.3 Resultados empíricos para o Brasil (2000) A partir da hipótese de que a razão zm/z* converge para o limite de uma distribuição paretiana (a/(a-1)), então a fórmula da alíquota marginal ótima sobre grandes fortunas é dada, como vimos no capítulo anterior, pela seguinte expressão: τ= 1− g * 1 − g * + ζ NC + ζ C (a − 1) (41) 59 A partir dessa expressão, construímos as tabelas a seguir que mostram as alíquotas ótimas sobre “grandes fortunas” (assintóticas) para um espectro de valores realísticos do parâmetro paretiano a da distribuição de rendimento empírica para o exercício de 2001, das elasticidades e para diversos valores de g*. Cabe recordar que g* representa a razão entre a utilidade marginal social da renda dos contribuintes que se situam nas faixas mais elevadas de renda e o valor marginal dos fundos públicos, ou seja, quanto menor g* menor será a importância dada pelo governo ao consumo marginal daquele com maiores rendimentos. Além disso, a alíquota τ, calculada pela equação acima, foi reduzida em virtude da incidência de impostos distorcidos indiretos relativos ao consumo com alíquota média33 t = 17%, da seguinte forma: τótima = τ.(1 − t ) ⇔ τótima = 0,83 τ (42) A Tabela 4, em suas três vertentes, mostram que as alíquotas ótimas são decrescentes em relação às elasticidades compensadas e compensadas e ao parâmetro g*, com valores médios em torno de 37,5%, considerando as três preferências distributivas do governo em relação ao consumo dos mais ricos e elasticidades de 0,5. Essa alíquota ótima média é superior em dez pontos percentuais a maior alíquota existente no atual desenho tributário nacional (27,5%). Além disso, o valor do coeficiente zm/z* apresenta uma oscilação entre as faixas de maior renda, sendo que ela é mais acentuada na faixa entre R$ 200 mil e R$ 1 milhão/ano, em torno de 2,08, próximo ao valor norte-americano (2). Por fim, verificarmos que para termos alíquotas marginais ótimas em torno de 25% e 27,5%, mantendo constante as elasticidades e o parâmetro paretiano, a, 33 A hipótese aqui foi considerar a alíquota usual das operações internas do ICMS. 60 assumindo o valor médio de 2,13, seria necessário que o governo tivesse um g* em torno de 0,60 e 0,65, respectivamente. Isso significa que o governo brasileiro, ao praticar alíquotas assintóticas de 25% e 27,5% e caso desejasse que elas fossem ótimas, estaria preocupada com o consumo das classes mais abastadas de maneira extremamente generosa, o que absolutamente não seria uma política responsável num um país que possui uma grave e persistente desigualdade de renda. Tabela 4 - Alíquotas Ótimas para o ano de 2000 g*=0 Rendimento zm/z* a (em R$ mil) ζNC=0,2 ζNC=0,5 ζC=0,2 ζC=0,5 ζC=0,2 ζC=0,5 30-50 1,97 2,03 0,59 0,48 0,49 0,41 75-150 1,74 2,35 0,56 0,44 0,47 0,38 200-1.000 2,08 1,92 0,60 0,50 0,49 0,42 2.500-10.000 1,74 2,36 0,56 0,44 0,47 0,38 Média simples 1,88 2,13 0,58 0,47 0,48 0,40 g*=0,10 Rendimento zm/z* a (em R$ mil) ζNC=0,2 ζNC=0,5 ζC=0,2 ζC=0,5 ζC=0,2 ζC=0,5 30-50 1,97 2,03 0,57 0,46 0,46 0,39 75-150 1,74 2,35 0,55 0,42 0,45 0,36 200-1.000 2,08 1,92 0,58 0,48 0,47 0,40 2.500-10.000 1,74 2,36 0,54 0,42 0,45 0,36 Média simples 1,88 2,13 0,56 0,45 0,46 0,38 g*=0,25 Rendimento zm/z* a (em R$ mil) ζNC=0,2 ζNC=0,5 ζC=0,2 ζC=0,5 ζC=0,2 ζC=0,5 30-50 1,97 2,03 0,54 0,42 0,43 0,35 75-150 1,74 2,35 0,51 0,38 0,41 0,32 200-1.000 2,08 1,92 0,55 0,44 0,43 0,36 2.500-10.000 1,74 2,36 0,51 0,38 0,41 0,32 Média simples 1,88 2,13 0,53 0,41 0,42 0,34 Média Geral 0,373 61 4.2 Conclusão A resposta da pergunta elaborada no capítulo inicial deste trabalho é que as alíquotas marginais assintóticas praticadas pelo país nos últimos anos não foram e não são ótimas, de acordo com os resultados encontrados para o ano de 2000. Na realidade, as alíquotas ótimas deveriam estar em patamar mais elevado, acima de 30%, desde que as elasticidades estimadas estejam corretas, a distribuição empírica de rendimentos tenha a forma apresentada para o exercício de 2000, e as preferências distributivas do governo sejam ainda confortavelmente favoráveis aos ricos (g*=0,25). Cabe destacar que a média geral simples dos casos apresentados na tabela 4 aponta para uma alíquota assintótica ótima de 37,3%. Cabe destacar, por último, que os números encontrados por Saez (2001) para as alíquotas assintóticas ótimas, não levando em conta os impostos indiretos, são próximos aos encontrados neste estudo. Para o caso em que g*=0 e as elasticidades sejam iguais a 0,5, a alíquota ótima para Saez foi de 50% (a=2), enquanto para o Brasil, nessas mesmas condições, o valor encontrado foi de aproximadamente 46% (a=2,13), embora a estabilidade da curva zm/z* versus z* americana seja mais consistente. 62 5. Conclusão “...The results seem to say that, in a economy where there is more intrinsic inequality in economic skill, the income tax is more important weapon of public control than it is in a economy where the dispersion of innate skill is less. The reason is, presumably, that the labour-discouraging effects of the tax are more important, relative to the redistributive benefits, in the latter case”.34 Os objetivos do trabalho foram apresentar uma revisão da literatura sobre tributação ótima da renda, desenvolver os modelos clássico e de perturbação (elasticidades) da tributação ótima da renda e realizar simulações numéricas para o caso da alíquota ótima assintótica - alíquota sobre grandes fortunas - constante do modelo das elasticidades. Neste sentido, o capítulo dois tratou da revisão da literatura existente sobre a tributação ótima da renda e derivar analiticamente o modelo clássico. O modelo clássico da tributação ótima não-linear da renda, como vimos, tem como foco a seleção do melhor desenho tributário para a tributação da renda, balanceando as perdas decorrentes do decréscimo da eficiência contra os ganhos devidos a uma distribuição da renda pós-tributo mais igualitária (Feldstein, 1975). Em virtude de que os resultados analíticos do modelo tradicional são de pouca valia, limitando sua utilização como instrumento de política tributária e fiscal, foram realizadas simulações numéricas com esse modelo que mostraram 34 J. A. MIRRLEES, An Exploration in the Theory of Optimum Income Taxation, Review of Economic Studies, 38 (1971), p. 207. 63 inicialmente que o desenho tributário ótimo seria algo linear e teria alíquotas marginais ligeiramente declinantes ao longo da distribuição de renda, contrariando a política de alíquotas marginais progressivas não lineares aplicadas pela maioria dos governos. Porém, ao longo do tempo, os estudos na literatura trabalhos vêm mostrando que sob determinadas formas da função de distribuição de habilidades (renda), vinculadas também ao grau de desigualdade da renda, da função utilidade e de valores das elasticidades é perfeitamente possível o emprego de desenhos progressivo, ou seja, a teoria começa a evidenciar a realidade das políticas de tributação ótima praticadas pelos governantes. O terceiro capítulo, desenvolveu o modelo de perturbação a partir de sua vertente da tributação linear da renda para o cálculo da alíquota ótima sobre grandes fortunas. Com efeito, a utilização das elasticidades para desenvolver a alíquota ótima para o imposto de renda é um método promissor, em virtude de três pontos. Em primeiro lugar, é muito direto e simples a obtenção da equação para a tributação ótima para rendas elevadas, permitido que essa alíquota possa anualmente ser ajustada a partir dos parâmetros chaves: distribuição empírica dos rendimentos do IRPF, elasticidade compensada e não compensada da oferta de trabalho, ζC e ζNC, e do gosto do governo, g*, em relação ao bem estar dos mais ricos. Em segundo lugar, o método da elasticidade ou perturbação de Saez tem a vantagem de mostrar precisamente como os diferentes efeitos econômicos entrem em jogo e quais são os parâmetros relevantes para a tributação ótima. Finalmente, as simulações numéricas podem ser realizadas e calibradas utilizando a distribuição empírica de 64 rendimentos, pois as fórmulas da tributação ótima são expressas em termos de parâmetros que podem ser observados ou estimados. O quarto capítulo, tratou de realizar as simulações numéricas (calibragens) pretendidas. Com efeito, as simulações numéricas para a alíquota ótima sobre grandes fortunas, mostraram que o seu menor valor (38%; 36% e 32%) e seu valor médio de 37,3% (40%, 38% e 34%), em qualquer das hipóteses levantadas, são maiores do que o valor hoje praticado, 27,5%, como também daquele inicialmente estabelecido em 1995, 25%. Logo, a pergunta constante do intróito pode ser respondida: as alíquotas de 25% e 27,5% talvez não fossem ótimas, quando se leva em conta a distribuição de rendimentos de 2000, porém eram convenientes e oportunas para o embate, à época e ainda hoje, entre oposição e situação, atualmente em campos opostos. De fato, usando o valor da elasticidade igual a 0,5, encontrado na literatura empírica internacional, sendo a distribuição de rendimentos de formato paretiano (zm/z*=a=2), o governo indiferente ao bem-estar social dos ricos e sem efeito renda, a fórmula para a alíquota ótima assintótica (equações 41 e 42 do capítulo anterior) sugere que a alíquota marginal sobre a renda do trabalho deveria ser em torno de 41,5% no caso brasileiro (t=17%). Isso significa que poderíamos aplicar essa alíquota a partir da faixa de rendimento igual ou superior a R$ 30 mil reais/ano, ou seja, R$ 2,5 mil por mês, tomando como base o IRPF/2001 ano base 2000. Entretanto, não se pode esquecer que o eventual aumento na alíquota assintótica ótima para 41,5% teria uma repercussão negativa junto à opinião pública. Isso se deve ao elevado nível de carga tributária em relação ao PIB - 33,84% em 2001 65 (dado da SRF), 35,86% em 2002 (dado da SRF), 36,11% (estimativa do Instituto Brasileiro de Planejamento Tributário - IBPT) em 2003 e 38,11% (estimativa do IBPT) em 2004 -, e a insatisfação da sociedade com a pouca eficiência no gasto público. Ressalte-se, por oportuno, que caso a reforma tributária em curso promova a unificação do ICMS com uma alíquota máxima (usual) em torno de t=12% - 30% de ganho de eficiência sobre a alíquota usual de 17% -, obrigaria o Governo Federal a aumentar ainda mais a alíquota assintótica ótima: passaria dos 41,5% para em torno de 44%. Os resultados apresentados neste trabalho mostram a influência central dos parâmetros básicos: elasticidades, objetivo redistributivo do governo e a distribuição empírica dos rendimentos tributáveis, no cálculo da alíquota marginal assintótica ótima. Assim sendo, seria muito importante o desenvolvimento de estudos com vistas a estabelecer valores paramétricos mais específicos e robustos para a realidade brasileira, o que certamente tornaria os resultados mais consistentes e realistas. Logo, muito esforço e pesquisa devem ser empreendidos no sentido de determinar os valores desses parâmetros para o Brasil. Cabe ressaltar que as condições da economia estabelecidas nos modelos são altamente estilizadas, embora elas tragam benefícios analíticos compensadores, como demonstrado nos capítulos dois e três, porém deixam de fora alguns aspectos importantes que são de interesse prático. Por exemplo, a hipótese de que a economia só tenha uma única forma de trabalho com diferenças na habilidade das trabalhadoras na performance do trabalho, não é compatível com a realidade de que 66 há muitas outras formas de trabalho na economia que requerem diferentes habilidades e condições de trabalho. Ademais, o pagamento monetário para a oferta de trabalho pode ser somente uma parte do pacote de remuneração, pelo menos daqueles que recebem rendas mais elevadas. No Brasil, começa a crescer o número de executivos, gerentes e especialistas que deixam de ser assalariados nas empresas, passando a ser uma pessoa jurídica prestadora do mesmo serviço a suas empresas, com o objetivo de permitir que o empregador reduza seus encargos trabalhistas e que o empregado pague menos imposto de renda: ao se tornar pessoa jurídica, o profissional fica sujeita a uma alíquota menor. Nesse sentido, um aumento no imposto de renda será mais sentido pelos assalariados que possuem remuneração basicamente monetária, do que os que recebem pacotes de remuneração, em que a pecúnia é somente uma parte dos benefícios que percebem. De outra sorte, existem também aspectos intertemporais que influenciam a decisão sobre oferta de trabalho, tais como o momento de entrada na força de trabalho e de solicitação da aposentadoria. Em vista que um imposto de renda irá introduzir distorções nessas decisões, ele aumenta o potencial de perdas de eficiência. Por outro lado, existem outras extensões do modelo clássico, tais como a introdução da incerteza na renda, escolha educacional e interdependência da utilidade ou efeitos externos, que eventualmente tornam o problema clássico mais complexo. Entretanto, para os temas da incerteza da renda (desigualdades da renda produzidas somente pela sorte ou pela sorte e habilidade) e dos efeitos externos (existência de altruísmo e inveja) nota-se, de acordo com Tuomala35, que as simulações numéricas definem um desenho ótimo progressivo para as alíquotas 67 marginais em quase toda a extensão da distribuição de rendimentos, contrariando o resultado padrão do modelo de Mirrlees. Por último, gostaríamos de ressaltar que a presente investigação resultou pelo menos em um instrumento adicional para o calculo rápido e simples da alíquota marginal assintótica ótima do imposto de renda. Os governantes, portanto, podem dispor desse mecanismo para atacar o que o economista Marcelo Neri36 chama de inércia da desigualdade da renda, desde que, ceteribus paribus, não se perca de vista a intuição do homem simples da rua, conforme disse Joseph Pechman em trecho de discurso transcrito na introdução de nosso trabalho: “...Eu acredito que a cidadã nas ruas está certa e que nós deveríamos continuar a confiar no tributo sobre a renda para aumentar a receita de uma maneira eqüitativa.” 35 Matti TUOMALA, Optimal Income Tax and Redistribution, p.14:19. Prado, Maria C. R. M. Ataque à inércia da desigualdade. GAZETA MERCANTIL. São Paulo-SP, 3 de outubro de 2002. Opinião, A-3. 36 68 REFERÊNCIAS BIBLIOGRÁFICAS ARNOTT, Richard (1994), “Reflections on Optimal Tax Theory,“ in John M. Quigley e Eugene Smolensky (eds.), Modern Public Finance. Cambridge, MA: Harvard University Press, p. 257-281. ATKINSON, A. B. (1990), “Public Economics and The Economic Public”, European Economic Review 34, p. 225-248. AUERBACH, Alan J. & HINES Jr., James R. (2001), “Taxation and Economic Efficiency”, NBER WP 01-8181. BEVAN, David L. & ROAD, Manor (2002), “Optimum income taxation when earnings are imperfectly correlated with productivity”, Working Paper Oxford University. DAHAN, M. & STRAWCZYNSKI, M. (2000), “Optimal Income Taxation: An Example with a U-Shaped Pattern of Optimal Marginal Tax Rates: Comment”, American Economic Review 90(3), p. 681-685. DIAMOND, Peter A. (1998), “Optimal Income Taxation: An Example with a U-Shaped Pattern of Optimal Marginal Tax Rates”, American Economic Review 88(1), p. 82-95. DIXIT, Avinash K. (1990), Optimization in Economic Theory. New York, NY: Oxfod University Press. 2º ed. EBERT, Udo (1992), “A re-examination of the optimal non-linear income tax”, Journal of Public Economics 49, p. 47-73. FELDSTEIN, Martin (1976), “On The Theory of Tax Reform”, Journal of Public Economics 6, p. 77-104. 69 FUENTE, Angel de la (2000), Mathematical Methods and Models for Economists. Cambridge, MA: Cambridge University Press. GRUBER, J. & SAEZ, E. (2000), “The Elasticity of Taxable Income: Evidence and Implications”, NBER WP 00-7512. JEHLE, Geoffrey A. & RENY, Philip J. (1998), Advanced Microeconomic Theory. New York, NY: Addison-Wesley. KANBUR, Ravi & TUOMALA, Matti (1994), “Inherent Inequality and the Optimal Graduation of marginal Tax Rates”, Scadinavian Journal of Economics 96(2), p. 275282. KEVIN, Roberts (2000), “A Reconsideration of The Optimal Income Tax,“ in Peter J. Hammond e Gareth D. Myles (eds.), Incentives, Organization, and Public Economics - Papers in Honour of Sir James Mirrlees. Cambridge: Oxford University Press, p. 171-189. LOLLIVIER, Stefan (1983), “Bunching and Second-Order Conditions: A Note on Optimal Tax Theory”, Journal of Economic Theory 31, p. 392-400. MIRRLEES, J.A. (1971), “An exploration in the theory of the optimal income tax”, Review of Economic Studies 38, p. 175-208. ____________________ (1976), “Optimal tax theory: a synthesis”, Journal of Public Economics 6, p. 327-358. MUSGRAVE, Richard A. & BUCHANAN, James M. (1999), Public Finance and Public Choice: two contrasting visions of the State. MA: Massachusetts Institute of Technology. MYLES, Gareth D. (1995), Public Economics. Cambridge: Cambridge University Press. 70 NICHOLSON, Walter (1998), Microeconomic Theory. New York, NY: The Dryden Press. 7º ed. PENCHMAN, Joseph A. (1987), “Tax Reform: Theory and Pratice”, Economic Perspectives 1(1), p. 11-28. SADKA, E. (1977), “On income distribution, incentives effects and optimal income taxation”, Review of Economic Studies 43, p. 261-268. SAEZ, E. (2000), “The Effect of Marginal Tax Rates on Income: A Panel Study of ‘Bracket Creep’”, NBER WP 99-7367. _____________(2000), “USING ELASTICITIES TO DERIVE OPTIMAL INCOME TAX RATES”, NBER WP 00-7628. _____________(2001), “Using Elasticities to Derive Optimal Income Tax Rates”, Review of Economic Studies 68, p. 205-229. SEADE, J. K. (1977), “On the shape of optimal tax schedules”, Journal of Public Economics 7, p. 203-236. _____________(1982), “On the sign of the optimum marginal income tax”, Review of Economic Studies 49(4), p. 637-643. STERN, N. H. (1976), “On the specification of models of optimum income taxation”, Journal of Public Economics 6, p. 123-162. TUOMALA, M. (1984), “On the optimal income taxation: Some further numerical results”, Journal of Public Economics 23, p. 351-366. _____________ (1990), Optimal Income Tax and Redistribution. London: Oxford University Press. 71 WERNECK, Rogério L. F. (2003). “ A Bandeira da Progressividade: Há muito a fazer tanto do lado da tributação como do lado do dispêndio”, O Estado de São Paulo, São Paulo, 23 de maio. WEYMARK, J.A. (1986b) “Bunching properties of optimal nonlinear income tax problems”, Social Choice and Welfare, 3, p. 213 - 232. 72 Apêndice 1. A solução do problema individual do agente no Modelo Clássico max u(c,y) sujeito à c=z-τ(z), z=wy O lagrangeano para a solução do problema é dado por : L(c, y , λ ) = u(c, y ) − λ( z − τ( z ) − c ) ∂L ∂L ∂c = uc + λ = 0 ⇒ uc = −λ ∂y = u y − λ(w − (43) ∂τ( z ) ) = 0 ⇒ u y − λ(w − τ' ( z ).w ) = 0 ⇒ u y − λw (1 − τ' ( z )) = 0 ∂y (44) ⇒ u y − λwc z dado que: ∂τ(z)/∂y = [∂τ(z)/∂z].∂z/∂y = τ‘(z).w e c=z-τ(z) ⇒ ∂c/∂z = cz = 1-τ‘(z) ( 43) → ( 44) : u y + u c wc z = 0 ⇒ cz = − uy ucw ⇒ cz = − (45) uz uc (46) pois ∂u(c,y)/∂z= ∂u/∂y.∂y/∂z ⇒ uz=uy/w 2. A solução do Princípio de Máximo O Lagrangeano para a solução do problema é dado por : ⎧ ⎫ ⎡ dx (w ) ⎤ L( x, u, λ, α ) = ⎨F ( x (w ), u(w ), w ) − α(w )⎢ − Q( x(w ), u )w ), w )⎥ − λ[G( x(w ), u(w ), w )]⎬dw ⎣ dw ⎦ ⎩ ⎭ ∫ L( x, u, λ, α ) = ⎧ ∫ ⎨⎩F ( x(w ), u(w ), w ) + α(w )Q( x(w ), u )w ), w ) + x(w ) dα(w ) ⎫ − λ[G( x (w ), u(w ), w )]⎬dw dw ⎭ (47) + α(w 0 )x (w 0 ) − α(w 1 )x(w 1 ) 73 Integrando por parte temos que: u=α(w) e dv=d(x(w)/dw)dw ⇒ − ∫udv = - uv + ∫vdu ⇒ − ∫α(w)d(x(w)/dw)dw = - α(w)x(w)⎢w0w1 + ∫x(w)d(α(w)/dw)dw ⇒ ∫x(w)d(α(w)/dw)dw + α(w0)x(w0) - α(w1)x(w1) ∂L ≡ Fu ( x(w ), u(w ), w ) + α(w )Qu ( x(w ), u(w ), w ) − λGu ( x (w ), u(w ), w ) = 0 ∂u (48) dα(w ) ∂L ≡ Fx ( x(w ), u(w ), w ) + α(w )Qx ( x (w ), u(w ), w ) + − λGx ( x(w ), u(w ), w ) = 0 dw ∂x (49) ou dα(w ) = −[Fx ( x (w ), u(w ), w ) + α(w )Qx ( x (w ), u(w ), w ) − λGx ( x(w ), u(w ), w )] dw (50) Essas condições de primeira ordem podem ser escritas de uma forma mais compacta, a partir da definição de uma nova função H, chamada de Hamiltoniano, descrito por: H ( x, u, α, w ) = F ( x (w ), u(w ), w ) + α(w )Q( x(w ), u(w ), w ) (51) Então, a condição (48) sustenta que a variável de contole u(w) para uma determinada habilidade w deveria ser escolhida para maximizar H(x,u,α,w), sujeita a restrição (18). Portanto, podemos escrever H*(x,u,α,w) como sendo o valor máximo resultante. Definindo o Lagrangeano L* para essa determinada habilidade w, evitando-se confundir com o lagrangeano L elaborado para o problema geral, que engloba todo o espectro de habilidades e não somente para uma dada habilidade, como: L* = H ( x, u, α, w ) − λG( x(w , u(w ), w ) (52) Logo, podemos reescrever (51) de uma maneira mais simples, ou seja: dα(w ) = L x * ( x, u, α, w ) dw (53) Num problema de maximização estática, somente u(w) seria a variável de escolha, enquanto x(w) e α((w) seriam considerados parâmetros. Portanto, podemos aplicar 74 o teorema do envelope (que afirma que o efeito total no valor otimizado da função objetiva quando um parâmetro muda - portanto, o problema geral deveria ser otimizado novamente -, em princípio pode ser deduzido simplesmente tomando a derivada parcial do Langrangeano original em relação ao parâmetro e avaliar o resultado nas condições de primeira ordem do problema original), transformando (53) na seguinte expressão: dα(w ) = −H x * ( x, α, w ) dw (54) Além disso, o teorema do envelope também nos permite dizer que H*u = L*u = Q, quando avaliadas no ótimo. Assim sendo, podemos escrever (17) numa forma simétrica a (51): dx (w ) = −Hα * = ( x, α, w ) dw (55) 3. A solução do problema da Tributação Ótima da Renda no Modelo Clássico Construímos o Langrajeano L da seguinte forma: ⎧ ⎫ ⎡ du ⎤ L(u, z, α, λ ) = ⎨W (u )fw + α(w )⎢ − g (u, z )⎥ + λ[z(w ) − h(u, z )]f (w )⎬dw ⎣ dw ⎦ ⎩ ⎭ ∫ (56) Integrando por partes a componente do Lagranjeano que contém α(w).du/dw, obtemos: du du du ∫ α(w ) dw ⇔ u = α(w );dv = dw ⇔ ∫ udv = uv − ∫ vdu ⇔ ∫ α(w ) dw = α(w )u(w ) − ∫ u dα(w ) dw Então, temos: dα(w ) ⎧ ⎫ − α(w )g (u, z ) + λ[z(w ) − h(u, z )]f (w )⎬dw + α(w ^ )u(w ^ ) − α(w _)u(w _) L(u, z, α, λ ) = ⎨W (u )fw − u(w ) dw ⎩ ⎭ ∫ (57) e o Hamiltoniano dado por: 75 H (u, z, α, λ ) = ∫ {W (u )fw − α(w )g (u, z) + λ[z(w ) − h(u, z)]f (w )}dw dα(w ) ∂L dα(w ) = Hu − = W u f (w ) − α(w )g u − λhu f (w ) − =0 dw ∂u dw (58) (20) → (58): − dα(w ) α(w )uwc ⎡ λ⎤ − + ⎢Wu − ⎥f (w ) = 0 dw uc uc ⎦ ⎣ ∂L = Hz = −α(w )g z + λ(1 − hz )f (w ) = 0 ∂z (59) (60) (20) → (59): α(w )u c Φ w + λ[1 − Φ ]f (w ) = 0 (61) 4. Derivação de uma expressão para ψ e para a equação (29), quando a função utilidade é quase linear e descrita por: u(c,y) = c + υ(1-y), em que υ é uma função estritamente côncava – Modelo Clássico Com efeito, sendo y=z/w, então ∂y/∂w = - z/w2 = -y/w, então teremos: u c = 1; u cw = 0; u y = −υ' (1 − y ); u yw = ∂u y ∂y y . = −υ' ' (1 − y ) ∂y ∂w w y y − υ' ' (1 − y ) υ' ' (1 − y ) u yw u cw Φ w .w w w ψ=− = −w . + 1 + w. = −w . + 1⇒ ψ = − + 1⇒ uy Φ uc − υ' (1 − y ) υ(1 − y ) ψ= (62) 1 +1 ε A expressão (22) pode ser reescrita da seguinte forma: ⎡ u dα(w ) λ ⎤ = −α(w ). cw + ⎢Wu − ⎥f (w ) dw uc uc ⎦ ⎣ (63) Multiplicando ambos os lados da expressão (61) por -uc/λ e recordando que para uma função quase linear ucw = 0 e uc=1, obtemos: 76 dα(w ) 1 ⎡ Wu (w ) ⎤ + 1⎥f (w ) . = − λ dw λ ⎢⎣ ⎦ (64) Integrando ambos os lados da equação acima e impondo a condição de transversalidade (α→ 0 quando w →∞) ), então: ∞ ∞ α(w ) ⎡ W (w ) ⎤ ⎡ W (w ) ⎤ = ⎢1 − u f (w )d (w ) = [1 − F (w )] − ⎢ u ⎥ ⎥f (w )dw λ λ ⎦ ⎣ ⎣ λ ⎦ w w ∫ ∫ (65) Em que F(.) é a função acumulada de densidade, tendo como base f(.). 5. A solução do problema individual do agente no Modelo de Saez (2000) O lagranjeano para a solução do problema é dado por : L(c, z, λ ) = u (c, z ) − λ[z(1 − τ) + R − c ] ∂L ∂c = u c + λ = 0 ⇒ u c = −λ (66) ∂L ∂c = u z − λ(1 − τ) = 0 (67) (1) → (2) : u z + (1 − τ)u c (68) =0 Por outro lado, se formularmos o problema dual, ou seja, minimizar a função gasto e(1-τ,u*) da contribuinte teremos: min c-z(1-τ) sujeito à u(c,z)=u*, em que τ é alíquota tributária marginal e u* é o nível de utilidade que minimiza o gasto do contribuinte. O lagranjeano para a solução do problema é dado por : L(c,z,λ) = c-z(1-τ) - λ[u*- u(c,z)] ∂L/∂c= 1 + λuc = 0 ⇒ uc = - 1/λ (69) 77 ∂L/∂z= -(1-τ) + λuz=0 ⇒ uz = (-τ)/λ (70) (67) / (66) : uz /uc = - (1−τ) (71) Com efeito, partirmos de Teorema da Teoria do Consumidor que estabelece a seguinte relação entre a demanda hicksiana e a demanda marshaliana: zh(1-τ,u*) = z[(1-τ),e(1-τ,u*)] (72) Diferenciando (72) em relação a (1-τ) temos: ∂zh(1-τ,u*)/∂(1-τ) = ∂z[(1-τ),e(1-τ,u*)]/∂(1-τ) + ∂z[(1-τ),e(1-τ,u*)]/∂e(1-τ,u*).∂e(1- τ,u*)/∂(1-τ) (73) Além disso, utilizando o teorema que nos diz que e(1-τ,u*) = R, o lema de Shephard que estabelece que ∂e(1-τ,u*)/∂(1-τ) = - zh(1-τ,u*) e sendo e = c-z(1-τ), então ∂e/∂(1-τ) = -z, a expressão (73) pode ser descrita da seguinte forma: ∂zh(1-τ,u*)/∂(1-τ) = ∂z[(1-τ),R]/∂(1-τ) ∂z[(1-τ),R]/∂R.zh(1-τ,u*) - (74) Aplicando (72) em (74), obtemos: ∂zh(1-τ,u*)/∂(1-τ) = ∂z[(1-τ),R]/∂(1-τ) - ∂z[(1-τ),R]/∂R.z(1-τ,R) (75) Rearranjando (75), temos: ∂z[(1-τ),R]/∂(1-τ) = ∂zh(1-τ,u*)/∂(1-τ) + z(1-τ,R).{∂z[(1-τ),R]/∂R} (76) Multiplicando os dois lados da equação (76) por (1-τ)/z(1-τ,R) e tendo em vista que: z[(1-t),e(1-t,u*)] = z[(1-t),R]= zh(1-t,u*), temos: ∂z[(1-τ),R]/∂(1-τ).[(1-τ)/z(1-τ,R)] = ∂zh(1-τ,u*)/∂(1-τ)).[(1-τ)/zh(1-τ,u*)] + z(1-τ,R).{∂z[(1τ),R]/∂R}).[(1-τ)/z(1-τ,R)] (77) E, portanto: 78 ζNC ζC = + η ⇒ ζC ζNC = η - (78) sendo que: ζNC [∂z(1-τ,R)/∂(1-τ)].[(1-τ)/z(1-τ,R)])] = = [∂z/∂(1-τ)].[(1-τ)/z] (79) ζC [∂z(1-τ,R)/∂(1-τ)].[(1-τ)/z(1-τ,R)] ⎢u = = [∂z/∂(1-τ)].[(1-τ)/z] ⎢u (80) η = {∂z[(1-τ),R]/∂R}).(1-τ) (∂z/∂R).(1-τ) = (81) 6. Resposta comportamental no Modelo de Saez (2000) Uma variação infinitesimal dz nos rendimentos z(1-τ ,R) de uma contribuinte individual é descrita por: dz = - [∂z/∂(1-τ )]dτ + (∂z/∂R)dR (82) Multiplicando ambos lados por (1-τ)/z, teremos: (1-τ)/z.dz = - (1-τ)/z.[∂z/∂(1-τ )]dτ + (1-τ)/z.(∂z/∂R)dR (83) (79) e (81) → (83) : (1-τ)/z.dz = - ζNCdτ + η/z.dR (84) Sendo dR=z*dτ, então (84) toma seguinte forma: dz = (- ζNCdτ + η/z.z*dτ)z/(1-τ) ⇒ dz = - (ζNCz − ηz*)dτ/(1-τ) (85) Tendo em vista que η é sempre não positivo e ζC não negativo, em razão de que o lazer não é considerado um bem inferior, então a variação dz da expressão (75) é 79 negativa, desde que garantido que ζC≥0, η≤0 e ζC≥ η, então ζNC≥0, o que significa uma redução nas receitas tributárias de τdz. Nesse sentido, a redução total, B, das receitas tributárias devida ao efeito comportamental será a soma dos termos τdz sobre todos as contribuintes com rendimentos superiores que z*, logo: B = - (ζ*NCzm − η*z*)τdτ/(1-τ) (86) em que: ∞ ζ * NC = ∫ ζ NC zh( z ) z* dz e η* = zm ∞ ∫ ηh(z)dz z* Cabe ressaltar que h(z) é a densidade da distribuição de rendimentos no regime tributário ótimo, sendo que a população com rendimento superior a z* é normalizada sem perda de generalizada, e que ela é endógena ao desenho tributário. Além disso, ζ*NC é a elasticidade não compensada média ponderada, sendo que a elasticidade ζNC(z) no interior da integral é a elasticidade média dos contribuintes com rendimento z. Por outro lado, η* é o efeito renda médio. Saez (2000) afirma que os pesos estabelecidos para os parâmetros ζNC e η são diferentes, pois ele assume que os contribuintes de mesmo rendimento não precisam ter a mesma elasticidade, o que é relevante nos parâmetros são as elasticidades médias em determinados níveis de rendimento. Ademais, esse mesmo autor assume que o conjunto de contribuintes que porventura passam a contribuir descontinuamente mais, em razão do aumento infinitesimal na alíquota tributária, é desprezível. 7. Dedução da expressão (39) a partir da equação (38), utilizando o parâmetro de Pareto a τ/(1-τ) = 1)]/[(ζ*NCzm/z* − η*)] [(1-g*)(zm/z* - (38) τ/(1-τ) = (1-g*)[a/(a-1) - 1]/[ζ*NC .a/(a-1) − ζ NC+ζ C)] 80 τ/(1-τ) = (1-g*)/(a-1)/{ζ*NC .[a/(a-1) − 1]+ζ C} τ/(1-τ) = (1-g*)/(a-1)/[ζ*NC /(a-1)+ζ C)] τ/(1-τ) = (1-g*)/(a-1)/[ζ*NC+ζ C(a-1)]/ (a-1) τ/(1-τ) = (1-g*)/[ζ*NC+ζ C(a-1)] τ= (1-g*)/[ζ*NC+ζ C(a-1)] .(1-τ) τ + {(1-g*)/[ζ*NC+ζ C(a-1)]}τ= (1-g*)/[ζ*NC+ζ C(a-1)] τ{1+ (1-g*)/[ζ*NC+ζ C(a-1)]}= (1-g*)/[ζ*NC+ζ C(a-1)] τ= (1-g*)/[ζ*NC+ζ C(a-1)] / {1+ (1-g*)/[ζ*NC+ζ C(a-1)]} τ= (1-g*)/[ζ*NC+ζ C(a-1)] / {[ζ*NC+ζ C(a-1)]+ (1-g*)]}/[ζ*NC+ζ C(a-1)] τ *= (1-g*) / [ζ*NC+ζ C(a-1)+ (1-g*)] (39) 81 ANEXO DADOS DIRPF 2001 Faixa de Renda Anual Tributável (em R$/ano) Total (Acima de R$ 0,00) Acima de R$ 1,00 Acima de R$ 1.000,00 Acima de R$ 2.000,00 Acima de R$ 3.000,00 Acima de R$ 4.000,00 Acima de R$ 5.000,00 Acima de R$ 6.000,00 Acima de R$ 7.000,00 Acima de R$ 8.000,00 Acima de R$ 9.000,00 Acima de R$ 10.000,00 Acima de R$ 11.000,00 Acima de R$ 12.000,00 Acima de R$ 13.000,00 Acima de R$ 14.000,00 Acima de R$ 15.000,00 Acima de R$ 16.000,00 Acima de R$ 17.000,00 Acima de R$ 18.000,00 Acima de R$ 19.000,00 Acima de R$ 20.000,00 Acima de R$ 25.000,00 Acima de R$ 30.000,00 Acima de R$ 40.000,00 Acima de R$ 50.000,00 Acima de R$ 75.000,00 Acima de R$ 100.000,00 Acima de R$ 125.000,00 Acima de R$ 150.000,00 Acima de R$ 200.000,00 Acima de R$ 250.000,00 Acima de R$ 300.000,00 Acima de R$ 400.000,00 Acima de R$ 500.000,00 Acima de R$ 750.000,00 Acima de R$ 1.000.000,00 Acima de R$ 2.500.000,00 Acima de R$ 5.000.000,00 Acima de R$ 7.500.000,00 Acima de R$ 10.000.000,00 No.de Valor Total da Renda Renda Média Declarações Tributável por Faixa Tributável por de Renda (R$ Faixa (R$ Mil) Milhões) 13.906.144 12.983.409 12.794.183 12.189.154 11.946.400 11.650.440 11.375.645 11.038.322 10.753.150 10.415.551 10.024.191 9.529.442 8.619.883 7.899.553 7.001.338 5.911.180 5.426.169 5.035.768 4.697.384 4.374.051 4.087.581 3.831.501 2.867.854 2.230.985 1.453.756 1.007.478 467.639 244.001 137.858 83.599 37.957 22.023 14.510 8.022 5.243 2.560 1.521 306 70 34 16 276.112,97 276.112,97 276.025,07 274.998,16 274.380,62 273.333,46 272.076,39 270.183,58 268.320,34 265.777,52 262.427,06 257.682,72 248.047,66 239.693,66 228.393,93 213.744,65 206.712,87 200.664,91 195.083,03 189.416,47 184.117,60 179.124,35 157.631,02 140.196,50 113.370,59 93.459,58 60.816,36 41.613,60 29.829,93 22.436,03 14.680,23 11.153,32 9.108,62 6.889,06 5.653,47 4.045,77 3.147,19 1.421,80 633,77 417,08 261,73 19,85 21,26 21,57 22,56 22,96 23,46 23,91 24,47 24,95 25,51 26,17 27,04 28,77 30,34 32,62 36,15 38,09 39,84 41,53 43,30 45,04 46,75 54,96 62,84 77,98 92,76 130,04 170,54 216,38 268,37 386,75 506,43 627,74 858,77 1.078,28 1.580,37 2.069,15 4.646,40 9.053,85 12.267,05 16.358,12 82