Efeitos de Programas de Assistência Social sobre a Freqüência Escolar: Uma Análise Baseada em Modelos Hierárquicos Resumo: O presente trabalho procura analisar empiricamente como as políticas sociais contemporâneas no Brasil afetam os indicadores de freqüência à escola por parte dos filhos das famílias beneficiadas. O estudo empírico aqui realizado incluiu como amostras as famílias participantes de uma série de políticas sociais identificadas como “auxílios”, ou “transferências monetárias”, as quais têm uma incidência focalizada sobre as famílias mais pobres. Além disso, para analisar os efeitos da descentralização do gasto social no Brasil, foram incluídas nos modelos de estimação variáveis referentes às características dos estados em que vivem as famílias observadas pela amostragem, dentre elas o volume de gastos por parte do governo estadual com assistência social. As variáveis de nível individual-familiar e de nível estadual foram estimadas mediante modelos probit e hierárquicos, os quais buscam diferenciar os efeitos individuais dos efeitos de grupo sobre as estimativas de coeficientes e de variâncias nas regressões. Conclui-se que os programas assistenciais contribuem positivamente para a freqüência à escola. Contudo, esse fenômeno ocorre de maneira homogênea em todo o país, sem significativas diferenças em relação às características de cada estado. Palavras-chave: educação, políticas sociais, modelos hierárquicos Classificação JEL: C19, H52, I28 Abstract: This paper intends to analyze empirically how contemporaneous Brazilian welfare policy affects the index of school attendance by the children of benefited families. The empirical study done here included as samples families that participate in a series of welfare policies identified as “aids”, or “monetary transferences”, that are focalized over the poorest families of country’s population. Besides, in order to analyze the effects of decentralization of welfare policy in Brazil, were included in estimation models variables referring to the characteristics of states those sampled families inhabit, just like the extent of expenditures of state’s government with welfare. Variables of both individual-familiar and state levels were estimated with probit and hierarchical models, those ones intends to differentiate individuals and collective effects over the estimates of coefficients and variances in the regressions. The paper concludes that welfare policy contributes positively over school attendance. However, this phenomenon happens homogeneously all over the country, without significant differences related to each state’s characteristics. Key words: education, welfare policy, hierarchical models JEL Classification: C19, H52, I28 I – Introdução A partir da década de noventa, os gastos sociais no Brasil tiveram uma mudança bastante significativa de natureza. Ao contrário do que era feito anteriormente, em que as políticas tinham caráter universal e de execução centralizada, atualmente os programas vêm apresentando tendências cada vez mais focalizadas e de execução descentralizada, por meio das unidades subnacionais de governo. A primeira parte do presente trabalho abordará uma breve dicussão sobre esse tema. Para avaliar o impacto das políticas sociais sobre a riqueza (ou redução da pobreza) das famílias, se analisará o efeito da participação por parte da família em programas sociais sobre a freqüência de seus filhos à escola. A relação entre riqueza e demanda por escolaridade foi desenvolvida por Becker (1991 & 1993), em sua Teoria do Capital Humano, e está abordada na segunda parte do trabalho, que também descreve alguns estudos empíricos aplicados à realidade brasileira sobre o tema. Após essas discussões, a presente pesquisa procurará desenvolver modelos para estimar o impacto da participação, ou não, por parte das famílias em uma lista de políticas sociais assistenciais sobre a freqüência de seus filhos à escola. Para isso, se controlará não apenas as características individuais das crianças observadas, mas também as características dos estados em que habitam, como forma de se mensurar a descentralização dos programas assistenciais e as diferenças estaduais de acessibilidade ao estudo. A análise, com esse objetivo, será realizada pelo uso de modelos hierárquicos, os quais são construídos com o objetivo de se separar os efeitos de ordem individual e de ordem coletiva para a variabilidade dos dados observados. Os dados utilizados foram obtidos na Pesquisa de Orçamento Familiar (POF) de 2002-2003, no Ministério da Fazenda e no Ministério da Educação. Chega-se à conclusão de que a participação em programas assistenciais contribui positivamente para a probabilidade de as famílias encaminharem seus filhos para a escola. Contudo, essa tendência ocorre em nível nacional, sem significativas variações entre os estados brasileiros. II – Gasto Social no Brasil: Aspectos Contemporâneos A literatura estudada destaca a mudança do foco dos gastos sociais no Brasil a partir da década de noventa. Tendo, como pano de fundo, o processo de estabilização macroeconômica, caracterizado pelo contínuo aperto fiscal e monetário, houve uma pressão, sob o ponto de vista político e econômico, para que se melhorasse a racionalização dos recursos públicos e a eficiência dos gastos. No que diz respeito às políticas sociais, a partir desse período, houve maior ênfase na focalização e na descentralização das responsabilidades sociais do setor público. Em relação ao novo direcionamento das políticas sociais, segundo Lavinas (2000), tradicionalmente, o gasto social no Brasil tinha o caráter de políticas concretas de habitação, urbanismo e de saneamento básico para a população, isto é, consistiam em políticas de investimentos em infra-estrutura social. Devido ao aspecto universal dessas políticas, pode-se afirmar que consistiam em medidas de combate à desigualdade no país, uma vez que visavam à melhoria das condições de vida da população carente como um todo. A autora destaca que essas políticas significavam a concessão de direitos de cidadania e bem-estar social à população pobre, 2 o que proporcionaria um melhor acesso dessa faixa de população a melhores oportunidades de emprego e de condições de vida. Durante o período de estabilização econômica (década de noventa), seja por motivos de restrição orçamentária governamental, seja por motivos meramente técnicos, o gasto social no Brasil1 passou a ter um caráter focalizado, voltado à assistência social direta à população mais necessitada. O mecanismo de ação dessas novas políticas consiste na realização de transferências monetárias diretas à população beneficiária. Ou seja, visivelmente o objetivo dessas novas políticas passou a ser o combate a pobreza, por meio da redistribuição de renda, e não mais a igualdade. Resende & Oliveira (2006) apontam que os principais benefícios das políticas sociais de transferências monetárias estão relacionados à promoção, ao mesmo tempo, de assistência para as famílias mais pobres no curto prazo, combatendo a pobreza corrente, e de investimento, por parte das mesmas famílias, em capital humano, o que acaba levando a efeitos de longo prazo, reduzindo a pobreza no futuro e promovendo a inclusão social. Além disso, pode-se citar como vantagens das políticas focalizadas de distribuição de renda a maior restrição do volume de recursos públicos ao seu orçamento, já que não ambiciona beneficiar toda a população, o que traz vantagens fiscais ao implementador, e a maior eficiência microeconômica do gasto social sobre o bem-estar das famílias, que, dotadas com maior volume de renda monetária (ao invés de bens públicos já produzidos), podem alocar seus recursos de acordo com suas próprias preferências. Contudo, uma parte da bibliografia, com destaque para Lavinas (2000), argumenta que as políticas de distribuição direta e focalizada de renda monetária podem apresentar ineficiências horizontais, no sentido de não conseguirem beneficiar todas as famílias mais pobres da população (ou mesmo de vazarem para as famílias não-pobres). Além disso, no caso de transferências vinculadas, o custo de monitoramento por parte do implementador pode ser muito elevado, ou então, dependendo da condicionalidade imposta para a participação no programa, as famílias potencialmente beneficiárias podem simplesmente decidir não participar. No que diz respeito à descentralização dos gastos sociais, Winkler & Gershberg (2000) apresentam os fundamentos técnicos que motivaram essa tendência em nível internacional. Segundo os autores, a descentralização de atribuições fiscais entre as esferas governamentais dos países está baseada em ganhos de eficiência social e técnica. De acordo com os autores, a descentralização dos compromissos sociais dos governos federais para as unidades federativas de nível subnacional e local proporciona uma maior eficiência social ao gasto público por elevar a participação dos agentes locais nas decisões sobre os serviços públicos (como políticas sociais) que irão receber. Por esse mecanismo, os agentes revelam suas preferências, reduzindo a assimetria de informação do implementador das políticas, o que faz com que o seu retorno sobre o bem-estar das famílias beneficiárias seja ampliado. Além da eficiência social, a descentralização leva a uma maior eficiência técnica dos gastos públicos e sociais por três diferentes mecanismos. Em primeiro lugar, como as autoridades 1 Tal fenômeno não ocorreu apenas no país, mas sim em nível internacional, com destaque para os países da América Latina. 3 políticas locais têm maior informação sobre as questões orçamentárias dos programas adotados em seus territórios, podem minimizar os seus custos com maior eficácia. Em segundo lugar, no caso de políticas condicionadas, a capacidade de monitoramento e de fiscalização dos programas das autoridades locais é muito melhor do que a da burocracia federal. Por fim, a descentralização estimula a promoção de uma maior variedade de provedores e de programas de política social, o que propicia condições para inovações técnicas de elaboração e de implementação. Afonso (2003) e Oliveira (1998) destacam que, apesar da forma pela qual foi realizada2, a descentralização fiscal no Brasil proporcionou avanços técnicos significativos nas áreas de educação, saúde e de assistência social. Pois, progressivamente, os governos subnacionais brasileiros (estados e municípios) passaram a ter um papel crescente nos gastos sociais em nível nacional, principalmente pela aplicação de recursos vinculados ou transferidos pelo governo federal e pela avaliação e fiscalização dos beneficiários desses programas. Além disso, as próprias emendas constitucionais significaram a criação de um sistema de garantias que, contemporaneamente, acabou fortalecendo a institucionalização da descentralização fiscal, pela definição cada vez mais direta das atribuições e compromissos de cada esfera de governo. Uma importante controvérsia à descentralização de gastos de assistência social é realizada por Silva (2005). Esse autor, com base no modelo de Musgrave (1980), argumenta que as famílias podem reagir a políticas de distribuição de renda por meio da migração, se houver liberdade de mobilidade de fatores de produção entre as unidades federativas de um mesmo país. Assim, espera-se que as famílias mais pobres migrem para os territórios cujos governos ofereçam maior volume de recursos assistenciais, e as famílias mais ricas migrem para os territórios onde a carga tributária é menor, ou, pelo menos, não-progressiva. Para os autores, esse efeito demográfico pode acabar comprometendo os resultados esperados das políticas de redistribuição de renda. Nas palavras do autor (Silva, 2005, pg. 124): Ações locais, num cenário de mobilidade de fatores, tendem a alterar preferências localizacionais e produzir decisões ineficientes ao conjunto do sistema econômico. A participação de governos subnacionais em ações distributivas é desejável em circunstâncias especiais, quando as restrições supramencionadas não forem verificadas, criando, com isso, a possibilidade da adoção de medidas eficientes e eficazes. III – Teoria Econômica da Família, Capital Humano e Demanda por Educação Os estudos que correlacionam a escolaridade dos indivíduos e a diminuição dos seus níveis de pobreza são, em grande parte, influenciados pela Teoria do Capital Humano (BECKER, 1993), a qual busca explicar tanto os retornos da educação sobre os índices de riqueza dos indivíduos e das famílias, como também os fundamentos da demanda por educação. Nessa teoria, o capital humano é definido como um fator de produção que é acumulado por meio de 2 Segundo o autor, a descentralização de responsabilidades fiscais teve um caráter predominantemente político, e não técnico. O objetivo primordial desse processo não foi a promoção de maior eficiência ao gasto público no Brasil, mas sim de delegar parte do poder fiscal e financeiro da União para os entes subnacionais (estados e municípios), sob a coordenação federal das atribuições subgovernamentais no que diz respeito às políticas públicas e aos gastos sociais. Essa descentralização não foi devidamente institucionalizada em seus princípios, seguindo uma dinâmica desordenada, voltada para o alívio do sufoco fiscal sobre o governo federal, por meio da vinculação dos recursos estaduais e municipais a determinados projetos definidos em emendas constitucionais, da exigência de contrapartida financeira de seus gastos (principalmente após a aprovação da Lei de Responsabilidade Fiscal), e com a transferência progressiva de funções aos entes subnacionais. 4 investimentos em atividades que podem elevar a produtividade das pessoas, como, por exemplo, a educação, o treinamento no emprego e os cuidados com a saúde, de modo a proporcionar ganhos de renda no futuro. O mesmo autor (BECKER, 1991) formulou a Teoria Econômica da Família. Segundo essa teoria, as famílias não se comportam como unidades autônomas, de preferências exógenas, mas sim como compostas por indivíduos. Assim, as preferências dos membros que compõem as famílias podem ser diferentes, o que pode levar ao surgimento de relações de cooperação ou de competição entre eles, o que, em suma, influencia diretamente o processo de tomada de decisões em nível familiar. Assim, relacionando a Teoria do Capital Humano com a Teoria Econômica da Família, Becker (1991 e 1993) formulou um modelo microeconômico no qual os pais tomam as decisões em nível familiar maximizando suas funções de utilidade individuais. Tais funções revelam preferências sobre o seu nível de consumo presente, o seu número de filhos e as características de cada filho, principalmente no que diz respeito às expectativas de sua qualidade de vida, sucesso profissional e padrão de riqueza no futuro. Assim, os pais tomam decisões em um trade-off entre o seu nível de consumo presente e o seu investimento no capital humano de seus filhos, como forma de elevar sua renda futura. Nesse trade-off, estão envolvidos os custos diretos desses investimentos nos filhos (representados pelos gastos com sua educação), assim como o custo de oportunidade de não consumir a sua renda presente. Nesse modelo, o ponto de escolha ótima em relação à alocação dos recursos dos pais será o ponto em que as taxas marginais de retorno do consumo e do investimento se igualarem3. Um outro trade-off enfrentado pelas famílias em suas decisões de investir na educação de seus filhos é apresentado por Hanushek (1992). Segundo o autor, como os pais têm recursos limitados para investir na qualidade do capital humano de seus filhos, quanto maior o número de crianças na família, menor deverá ser o montante de recursos investidos em cada uma, e menor será a qualidade de sua educação. Por isso, o número de crianças na família também é uma variável importante para a determinação da demanda por educação. Nesse sentido, programas de transferência de renda, tais como programas assistenciais, por elevar a renda presente dos pais, e dos chefes de família em geral, elevam as suas dotações de recursos, podendo levar tanto a um aumento do seu nível de consumo, o que eleva seu bem-estar presente, como permite elevação no seu investimento no capital humano dos seus filhos, traduzido empiricamente pelos aumentos nos índices de matrículas em instituições de ensino e freqüência à escola. Além disso, Schwartzman (2004) afirma que o aumento da renda presente por meio de benefícios de programas condicionados de assistência social pode elevar os índices de escolaridade pela compensação, para a família, do possível salário de cada filho caso eles trabalhassem, ou então pela instituição de uma obrigação moral da família frente aos órgãos fiscalizadores da comunidade, de se comprometer a levar seus filhos à escola como forma de não perder seus benefícios assistenciais. 3 Os pressupostos básicos do modelo, assim como sua representação formal seguem os princípios da economia neoclássica. 5 Outra variável importante para explicar a freqüência escolar é o nível de escolaridade dos pais. Segundo autores como Rocha (2003), a educação dos pais exerce uma transmissão intergeracional de níveis de rendimento, servindo como um elemento fundamental contrário à perpetuação da pobreza na família. Pais mais educados, além de estarem associados a maiores dotações de recursos, tendem a apresentar melhores informações sobre a importância da educação sobre os rendimentos individuais, de modo que dão mais valor aos seus recursos gastos na educação de seus filhos (CORSEUIL et al., 2001). Além disso, o nível de escolaridade dos pais capta outros determinantes da renda e das dotações familiares além daquelas provenientes da educação, tais como a origem da família, as suas características sócio-econômicas e sua rede de contatos e influências sociais. Contudo, conforme conta o relatório da PREAL4 de março de 2003, a deserção escolar é um problema recorrente sobre as políticas sociais (principalmente relacionadas à educação) realizadas na América Latina, o que ocorre quando crianças e adolescentes abandonam a escola antes de acumular o capital humano necessário para se tornarem competitivos nos mercados de trabalho locais, o que pode contribuir para perpetuar a sua situação de pobreza. O relatório aponta cinco possíveis motivos para o abandono à escola. Em primeiro lugar, as razões econômicas, relacionadas com a necessidade de trabalhar, por parte do aluno 5, ou simplesmente com a falta de recursos por parte de seus pais para investir em capital humano, isto é, não conseguem suprir os custos diretos da educação. Em segundo lugar, a falta de oferta de escolas e de professores, o que é mais comum nas regiões rurais e povoadas por população de baixa renda. Terceiro, a mera falta de interesse dos alunos pelo estudo, sobretudo os de famílias mais pobres, o que indica que “as escolas não estão preparadas e equipadas para lidar com estudantes que chegam sem o ‘capital cultural’ associado aos ambientes de média e alta renda.” (Schwartzman, 2004, pg. 21). Quarto, as razões familiares, que decorrem sobretudo das ocorrências de gravidez e de casamentos6 entre adolescentes. Por fim, o abandono pode ser provocado por problemas de desempenho escolar dos alunos, já que empiricamente se observa que as sucessivas reprovações podem acabar desanimando os alunos em relação ao seu futuro educativo. Além desses motivos, Schwartzman (2004) aponta que a má qualidade do ensino pode ser um fator que provoca o abandono ao ensino. Segundo o autor, os alunos podem abandonar as escolas simplesmente porque não conseguem aprender. Assim, a acumulação de capital humano nessas condições é nula, e o retorno esperado do trabalho no tempo presente, para o aluno, é maior. Dentre os estudos empíricos já realizados sobre os determinantes da freqüência escolar no Brasil, destaca-se o trabalho de Kassouf (2001). Utilizando dados da PNAD7 de 1995, a autora utilizou um modelo probit para estimar a probabilidade, por parte das crianças incluídas na amostra, de estudarem e de trabalharem. O estudo concluiu que os fatores mais correlacionados 4 Programa de Promoção de Reformas Educativas na América Latina e no Caribe, com sede em Santiago, Chile. Tal motivo predomina em relação ao abandono à escola por parte de alunos recém-adolescentes (a partir dos 14 anos). 6 Tal motivo predomina em relação ao abandono à escola por parte de alunos do sexo feminino. 7 Pesquisa Nacional de Amostra de Domicílio, realizada periodicamente pelo Instituto Brasileiro de Geografia e Estatística (IBGE). 5 6 com a freqüência escolar são: altos níveis de educação dos pais, baixo número de irmãos, baixa idade das crianças, elevados salários dos pais e baixos salários das crianças no mercado de trabalho. Ferro & Kassouf (2005) realizaram estudo semelhante. Os autores utilizaram dados da PNAD de 2001 para estimar um modelo probit de modo a avaliar o impacto do programa Bolsa Escola sobre a redução da incidência de trabalho infantil. Segundo o artigo, a probabilidade de uma criança trabalhar é menor quanto menor for a sua idade, maior for os salários de seus pais, e é maior para os meninos do que para as meninas. O programa Bolsa Escola reduziria o número de horas trabalhadas pelas crianças, mas elevaria a probabilidade de uma criança trabalhar. Segundo os autores, isso seria causado por um viés de auto-seleção da amostra, uma vez que os beneficiados pelo programa são as famílias mais pobres, que estão mais propensas ao trabalho infantil. Corseuil et al. (2001) realizaram um estudo empírico para as decisões dos jovens entre estudo e trabalho, para quatro países da América Latina (Brasil, Chile, Honduras e Peru). Foi concluído que a educação dos pais é a variável mais importante para a probabilidade dos filhos freqüentarem escolas, em todos os países da amostra. Outros fatores importantes, como o grau de urbanização do país, o tamanho das famílias e a presença de idosos no domicílios, variam de país para país, tanto em termos de magnitude, como em termos de sinal. Um trabalho mais completo, envolvendo fatores relacionados à oferta e à demanda por educação e seu impacto sobre a qualidade e a quantidade do ensino em Minas Gerais foi elaborado por Riani & Rios-Neto (2004). Para isso, os autores utilizaram a metodologia de modelos hierárquicos, em que as características individuais das crianças (como seu nível socioeconômico e o background familiar), relacionadas com a demanda por educação, foram complementadas por características dos municípios mineiros nos quais vivem (como as características das escolas e os recursos destinados à educação), relacionadas com a oferta de ensino. O estudo concluiu que ambos fatores contribuem positivamente para o percentual de crianças matriculadas nas escolas e para a seriação correta de acordo com sua idade. IV – Metodologia Nos últimos anos, é notável a crescente popularidade do uso de modelos de estimação em multinível, ou modelos hierárquicos, em estudos de análise quantitativa de dados dentro das ciências sociais. Díaz (2007) afirma que esse fenômeno integra uma necessidade maior, por parte das ciências sociais, de aprofundar tanto a sua abordagem teórica como sua metodologia, visando identificar, isolar e explicar as influências do ambiente e do grupo sobre o comportamento dos indivíduos neles inseridos, em complemento a suas próprias características. Na análise de dados estatísticos amostrais, pode-se observar uma tendência de correlação entre indivíduos pertencentes a um mesmo grupo, ou habitando um mesmo ambiente, no que diz respeito as suas características e o seu comportamento. Essa correlação provoca um viés negativo nas estimativas dos erros-padrão dos modelos estimados diretamente pelo método dos Mínimos Quadrados Ordinários (MQO). 7 A metodologia de modelos hierárquicos consiste, basicamente, no desenvolvimento de modelos de regressão que assumem que a variável dependente estudada é afetada por variáveis independentes de níveis distintos, isto é, tanto por aquelas específicas ao indivíduo estudado, como por aquelas específicas ao grupo ao ambiente ao qual o indivíduo se insere. Além disso, em cada nível pode haver um componente residual, não explicado pelas variáveis explicativas adotadas no modelo. Nessas condições, o uso de modelos hierárquicos pode oferecer três vantagens ao estudo (QUEIRÓS & CÉSAR, 2000). Em primeiro lugar, a metodologia permite obter melhores estimativas para os parâmetros abordados no modelo, pelo controle das características do grupo mais numeroso sobre as inferências realizadas para a população total observada. Em segundo lugar, permite avaliar os efeitos entre as variáveis de diferentes níveis, disponibilizando a realização testes de hipóteses sobre as relações entre o indivíduo e o seu respectivo grupo. Por fim, permite separar os componentes das variâncias das estimativas de acordo com o nível de cada variável independente, o que faz com que as estimativas de erro padrão sejam mais conservadoras quando a estimação é realizada por modelos hierárquicos do que quando é realizada diretamente por MQO em um modelo linear. Além disso, a separação das variáveis explicativas em diferentes níveis faz com que a metodologia de modelos hierárquicos possibilite uma melhor compreensão dos problemas no processo modelado (FERRÃO et al., 2002). Em termos mais formais8, um modelo hierárquico baseia-se, no primeiro nível (individual), no estudo da relação entre uma variável dependente Yij (como, por exemplo, a freqüência à escola), para um indivíduo i pertencente a um grupo j (por exemplo, o estado brasileiro em que habita), e uma variável explicativa Xij para cada indivíduo (como a participação, ou não, em programas de assistência social): Yij = β0j + β1jXij + rij (1) Porém, como os grupos podem exercer efeitos que influenciam o comportamento dos indivíduos neles integrados, pode-se controlar esses efeitos por uma variável explicativa Wj (como, por exemplo, o número de escolas existentes em cada estado da federação). Nesse caso, as equações do segundo nível (grupos) são: β0j + γ00 + γ01Wj + u0j β1j = γ10 (2) (3) Observa-se que, no caso, como o número de escolas existentes no estado é independente da participação, ou não, por parte do indivíduo em programas assistenciais, apenas o termo de intercepto da equação do primeiro nível pode ser afetada pela variável explicativa Wj. Substituindo (2) e (3) na equação (1): Yij = γ00 + γ01Wj + u0j + γ10Xij + rij Yij = γ00 + γ01Wj + γ10Xij + u0j + rij 8 (4) A presente formalização está baseada no artigo de Díaz (2007) e no livro de Raudenbush & Bryk (2002). 8 Nesse modelo, supõe-se que os termos u0j e rij são erros aleatórios, independentes, de média zero e seguem uma distribuição normal. Sendo σ2 a variância de rij (a variância entre indivíduos), e τ02 a variância de u0j (a variância entre grupos), a correlação intra-grupos será: ρ(Yij, Yi’j) = τ02 / (τ02 + σ2) (5) Intuitivamente, a correlação intra-grupos significa a correlação entre os valores da variável Yij (a freqüência à escola) referentes às observações de dois indivíduos escolhidos aleatoriamente dentro de um certo grupo. A estimação do modelo, tanto dos parâmetros fixos γnm como das variâncias e covariâncias, pode ser realizada por três alternativas distintas, de acordo com Raudenbush & Bryk (2002). Em primeiro lugar, pelo método da máxima verossimilhança, no qual escolhe-se os estimadores para γ e τ de modo que a probabilidade de se observar esses valores nos dados de Y é máxima. Esse método apresenta estimadores consistentes, eficientes e de distribuição convergente para uma normal. Em segundo lugar, pelo método da máxima verossimilhança restrita, o qual ajusta os estimadores de máxima verossimilhança de τ para os efeitos fixos nas amostras. Por fim, pelo método bayesiano, o qual controla possíveis erros de estimação de variâncias e covariâncias pela realização de inferências sobre γ a partir apenas dos dados, isto é, não condicionais em τ. Depois de escolhido o método de estimação, adota-se como o método de computação desse referido estimador os Mínimos Quadrados Generalizados Iterativos (MQGI), que é muito bem explicado por Díaz, (2007, pg. 101): Essencialmente, o método inicia-se pela estimativa dos parâmetros fixos, γhk, pelo Método de Mínimos Quadrados Ordinários. A partir desses resultados é possível obter estimativas dos resíduos que permitem que se estime a matriz de variâncias e covariâncias do modelo(σ2, τh2 e τhk). Isso possibilita uma re-estimação dos parâmetros fixos, pela aplicação do Método de Mínimos Quadrados Generalizados, que, por sua vez, serão utilizados para obter uma reestimativa da matriz de variâncias e covariâncias. Estas etapas irão se sucedendo até que se verifique uma convergência dos resultados obtidos. Justamente por esta razão, o método é denominado iterativo. V – Dados e Variáveis A principal fonte de dados utilizada para a análise empírica do presente trabalho é a Pesquisa sobre Orçamentos Familiares (POF) 2002-2003. A POF é realizada pelo IBGE9, e inclui dados de domicílios particulares permanentes10 abrangendo todo o território nacional, inclusive regiões rurais e urbanas de todos os estados da Federação. A POF consiste em um levantamento de informações sobre os gastos e os rendimentos das famílias brasileiras, entendidas como unidades de consumo11, coletadas por meio de entrevistas pessoais com os membros dessas 9 Instituto Brasileiro de Geografia e Estatística Isto é, ficam excluídas da pesquisa observações referentes a militares, pacientes internados em instituições de saúde e hóspedes em domicílios coletivos (FGV, 2004). 11 “De acordo com a POF, o conceito de unidade de consumo compreende um único morador ou conjunto de moradores que compartilham da mesma fonte de alimentação ou compartilham as despesas com moradia. Para efeito de divulgação de resultados, o termo família tem sido utilizado para representar o conceito de Unidade de Consumo.” (RESENDE & OLIVEIRA, 2006, pg. 9). 10 9 unidades de consumo, como os chefes de família e as donas de casa, e transcritas para formulários formais de pesquisa. O objetivo original da POF é definir as cestas de consumo padrão das famílias brasileiras de modo a permitir que se construa um sistema de ponderações para a construção de índices de preço ao consumidor (FGV, 2004). Contudo, devido à riqueza de suas observações e dimensões, essa fonte vem sido cada vez mais utilizada como banco de microdados para os mais variados estudos sociais. A POF de 2002-2003 apresenta uma amostra de 48.171 unidades de consumo. O presente trabalho utiliza dados de três bancos integrantes do POF: informações sobre “moradores12”, “rendimentos e deduções13” (do trabalho) e “outros rendimentos14”. A amostra final corresponde às observações de 25.392 crianças de sete a catorze anos, agrupadas por famílias e por estados da Federação. A análise empírica foi realizada com o software Intercooled Stata 9.1. Graças ao comando merge desse software, foi possível separar as observações de cada unidade de consumo, criando bancos de dados para os chefes de família, seus cônjuges e os filhos, de modo a se obter as variáveis explicativas de nível individual para os modelos estimados, para depois integrar todas as variáveis relevantes escolhidas em um único banco. Todas as variáveis explicativas de nível um (isto é, nível individual das crianças) dos modelos foram construídas a partir das variáveis presentes no POF 2002-2003, sendo que algumas delas foram diretamente incluídas para a estimação, e outras foram obtidas por meio de proxies. No estudo, a proxy considerada mais crítica foi o uso de uma dummy que observa se o indivíduo recebe ou não remuneração pelo seu fator trabalho como forma de mensurar a incidência do trabalho infantil. Isso se justifica por dois pontos. Em primeiro lugar, por um fator técnico, pelo fato de que a POF não pergunta diretamente às unidades de consumo se os seus membros trabalham ou não, mas sim se os mesmos representam fontes de orçamento familiar. Em segundo lugar, por um fator mais intuitivo, de que o trabalho infanto-juvenil não remunerado no Brasil tem uma característica fundamentalmente intra-familiar, como é o caso dos jovens habitantes das áreas rurais da região Sul, que estudam em um turno do dia e ajudam seus pais no trabalho em outro turno, o que não prejudica a sua freqüência à escola, ao contrário dos jovens que cedo ingressam no mercado de trabalho (Schwartzman, 2004). Os dados das variáveis de nível dois, referentes às Unidades da Federação brasileira, por sua vez, têm fontes distintas. Os valores dos gastos estaduais com assistência social em 2002 foram coletados em uma planilha com os exercícios orçamentários dos estados, disponíveis pela COREM15, instituição vinculada à Secretaria do Tesouro Nacional, Ministério da Fazenda. Essa variável tem o objetivo de mensurar o efeito da descentralização do gasto assistencial no Brasil sobre a variável endógena dos modelos. O número de instituições de ensino básico em cada estado em 2002, incluindo ensino fundamental e médio, para escolas públicas, privadas e estatais, foi obtido na Sinopse 2002 do INEP, vinculado ao Ministério da Educação. 12 Banco POF1, registro 2. Banco POF5, registro 12. 14 Banco POF5, registro 13. 15 Coordenação Geral das Relações e Análise Financeira de Estados e Municípios. 13 10 Quadro 1. Variável Dependente Variável freq1 Descrição Freqüência à escola Observações Dummy com valor igual a um se a criança freqüenta alguma escola, pública ou privada, e zero caso contrário. Quadro 2. Variáveis Independentes de Nível Um Variável lrenda Descrição Logaritmo da renda per capita da família. idade_fi Idade das crianças. sexo1 Sexo das crianças. cor2 Raça, ou cor, das crianças. progas Participação assistenciais. nivel_instr_ch Nível de instrução do chefe da família. urbano Área em que a criança vive. numpess Número de pessoas na família. trabalha Se a criança integra o mercado de trabalho ou não. em programas Observações Obtida pelo logaritmo da renda real deflacionada da família, presente no POF, dividida pelo número de pessoas em cada família. Idade dos filhos de cada família, de sete a catorze anos. Dummy com valor igual a um para os homens, e zero para as mulheres. Dummy com valor igual a um para as crianças negras ou indígenas, e zero caso contrário. Dummy com valor igual a um se a família da criança participa de pelo menos um programa assistencial dos selecionados para a amostra, e zero caso contrário. Indicador obtido diretamente no POF, serve como proxy para a educação do pai da criança. Dummy com valor igual a um se a criança vive em área urbana, e zero se vive em área rural. Valores obtidos diretamente na POF, descontados os pensionistas e os empregados domésticos. Dummy com valor igual a um se a criança recebe algum rendimento pelo seu fator trabalho, e zero caso contrário. Quadro 3. Variáveis Independentes de Nível Dois Variável escolas_eb gastos_as Descrição Número de escolas presentes em cada estado brasileiro no ano de 2002. Gastos estaduais com assistência social em 2002. Observações Dados coletados no Ministério da Educação. Dados coletados na Ministério da Fazenda. INEP, STN, 11 Quadro 4. Programas Assistenciais Selecionados para a Análise Programas: Renda Mínima PET – Programa de Erradicação do Trabalho Infantil Cesta Básica Auxílio-Leite Bolsa Renda Bolsa Escola Agente Jovem (programa para jovens desempregados) Auxílio-Gás Auxílio a Portadores de Deficiência Física Auxílio à Energia Elétrica Salário Família Auxílio-Atividade Auxílio-Fardamento Auxílio-Estiagem Auxílio-Comunicação Auxílio-Desemprego Auxílio-Maternidade Auxílio-Saúde Auxílio-Educação Auxílio-Creche Salário-Educação Auxílio-Escola Auxílio-Mãe Guardiã Auxílio-Funeral Auxílio-Velhice Tabela 1: Descrição das Variáveis de Níveis 1 e 2 Variável freq1 lrenda idade_fi sexo1 cor1 progas nivel_inst_ch urbano numpess trabalha escolas_eb gastos_as Observações Média DP Mínimo Máximo 25392 0.9637287 0.186968 0 1 25392 6.885065 1.33176 0.300105 13.34391 25392 10.54612 2.302256 7 14 25392 0.5120117 0.4998655 0 1 25392 0.3913831 0.4880694 0 1 25392 0.3701953 0.4828664 0 1 25392 5.274457 3.132247 0 16 25392 0.7345621 0.4415748 0 1 25392 5.310885 1.983269 2 20 25392 0.0659263 0.2481581 0 1 25392 8994.971 6851.956 716 26339 25392 72900000 77800000 3916768 378000000 Fonte: elaboração própria Como os programas assistenciais no Brasil têm uma natureza cada vez mais focalizada sobre os grupos mais necessitados, a proporção de participantes varia de acordo com variáveis referentes às dotações e à residência da família. Por exemplo, domicílios localizados em regiões rurais estão mais relacionados com baixas dotações de renda familiar, com maior tamanho médio das famílias, com menores níveis de capital humano e com maior propensão ao trabalho infantil. 12 Por isso, a participação dos domicílios rurais em programas assistenciais é proporcionalmente maior nas regiões rurais do que nas urbanas. Além disso, a participação nos programas é decrescente em relação aos anos de estudo do chefe do domicílio, utilizado como proxy para a dotação de capital humano da família. Tabela 2: Proporção de Participantes de Programas Assistenciais em Relação ao Capital Humano Familiar, à Localização do Domicílio e à Freqüência à Escola Anos de Estudo do Chefe do Domicílio 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Localização do Domicílio rural urbano Freqüência à Escola não freqüenta freqüenta Total Participa Total % de participantes 1,873 3,644 51.40% 12 23 52.17% 31 65 47.69% 123 213 57.75% 358 665 53.83% 5,665 14,730 38.46% 79 252 31.35% 85 215 39.53% 872 3,770 23.13% 30 122 24.59% 38 143 26.57% 6 49 12.24% 9 21 42.86% 85 724 11.74% 81 498 16.27% 41 181 22.65% 12 77 15.58% 2,999 6,401 6,740 18,652 44.50% 34.32% 260 9,140 9,400 921 24,471 25,392 28.23% 37.35% 37.02% Fonte: elaboração própria VI – Modelos e Resultados 6.1. Modelo 1: Linear Probit O primeiro modelo estimado no trabalho é um modelo linear simples, não-hierárquico, apenas com o objetivo de verificar a significância das variáveis independentes escolhidas para o estudo. O modelo pode ser escrito pela seguinte equação: Yi = β0 + β1lrenda + β2idade_fi + β3sexo1 + β4cor2 + β5progras + β6nivel_instr_ch + β7urbano + β8numpess + β9trabalha + β10escolas_eb + β11gastos_as + εi (6) 13 Como a variável dependente, a freqüência à escola, é uma variável dicotômica (dummy), foi utilizado para a sua estimação o modelo probit, o qual baseia-se em uma função de distribuição normal acumulada16. Seus resultados podem ser conferidos na tabela 3. 6.2. Modelo 2: ANOVA com Efeitos Aleatórios O segundo modelo abordado pelo trabalho, o modelo ANOVA com efeitos aleatórios17, é o modelo hierárquico mais simples existente, uma vez que não apresenta variáveis independentes. O objetivo desse modelo é simplesmente permitir a divisão da variabilidade nos dados entre os termos de resíduo individual e de grupo. A variável dependente é explicada por um termo de intercepto β mais um erro aleatório r normalmente distribuído com média zero e variância constante σ2. Já o intercepto de cada observação individual é afetada por um efeito fixo de grupo, igualmente definido por um termo de intercepto γ e por um erro aleatório u: Yij = β0j + rij β0j = γ00 + u0j (7) (8) O modelo completo é definido substituindo-se (8) em (7): Yij = γ00 + u0j + rij (9) Sendo σ2 a variância entre indivíduos e τ00 a variância entre estados, o coeficiente de correlação entre observações dentro de um mesmo estado é dado por: ρ = τ00 / (τ00 + σ2) (10) A estimação revela que a variância total do modelo (Var(u0j + rij)) é igual a 0.0349896, sendo que aproximadamente 99,38% deve-se a diferenças entre os indivíduos (as crianças), e 0,62% deve-se a diferenças entre os grupos (os estados). Ou seja, o modelo revelou que o peso dos fatores estaduais influenciando os indicadores de freqüência à escola, quando não controlados os efeitos individuais dos alunos, é muito pequeno. Isso pode fazer com que a estimação por modelos hierárquicos seja menos apropriada do que por modelos lineares (como o probit do ítem anterior) para se estudar os efeitos aqui apresentados. 6.3. Modelo 3: Incluindo as Características das Crianças (modelo ANCOVA) O terceiro modelo analisado é um modelo ANCOVA, em que as características individuais das crianças estão incluídas, mas apenas o termo de intercepto varia entre os estados. Ou seja, os modelos de níveis 1 e 2 são: Yi = β0j + β1lrenda + β2idade_fi + β3sexo1 + β4cor2 + β5progras + β6nivel_instr_ch + β7urbano + β8numpess + β9trabalha + rij (11) 16 Maiores detalhes sobre as características do modelo probit e da função de distribuição normal acumulada podem ser encontrados em Gujarati (2004). 17 Maiores informações sobre esse modelo são obridas em Raudenbush & Bryk (2002) e Queirós & César (2000). 14 β0j = γ00 + u0j βnj = γn0, n >0 (8) (12) Substituindo as equações em (11), tem-se: Yi = γ00 + γ10lrenda + γ20idade_fi + γ30sexo1 + γ40cor2 + γ50progras + γ60nivel_instr_ch + γ70urbano + γ80numpess + γ90trabalha + u0j + rij (13) A inclusão de variáveis de controle para as características individuais das crianças reduziu a variância total do modelo em cerca de 1,87%, que se distribuiu em uma redução de 33,26% na variância entre os estados, e de 1,67% entre os os alunos. Contudo, a distribuição da variância entre os dois níveis não se alterou significativamente: 99,58% da variância se dá entre os indivíduos, e apenas 0,42% se dá entre os grupos (os estados brasileiros). 6.4. Modelo 4: Incluindo as Características dos Estados (modelo ANCOVA) O próximo modelo inclui as variáveis explicativas de nível dois, referentes às características dos estados brasileiros, e como que elas podem afetar a freqüência à escola. Em um modelo de interceptos aleatórios, a equação de nível um é dada por (11), e os termos de inclinação são dados por (12). Já o termo de intercepto é dado por: β0j = γ00 + γ01escolas_eb + γ02gastos_as + u0j (14) Substituindo as equações em (11) tem-se: Yi = γ00 + γ01escolas_eb + γ02gastos_as + γ10lrenda + γ20idade_fi + γ30sexo1 + γ40cor2 + γ50progras + γ60nivel_instr_ch + γ70urbano + γ80numpess + γ90trabalha + u0j + rij (15) A inclusão das variáveis explicativas de nível dois reduziu a variância do modelo em cerca de 0,76%, sendo que a variância entre os estados reduziu-se em 18,12%, e a variância entre os indivíduos aumentou 0,76%. Contudo, a participação da variância entre grupos caiu para 0,34% da variância total. Fora isso, a inclusão das duas variáveis independentes de nível dois pouco afetou os coeficientes e as significâncias das demais variáveis independentes do modelo. Por outro lado, considerando-se que o volume de gastos estaduais com assistência social podem influenciar outras variáveis explicativas de nível um, tais como a renda per capita das famílias, o trabalho infantil, ou então a participação das famílias em programas sociais, pode-se rodar o mesmo modelo com a variável gastos_as como um termo de inclinação aleatória. Nesse caso, as equações de nível dois têm a forma (14) para o intercepto, e, para as inclinações: βnj = γn0 + γn1gastos_as + unj, n >0 (16) Supondo-se que X é um vetor de variáveis explicativas de nível um, então: 15 Yij = β0j + β1jXij + rij (17) Substituindo (14) e (16) em (17) obtem-se: Yi = γ00 + γ01escolas_eb + γ02gastos_as + γn0Xij + γn0Xijgastos_as + u0j + unjXij + rij (18) 6.5. Resultados das Estimações A tabela 3 sintetiza os resultados das estimações dos modelos 1 a 4, sendo que esse último foi estimado tanto pelo método dos interceptos aleatórios, como pelo método das inclinações aleatórias. Tabela 3: Resultados das Estimativas dos Modelos 1 a 4 Variável Constante lrenda idade_fi sexo1 cor1 progas nivel_inst_ch urbano numpess trabalha escolas_eb gastos_as var(gastos_as) var(_cons) var(Residual) pseudo R2 n obs. Modelo 1 1.183*** (0.130) 0.076*** (0.014) -0.018*** (0.007) -0.081*** (0.031) -0.015*** (0.033) 0.338*** (0.034) 0.058*** (0.006) 0.120*** (0.034) -0.032*** (0.008) -0.338*** (0.053) 9.68E-06*** (2.53E-06) 9.87E-11 (2.34E-10) 0.0592 25392 Modelo 2 0.963*** (0.003) Modelo 3 0.924*** (0.010) 0.005*** (0.001) -0.001*** (0.001) -0.006*** (0.002) -0.001 (0.003) 0.025*** (0.003) 0.004*** (4.43E-04) 0.010*** (0.003) -0.003*** (0.001) -0.039*** (0.005) Modelo 4 (Int. Al.) 0.918*** (0.011) 0.005*** (0.001) -0.001*** (0.001) -0.006*** (0.002) -0.001 (0.003) 0.025*** (0.003) 0.004*** (4.43E-04) 0.010*** (0.003) -0.003*** (0.001) -0.039*** (0.005) 7.12E-07* (4.00E-07) 5.81E-12 (3.38E-11) Modelo 4 (Inc. Al.) 0.917*** (0.011) 0.005*** (0.001) -0.001*** (0.001) -0.006*** (0.002) -0.001 (0.003) 0.025*** (0.003) 0.004*** (4.43E-04) 0.010*** (0.003) -0.003*** (0.001) -0.039*** (0.005) 9.02E-07** (3.96E-07) 2.16E-04 0.035 1.44E-04 0.034 1.18E-04 0.034 2.77E-21 1.09E-04 0.034 25392 25392 25392 25392 Fonte: Elaboração própria *** Variável significativa a 1%; ** Variável Significativa a 5%; * Variável Significatica a 10% 16 Devido a presença de observações omitidas nos dados, o estimador de mínimos quadrados generalizados iterativos não converge18. Como se pode ver, isso faz com que a inclusão dos gastos estaduais com assistência social como uma variável que influencia os coeficientes de inclinação das variáveis de nível um não afete significativamente o modelo, e seu impacto sobre a variância residual (isto é, de nível individual) da estimação é praticamente nula. 6.6. Modelo 5: Centralizando a Renda das Famílias pela Média dos Estados Centralizar a variável renda pelas suas médias também pode trazer informações relevantes para a abordagem de modelos hierárquicos. Assim, quando se centraliza a variável pela sua média geral, significa que se está integrando os efeitos individuais dos contextuais em relação aos dados observados. Por outro lado, quando se centraliza pela média dos grupos, isto é, pela renda per capita média de cada estado, se dá uma maior ênfase no estudo sobre os efeitos individuais, das variáveis de nível um. Sendo mg_lrenda a renda per capita média geral da amostra, e med_lrenda a renda per capita média por estados, as equações de ambos modelos centralizados19 são: Yi = γ00 + γ01escolas_eb + γ02gastos_as + γ10(lrenda – mg_lrenda) + γ20idade_fi + γ30sexo1 + γ40cor2 + γ50progras + γ60nivel_instr_ch + γ70urbano + γ80numpess + γ90trabalha + u0j + rij (19) Yi = γ00 + γ01escolas_eb + γ02gastos_as + γ10(lrenda – med_lrenda) + γ20idade_fi + γ30sexo1 + γ40cor2 + γ50progras + γ60nivel_instr_ch + γ70urbano + γ80numpess + γ90trabalha + u0j + rij (20) Os resultados da estimação podem ser conferidos nas tabelas abaixo: 18 Mesmo eliminando-se (pelo comando drop do software Stata) as observações com omissões, não ocorre a convergência do modelo. 19 Considerando a mesma estrutura do modelo 4 com interceptos aleatórios. 17 Tabela 4: Resultados do Modelo 4 Centralizado pela Média Geral e pela Média de Grupo Variável Constante lrenda_geral Média Geral 0.955*** (0.008) 0.005*** (0.001) med_lrenda lrenda_grupo idade_fi sexo1 cor1 progas nivel_inst_ch urbano numpess trabalha escolas_eb gastos_as var(_cons) var(Residual) n obs. -0.001*** (0.001) -0.006*** (0.002) -0.001 (0.003) 0.025*** (0.003) 0.004*** (0.000) 0.010*** (0.003) -0.003*** (0.001) -0.039*** (0.005) 7.12E-07** (4.00E-07) 5.81E-12 (0.955) 0.000 0.034 25392 Média de Grupo 0.922*** (0.042) 0.005 (0.006) 0.005*** (0.001) -0.001*** (0.001) -0.006*** (0.002) -0.001 (0.003) 0.025*** (0.003) 0.004*** (0.000) 0.010*** (0.003) -0.003*** (0.001) -0.039*** (0.005) 7.03E-07* (4.16E-07) 7.10E-12 (3.71E-11) 0.000 0.034 25392 Fonte: Elaboração própria *** Variável significativa a 1%; ** Variável Significativa a 5%; * Variável Significatica a 10% Como pode-se observar, a centralização pela média da renda, em ambos os casos, não afetou consideravelmente os coeficientes e as significâncias do modelo 4 com interceptos aleatórios. O que mudou foram os coeficientes e o nível de significância da constante. Centralizando pela média geral, em que os efeitos individuais e coletivos estão integrados, a constante chega a ter um coeficiente de quase 0,96 (sendo que a variável dependente é binária), com um nível de significância altíssimo. Centralizando pela média de grupo, que dá uma maior ênfase nos efeitos individuais, a significância da constante cai bastante, porém, ainda é muito superior em relação às significâncias das variáveis independentes. 6.6. Comentários sobre os Resultados das Estimações De acordo com os resultados obtidos, o comportamento da maior parte das variáveis explicativas está de acordo com o esperado pela bibliografia estudada, em todos os modelos. A freqüência à escola é mais comum para crianças de maior renda, de menor idade, de cor branca 18 ou oriental (significante apenas no modelo probit), que recebem benefícios de programas de assistência social, de residência nas regiões urbanas, com poucas pessoas na família, que não trabalham remuneradamente, e com uma maior oferta de instituições de ensino em seu estado. Por outro lado, a freqüência tende a ser menor entre crianças de maior idade (13 ou 14 anos), entre os homens, entre as crianças não-brancas e não-orientais, entre os filhos de famílias muito numerosas, e, sobretudo, entre crianças que exercem trabalho remunerado. A relação entre a renda familiar e a freqüência à escola por parte dos filhos é explicada pela teoria do Capital Humano de Becker (1991 & 1993), conforme já referido. Ou seja, quanto maior é a renda da família, maior é o montante de recursos que os pais podem investir na qualidade do capital humano (no caso, pelos gastos com educação) de seus filhos. E ainda, aumentos no nível de renda, mantendo constantes o custo de vida, do consumo presente, e da educação dos filhos, permitem que a família possa escolher cestas de consumo20 de utilidade cada vez mais elevada21, o que contribui para a acumulação de capital humano. O efeito positivo da participação em programas sociais por parte das famílias para a freqüência de seus filhos à escola, o ponto central do presente trabalho, também pode ser explicado pela teoria de Becker. Os programas de assistência social elevam diretamente a riqueza das famílias, o que permite que as mesmas possam escolher alocar seus recursos em níveis mais altos de consumo e de acumulação de capital humano. Tal observação empírica contrasta com a noção presente no senso comum da população, segundo a qual os gastos assistenciais fazem com que as famílias beneficiárias simplesmente aumentem seu nível consumo sem se preocupar com a poupança e a educação dos filhos, ou mesmo que os benefícios desincentivam o trabalho dos pais, de modo que a situação dos filhos (de trabalhar para obter renda presente, ao invés de freqüentar a escola para investir em renda futura), não se altere. Crianças residindo em áreas urbanas apresentam níveis de freqüência à escola superiores as daquelas residentes em áreas rurais devido à melhor oferta de instituições de ensino nesses lugares. O relatório da PREAL (2003) aponta como fatores que determinam os problemas de abandono à escola relacionados à má oferta de estabelecimentos não apenas a simples inexistência de instituições de ensino, mas também a dificuldade de acesso, por parte dos alunos, e a ausência de professores. Todos esses problemas são mais comuns nas áreas rurais do que urbanas. Além disso, há uma considerável correlação entre a residência em regiões rurais por parte da família com a sua renda (negativamente), com o nível de instrução dos pais (ídem) e com o número de pessoas que a integra (positivamente). Crianças de maior idade (na amostra, os jovens de 13 e 14 anos) tendem a abandonar a escola, principalmente após a conclusão do ensino fundamental, para ingressar no mercado de trabalho. Além disso, existe um fator cumulativo de abandono aos estudos, uma vez que poucas crianças que abandonaram a escola voltam a estudar no futuro. A relação inversa entre a idade da criança e a freqüência à escola está representada nos gráficos abaixo, que representam simulações 20 “Cestas de consumo” na teoria econômica, significam pontos de escolha de alocação de recursos por parte dos agentes econômicos. Na teoria de Becker, os agentes são as famílias, que alocam seus recursos, isto é, sua renda, em combinações de dois bens: consumo presente e capital humano dos filhos. 21 Esse efeito, de variação na demanda devido a variação na renda do consumidor mantendo todos os preços constantes, é chamado pela teoria microeconômica como efeito-renda. 19 baseadas na probabilidade da criança freqüentar a escola, dada sua idade, e variáveis como o seu sexo, a educação de seus pais, a região de residência e se ela trabalha. Essas simulações foram realizadas a partir dos parâmetros do modelo 1 (probit): Gráficos 1 e 2: Impacto da Localização do Domicílio, do Trabalho Infantil e da Participação em Programas Assistenciais sobre a Probabilidade de Freqüentar à Escola Prob. de freqüentar a escola Prob. de freqüentar a escola 2.3 2.1 1.9 1.7 1.5 1.3 1.1 0.9 0.7 0.5 7 8 9 10 11 12 13 2.3 2.1 1.9 1.7 1.5 1.3 1.1 0.9 0.7 0.5 7 14 8 9 10 11 12 13 14 Idade da criança Idade da criança Rural e não participa Rural e participa Não trabalha e não participa Não trabalha e participa Urbano e não participa Urbano e participa Trabalha e não participa Trabalha e participa Fonte: elaboração própria Gráficos 3 e 4: Impacto do Sexo da Criança, da Educação do Chefe do Domicílio e da Participação em Programas Assistenciais sobre a Probabilidade de Freqüentar à Escola 3 Prob. de freqüentar à escola Prob. de freqüentar à escola 2.3 2.1 2.5 1.9 1.7 1.5 2 1.5 1.3 1.1 0.9 1 0.5 0.7 7 0.5 7 8 9 10 11 Idade da criança 12 13 14 8 9 10 11 Idade da criança 12 13 14 Até 4 anos e não participa Até 4 anos e participa Mulher e não participa Mulher e participa A partir de 11 anos e participa Homem e não participa Homem e participa A partir de 11 anos e não participa Fonte: elaboração própria Os alunos do sexo masculino abandonam os estudos com maior freqüência do que as mulheres para ingressar cedo no mercado de trabalho. E, além disso, como a amostra só inclui jovens de até 14 anos, os fatores gravidez e casamento, que afetam negativamente, sobretudo os estudos das meninas, são menos comuns. Em relação aos aspectos relacionados ao do número de pessoas na família, observa-se que o impacto negativo desse fator sobre a freqüência à escola é motivado sobretudo pela correlação negativa dessa variável com a renda da família. Ou seja, as famílias mais pobres, por motivos diversos, como o menor acesso a métodos anticonceptivos, ou mesmo a necessidade de ampliar a 20 oferta de mão-de-obra familiar, tendem a ter famílias mais numerosas. Esse fato fica claro quando observa-se a matriz de covariâncias entre as variáveis explicativas do modelo: Tabela 9: Correlações entre as Variáveis Independentes lrenda idade_fi sexo1 cor1 progas nivel_instr_ch urbano numpess trabalha escolas_eb gastos_as lrenda 100.00% idade_fi 32.00% 100.00% sexo1 0.18% 0.16% 100.00% cor1 25.66% -1.31% -1.75% 100.00% progas -25.52% 2.48% 0.49% -11.03% 100.00% nivel_instr_ch 51.31% -2.63% -0.80% 20.81% -19.44% 100.00% urbano 25.39% 1.10% -0.18% 5.90% -9.31% 24.91% 100.00% numpess -37.14% 3.91% 0.99% -17.64% 16.11% -27.91% -20.24% 100.00% trabalha -7.62% 24.71% 5.30% -2.80% 12.93% -9.43% -12.53% 7.41% 100.00% escolas_eb -4.85% 1.79% -0.39% 1.44% 11.54% -4.58% -18.72% 4.26% 6.77% 100.00% gastos_as 11.01% -0.96% -1.27% 10.99% 0.40% 5.65% -3.69% -8.61% -2.54% 36.08% 100.00% Fonte: elaboração própria Além disso, a correlação com a renda também contribui com a significância do nível de instrução do chefe da família para explicar a freqüência à escola por parte dos filhos (correlação de mais de 50%). Tal correlação reforça a hipótese defendida pelo relatório da PREAL (2003), de que a educação dos pais serve como uma proxy para mensurar o interesse dos seus filhos pelo estudo. A tabela também destaca a boa focalização dos programas assistenciais escolhidos para o estudo, conforme relatado por Lavinas (2004). A correlação negativa entre a participação em programas de assistência social e o nível de renda das famílias ultrapassa os 25%. Sobre a baixa significância da cor das crianças em todos os modelos estimados, pode-se relacionar esse resultado ao fato de que, no Brasil, a exclusão social e a discriminação tenham uma natureza mais de nível social e educacional do que meramente racial. Desse modo, os indicadores socioeconômicos de cada criança podem ser controlados, nos modelos de estimação de freqüência à escola, principalmente pelo nível de renda per capita de sua família e pelo grau de instrução de seus pais, sendo a questão racial, na qual as famílias brancas e orientais apresentem níveis de freqüência mais elevados, uma mera coincidência da correlação entre a cor do aluno a renda de sua família (25,66% para famílias brancas e orientais) e o nível de instrução de seus pais (20,81% para as mesmas famílias). Outro possível fator que poderia explicar a baixa significância da cor das crianças é o efeito da freqüência à escola por parte dos alunos mestiços, os quais, mesmo sempre incluídos na mesma posição dos negros na composição dessa variável dummy, apresentam indicadores de freqüência superiores a esse grupo. Mesmo sendo considerada uma proxy mais crítica, o uso de uma dummy que mensura o fato de a criança ser uma unidade de fonte de rendimentos para a família teve uma significância muito favorável para as estimações. Conforme sugerido por Schwartzman (2004), o uso dessa dummy controlou o trabalho infantil não-remunerado, que por ter característica informal e intrafamiliar, sobretudo de ajuda aos pais na realização de tarefas domésticas ou agropecuárias na sua própria propriedade, não prejudica os seus estudos. 21 Por fim, destaca-se a baixa significância das variáveis de nível dois para a estimação dos modelos. O número de escolas por estado não afetou os indicadores de freqüência, por parte das crianças provavelmente pelo fato da quase universalização do ensino básico no país. Isto é, apesar de todas as dificuldades no que diz respeito ao acesso, à distribuição localizacional, à qualidade e à infra-estrutura das escolas públicas brasileiras, o acesso às vagas dentro cada estado como um todo já é praticamente um desafio superado. A universalização do acesso ao ensino básico no Brasil também explica o alto nível de significância, e do valor dos coeficientes, para o termo de intercepto de cada modelo estudado no presente estudo, como mostra o gráfico a seguir: 0 .2 .4 .6 .8 1 Gráfico 1: Diagrama de Dispersão dos Resíduos -.02 -.01 0 BLUP r.e. for uf: _cons Fitted values .01 .02 freq1 Fonte: elaboração própria a partir do modelo 4 com interceptos aleatórios Nota-se, como sendo a variável endógena uma dummy, que os resíduos concentram-se nas regiões do gráfico associadas com o valor zero e um do eixo das ordenadas. Como pode-se ver, a reta ajustada dos parâmetros do modelo é bastante elástica, e corta o eixo das ordenadas em um ponto acima do 0,9. Isso significa que, independente das variáveis explicativas escolhidas para os modelos, o nível de freqüência à escola no Brasil é muito elevado. A baixa significância dos gastos assistenciais de nível estadual nos modelos estimados pode ser facilmente relacionada à predominante federalização dos programas sociais, de transferência de renda no país. Ou seja, pelo menos por hipótese, o governo brasileiro vem seguindo a teoria de Musgrave (Silva, 2005) para a condução de políticas assistenciais em um contexto de cada vez maior descentralização de competências fiscais na Federação. Por fim, observa-se que como o componente da variância relacionado aos efeitos de nível dois, referentes às características estaduais, é muito baixo, cerca de 0,5% da variância total mesmo no modelo ANOVA sem nenhum controle por variáveis independentes, a estimação por modelos hierárquicas não se faz necessária, sendo o modelo 1, o modelo probit linear, suficiente para se tirar as conclusões empíricas referentes aos problemas abordados pelo trabalho. 22 VII – Considerações Finais A principal conclusão d o presente estudo é o impacto positivo que a participação em programas assistenciais por parte das famílias apresenta sobre a freqüência de seus filhos à escola. Ou seja, apesar de todas as críticas que o assistencialismo recebe, geralmente realizadas mais sob o ponto de vista moral e político do que propriamente econômico e social, as famílias beneficiadas pelos programas de fato utilizam parte do montante recebido para investir em capital humano, em acordo com a teoria de Gary Becker, e isso pode ajudar a combater a pobreza no longo prazo, pelo efeito da escolaridade sobre a produtividade dessas crianças no mercado de trabalho, no futuro. Além disso, no presente trabalho, devido à pequena parcela da variância total dos modelos explicada pelas diferenças entre os estados da federação, o uso de modelos lineares de um único nível torna-se mais apropriada (principalmente o modelo probit, já que a variável dependente é dicotômica). Isso se deve ao fato de que o ensino básico no Brasil, atualmente, é praticamente universalizado, sendo que as diferenças de acessibilidade à instituições de ensino entre regiões geográficas tão grandes como os estados são mínimas. As dificuldades de acesso às escolas podem afetar negativamente à freqüência è escola de maneira comum em nível municipal e micro-regional, sobretudo nas localidades mais pobres e mais distantes dos grandes centros urbanos, tal como visualizado pelo estudo de Riani & Rios-Neto (2004), mas não em nível estadual. Por fim, a baixa significância dos gastos estaduais com assistência social para explicar a freqüência à escola revela o caráter federal dos gastos assistenciais no Brasil. Ou seja, ao contrário do que vem acontecendo com a política fiscal em geral, as funções assistenciais e redistributivas do Estado ainda são centralizadas, o que pode se justificar pela teoria de Musgrave, citada por Silva (2005), segundo a qual a descentralização da assistência social poderia levar a conseqüências demográficas indesejadas. VIII - Referências Bibliográficas: AFONSO, José Roberto. Brasil: Descentralização Fiscal e Avanços das Políticas Sociais. XV Seminário Regional de Política Fiscal, CEPAL. Santiago de Chile, 2003; BECKER, Gary. A Treatise on the Family. Cambridge: Harvard University Press, 1991; BECKER, Gary. Human Capital: a Theoretical and Empirical Analysis with Special Reference to Education. 3rd ed. In. The University of Chicago Press. Chicago, 1993; CORSEUIL, Carlos Henrique; SANTOS, Daniel Domingues & FOGUEL, Miguel Nathan. Decisões Críticas em Idades Críticas: A Escolha dos Jovens entre Estudo e Trabalho no Brasil e em Outros Países da América Latina. IPEA, texto para discussão n. 797. 2001; DIAZ, Maria Dolores Montoya. Efetividade no Ensino Superior Brasileiro: Aplicação de Modelos Multinível à Análise dos Resultados do Exame Nacional de Cursos. In. Revista EconomiA, v.8 n.1. Brasília, 2007; FERRO, Anrea Rodrigues & KASSOUF, Ana Lúcia. Avaliação do Impacto dos Programas Bolsa-Escola sobre o Trabalho Infantil no Brasil. Pesquisa e Planejamento Econômico, v.35, n.3, 2005; FERRÃO, Maria Eugénia; BELTRÃO, Kaizô Iwakami & SANTOS, Denis Paulo. Modelo de Regressão Multinível: Aplicação ao Estudo do Impacto da Política de Não-Repetência no 23 Desempenho Escolar dos Alunos da 4ª Série. In: Pesquisa e Planejamento Econômico, vol.32 n.3. Rio de Janeiro, 2002; GUJARATI, Damodar. Econometria Básica, 3ª. Edição. Pearson Makron Books. São Paulo, 2004; HANUSHEK, E. The Trade-Off Between Child Quantity and Quality. Journal of Political Economy v. 100, n.1. 1992. KASSOUF, Ana Lúcia. Trabalho Infantil: Escolaridade x Emprego. Economia – ANPEC v.2, n.2, 2001; LAVINAS, Lena. Transferências de Renda: O “Quase Tudo” do Sistema de Proteção Social Brasileiro. Rio de Janeiro, 2004. OLIVEIRA, Fabrício. Evolução, Determinantes e Dinâmica do Gasto Social no Brasil: 1980/1996. IPEA, Texto para Discussão n. 649. Brasília, 1998; PREAL. Deserción Escolar: Un Problema Urgente que Hay que Abordar. Formas & Reformas de La Educacion, Serie Políticas, año 5, n. 14. Santiago de Chile, 2003; RAUDENBUSH, S. W. & BRYK, A. S. Hierarchical Linear Models: Applications and Data Analysis Methods. Advanced Quantitatives Techniques in the Social Sciences, 1. Newbury Park, CA: Sage, 1992; QUEIROZ, Bernardo Lanza & CÉSAR, Cibele Comini. Dinâmica Econômica, Mercado de Trabalho e Diferenciais de Salário nos Estados Brasileiros. Belo Horizonte, 2000. RESENDE, Anne & OLIVEIRA, Ana Maria Hermeto de. Avaliando Resultados de um Programa de Transferências de Renda - O Impacto do Bolsa-Escola sobre os Gastos das Famílias Brasileiras. 2006; RIANI, Juliana de Lucena Ruas & Rios-Neto, Eduardo Luiz Gonçalves. Impacto dos Fatores Familiares, Escolares e Comunitários na Quantidade e Qualidade do Ensino no Estado de Minas Gerais. XI Seminário sobre Economia Mineira, Diamantina, 2004; ROCHA, Sonia. Trabalho Precoce: realidade social e política pública. Nova Economia, v.13, n.2, 2003; SCHWARTZMAN, Simon. Programas Sociais Voltados à Educação no Brasil: o Impacto do Bolsa-Escola. In: Sinais Sociais, ano 1, n.1. Rio de Janeiro, 2004; SILVA, Mauro Santos. Teoria do Federalismo Fiscal: notas sobre as contribuições de Oates, Musgrave, Shah e Ter-Minassian. In: Nova Economia, Revista do Departamento de Ciências Econômicas da UFMG, vol. 15, n.1, Janeiro – Abril de 2005; WINLER, Donald & GERSHBERG, Alec Ian. Os Efeitos da Descentralização do Sistema Educacional sobre a Qualidade da Educação na América Latina. PREAL, TD n. 17. Santiago do Chile, 2000. 24