Avaliação de Políticas de Pagamento por Performance na Educação Pública:
O Caso de Nova York
Autoria: Antonio Bara Bresolin, Caio César de Medeiros Costa
RESUMO
Esse trabalho trata da avaliação de políticas educacionais, especificamente da política de
pagamento de bônus na educação pública. Analisou-se a avaliação da política implementada
na cidade de Nova York, concluída no ano de 2011. Com subsídio da literatura a respeito da
avaliação de políticas públicas traçou-se panorama sobre a avaliação de políticas de bônus
brasileiras na área da educação. E, tendo em vista a experiência avaliativa realizada em Nova
York, identificou e analisou aspectos da avaliação, entre eles o seu desenho, a sua finalidade e
a utilização das informações deste processo como subsídio para a tomada de decisão
governamental.
1. Introdução
1
Desde a promulgação da constituição federal brasileira de 1988 e principalmente ao longo das
décadas de 1990 e 2000, uma série de reformas políticas foi realizada. Durante esse período
algumas agendas que foram implementadas em contexto nacional e também em contexto
subnacional seguiram modelos adotados por outros países. Dentre elas se encontra a criação
de instrumentos de avaliação em larga escala do sistema público de educação (Schwartzman,
2013).
A realização de provas padronizadas internacionalmente, nacionalmente e
subnacionalmente, desenvolvidas como instrumento para mensurar a aprendizagem dos
alunos, tem crescido ao longo dos anos (Souza e Oliveira, 2010). A criação desse modelo de
avaliação permite que este instrumento e seus resultados orientem diferentes etapas da gestão
da política educacional como demonstra Brooke (2011) ao identificar a as seguintes
possibilidades de utilização dos resultados: 1) Avaliar e orientar a política educacional; 2)
Informar as escolas a respeito da aprendizagem dos alunos e definir estratégias de formação
continuada; 3) Informar o público sobre os progressos dos alunos; 4) Alocar recursos; 5)
Elaborar políticas de incentivos salariais; 6) Avaliar o docente e 7) Certificar alunos e escolas.
O uso destas provas como instrumento de incentivo para melhoria do desempenho de
professores ganhou força e teve sua prática ampliada principalmente na última década. O
desenho de programas de bônus para professores com desempenho diferenciado, visando
estimular a melhoria na aprendizagem dos alunos, foi adotado por diferentes governos,
incluindo sete estados brasileiro que já implantaram este tipo de política: Amazonas, Ceará,
Espírito Santo, Minas Gerais, Pernambuco, Rio de Janeiro e São Paulo (Brooke 2011).
Além das diferentes experiências iniciadas no Brasil, outros países fazem ou fizeram
uso semelhante desse tipo de instrumento como incentivo para professores na área pública.
Apesar da sua larga utilização ao redor do mundo, evidências internacionais a respeito do
impacto do bônus sobre desempenho não são conclusivas, ainda que apresentem sinais
positivos em contextos específicos (Figlio e Loeb 2011). Experiências avaliadas em países
como Índia (Muralidharan e Sundararaman, 2009), Inglaterra (Atkinson et al., 2009) e Israel
(Lavy 2009), mostram que programa de bônus para professores baseado em desempenho pode
ter resultados em provas padronizadas feitas pelos estudantes. Mas as discussões sobre o
assunto ainda estão longe de um consenso e carecem de estudos avaliativos conclusivos e
generalizáveis.
É em contextos como esses que se faz necessária a avaliação das políticas
governamentais baseadas em métodos e modelos científicos. No Brasil são raros os casos
sobre uso da avaliação na área pública como demonstra Serpa (2010) ao afirmar que existem
poucos estudos avaliativos com desdobramentos e conseqüências práticas no aprimoramento
da gestão de políticas públicas.
Não obstante das demais, a política de pagamento por bônus a professores no Brasil
segue a mesma lógica de escassez de estudos de avaliativos, que nesse caso é explicitado pela
baixa quantidade de informações e análises sobre o tema. O único trabalho publicadoi até o
momento, feito por Oshiro e Scorzafave (2011), avalia a política do Estado de São Paulo, a
respeito do efeito do pagamento de bônus aos professores sobre a proficiência escolar.
A realização da avaliação das políticas públicas é fundamental para o desenvolvimento
e adaptação das formas e instrumentos da ação pública como aponta Frei (2000), para isso a
avaliação deve subsidiar o processo de tomada de decisão com informações corretas e úteis
que permitam o aprendizado organizacional.
Como referência empírica de avaliação da política de pagamento por bônus na
educação, discute-se o caso acerca do programa realizado por Nova York. Trata-se de um
exemplo bem sucedido de avaliação, haja vista que os resultados encontrados foram utilizados
como base para que o governo decidisse novos rumos da política e o estudo abordou
2
diferentes nuances da avaliação e forneceu uma grande quantidade de informações e
propiciou a aprendizagem organizacional. Experiências como essa mostram a necessidade e a
pertinência do uso de diferentes metodologias para avaliação de políticas públicas que
permitam a utilização conseqüente dos processos avaliativos no aprimoramento das ações
desenvolvidas.
O presente trabalho representa um esforço no sentido de demonstrar a importância da
utilização de mecanismos de avaliação das políticas públicas na área da educação, com foco
específico em pagamento de bônus financeiro, cada vez mais implementadas por um grupo
crescente de Estados brasileiros, sem ser acompanhada por processos de monitoramento e
avaliação que possam sinalizar a efetiva contribuição dessa política para os objetivos aos
quais se propõem.
Dada à relevância da avaliação das políticas públicas, a baixa utilização desse
instrumento no Brasil e a necessidade de se analisar a contribuição potencial de política de
incentivo para professor baseada em desempenho, o presente estudo pretende contribuir para
reflexão teórica, assim como estimular uma mudança de prática, ao apresentar e discutir um
caso que poderá servir como referencial para concepção e realização de avaliações futuras.
O caso de Nova York se insere nesse contexto, tendo em vista o descolamento entre a
implementação da política e a sua avaliação no contexto brasileiro. Torna-se primordial
discutir a avaliação de um programa de bônus para professores, a partir de uma experiência
internacional de sucesso que conseguiu preencher tal lacuna, objetivo desse trabalho. O caso
nova yorkino certamente poderá orientar, inspirar e referenciar processos avaliativos de
diferentes políticas que estão em elaboração ou já foram implementadas nesta mesmo âmbito,
no Brasil.
Partindo de uma breve revisão da teoria a respeito da avaliação de políticas públicas, será
apresentado um panorama do contexto brasileiro em relação a avaliação de política de bônus
na área da educação, seguido por uma análise do processo avaliativo realizado sobre a política
de incentivo financeiro na área pública educacional em Nova York. Por fim, serão
apresentadas aprendizagens a respeito da avaliação de políticas desta natureza que podem
orientar e estimular processos semelhantes no Brasil, contribuindo para o aprimoramento das
políticas que estão em andamento no país.
2. Avaliação de Políticas Públicas e sua aplicação no contexto educacional
Ala-Harja e Helgason (2000:8) conceituam a avaliação de políticas públicas como uma
ação que compreende a verificação dos resultados de um programa em relação aos seus
objetivos. Os próprios autores afirmam, porém, que tal questão está longe de um consenso e
que diversas versões para esse conceito são apresentadas. Além de diferentes definições, outro
aspecto não consensual apresentado por Faria (2003) é a existência de uma Babel de
abordagens, teorização e vertentes analíticas.
Como aponta Capobiango et al., (2010) algumas definições são comumente empregadas
ao tratar o tema da avaliação destacando a de Weiss (1988:5) de que a avaliação seria “a
estimativa sistemática da operação e/ou dos resultados de um programa ou de uma política
(policy), em comparação com um conjunto de parâmetros implícitos ou explícitos, como
forma de contribuir para o aprimoramento do programa ou política”.
Na lógica apontada no parágrafo anterior a atuação do Estado e das instituições
preocupadas com a avaliação das Políticas Públicas se dá de forma ex-post. Dessa maneira ela
não é vista somente como um instrumento de gestão, mas também como uma forma de
aferição do desempenho das políticas e programas, o que permite estabelecer parâmetros para
a prestação de contas da burocracia e dos governantes como apontam Ceneviva e Farah
(2012).
3
Cohen e Franco (2007) argumentam que a avaliação não deve ser julgada como
autossuficiente, dado que faz parte de um processo de planejamento da política, que permite a
definição entre diferentes projetos tendo por base sua eficácia e eficiência. Além disso,
possibilita a verificação dos resultados alcançados por esses projetos, permite a retificação ou
não das ações e, quando necessário, reorienta a busca dos objetivos intencionados pelos
projetos.
Trabalhos como o de Silva (1999), argumentam que o motivo primaz do interesse pela
avaliação da atividade governamental é a preocupação com a efetividade das ações. O
segundo motivo ainda de acordo com o autor é entender o que leva os programas a
alcançaram os resultados apresentados, e para tanto analisa-se a dinâmica da atuação do
Estado e problemas ocorridos na implementação. São citados também como sendo
motivadores da avaliação, o aprendizado organizacional, o subsídio ao processo de tomada de
decisão e a responsabilização do Estado na sua função alocativa.
A avaliação de políticas públicas tem múltiplos objetivos e atende a uma variada
audiência; no entanto, conforme afirmam Calmon e Serpa (2009), no Brasil este debate ocorre
de forma tardia e sem uma perspectiva estratégica, predominando a existência de grupos de
acadêmicos ou de alguns gestores que reconhecem as contribuições potenciais da avaliação
para o aprimoramento das ações desenvolvidas. Na área da educação pública tal questão é
similar às demais. Poucos estudos avaliativos das políticas educacionais foram realizados,
sendo que na grande maioria as motivações desses trabalhos foram de interesse científico,
mas que pode atender também a outros objetivos apresentados no parágrafo anterior, como
mostram os exemplos apontados no parágrafo seguinte.
Alguns trabalhos podem ser citados como sendo exemplos da utilização da avaliação no
campo da educação. O estudo de Ceneviva e Farah (2012) analisa a relação entre a
responsabilização dos agentes públicos e as características do sistema de avaliação
implementado, como base para esse estudo os autores analisaram dois programas
educacionais existentes. Por sua vez o trabalho de Falsarella (2011) expõe os pressupostos
políticos, teóricos e metodológicos da avaliação de políticas públicas no campo da educação,
como enfoque dessa análise a autora explora as mudanças necessárias para os atores ligados à
política.
Em comum os dois estudos apresentados no parágrafo tem a motivação científica e a visão
restrita acerca da avaliação, há de se destacar, porém a dificuldade em se realizar um trabalho
de avaliação que analise questões amplas passando pelo impacto, processos, desenho entre
outros pontos que podem ser investigados.
Os estudos avaliativos das políticas educacionais mostra uma preocupação direcionada à
qualidade da educação e a participação dos atores envolvidos nesse processo, apresentando
assim uma tendência a responsabilização e a visão de que as políticas educacionais são arenas
nas quais cabem a atuação de múltiplos atores.
Atualmente no Brasil uma das preocupações vigentes é a melhoria dos indicadores
educacionais apresentados e oriundos de outras avaliações que subsidiam além da análise
comparada, outras políticas que são balizadas por esses indicadores, dentre elas a política de
premiação por bônus.
Parte crucial dos sistemas de premiação por desempenho, o uso de testes como
indicador de resultados de aprendizagem dos estudantes representa um aspecto bastante
controverso no processo avaliativo do programa. Por se tratar de um instrumental restrito e
passível de erros, muita reflexão e discussões foram feitas sobre esta questão, que ainda
produz discordâncias e está longe de atingir um consenso. Esses apontamentos demonstram a
grande utilidade das informações advindas dos processos de avaliação, bem como a
complexidade na utilização dessas informações, o que enfatiza mais ainda a necessidade de
informações confiáveis e de um processo e avaliação sem falhas e completo.
4
3. Panorama da avaliação de políticas brasileiras de bônus na área educacional
Diversos governos estaduais brasileiros já elaboraram projetos e leis para o
estabelecimento de programas de bônus voltados aos docentes e profissionais ligados a
educação, baseados em metas de desempenho dos alunos da rede. É conhecida a existência de
programa de bônus para servidores na área educacional nos estados brasileiros: Amazonas,
Ceará, Espírito Santo, Minas Gerais, Pernambuco, Rio de Janeiro e São Paulo (Brook 2011).
Uma Proposta de Emenda à Constituição (PEC) 188/12 está em análise pela Câmara dos
Deputados para criar o Fundo Nacional de Valorização do Professor da Educação Básica,
destinado exclusivamente ao pagamento de bônus aos docentes da rede pública que exercem o
magistério em sala de aula.
Cada Estado desenvolveu um modelo específico de bonificação, com variáveis e regras de
funcionamento diferentes. Também é sabido que cada governo elaborou um modelo próprio
de política, em períodos distintos, criou diferentes regras e variáveis para o pagamento da
recompensa financeira, e estipulou valores e formas de desembolso próprios.
As políticas de remuneração variável por desempenho em educação no Brasil apresentam
desenhos variados em relação: a formas de medir o desempenho, seja do professor ou da
escola; ao critério de desempenho dos alunos; a natureza dos indicadores escolares
considerados; a distribuição da bonificação, para o indivíduo ou para a escola, para todos da
equipe ou excluindo o pessoal de apoio; a maneira de contabilizar faltas previstas e não
previstas legalmente; forma de pagamento, anual ou mensal; ao estabelecimento do valor
pago; entre outras variáveis (Pontual 2008).
Será que esta estratégia de incentivo é adequada para estimular a melhora no desempenho
escolar dos alunos? Sob quais condições este mecanismo pode, ou não, funcionar? Existe um
modelo que seja mais efetivo ao objetivo que se pretende? Qual o desenho que gera mais
resultados?
Apesar da existência de poucos estudos brasileiros a respeito deste tema, há uma forte
tendência de proliferação de programas fundamentados neste princípio. Em função da
escassez de avaliações, não é possível saber se os programas desenhados para estimular uma
melhora no desempenho dos alunos estão trazendo de fato uma mudança nos indicadores
educacionais. É preciso compreender se a oferta de uma recompensa financeira adicional para
servidores públicos que trabalham na área da educação, condicionada a variáveis préestabelecidas, como notas dos alunos em provas padronizadas, tem contribuído para promover
realmente um desempenho diferenciado do professor a ponto dos alunos aprenderem mais.
É necessário investigar os diferentes modelos de bônus vigentes no país, avaliar a maneira
pela qual foram implementados, analisar os resultados intermediários gerado por eles, julgar
se os resultados finais almejados estão sendo atingidos e quais variáveis podem estar
correlacionadas aos resultados desejados por este tipo de política.
O único trabalho publicado no Brasil até o momento, com foco no impacto gerado por
este tipo de política, é de Oshiro e Scorzafava (2011), que avalia o programa implementado
no estado de São Paulo em 2008 para remunerar funcionários e professores da rede que
cumprem metas pré-determinadas pela Secretaria de Educação do Estado de São Paulo na 4ª
série do ensino fundamental, na 8ª séries do ensino fundamental e no 3º ano do ensino médio.
No caso desta política, as metas foram estabelecidas a partir de indicadores sobre o fluxo
escolar - taxa média de aprovação em cada ciclo da escolarização - e o desempenho dos
alunos – nota na proficiência em Matemática e Português do Sistema de Avaliação do
Rendimento Escolar do Estado de São Paulo (SARESP).
A avaliação utilizou métodos econométricos (propensity score matching e diferenças em
diferenças) para mensurar o impacto do programa sobre o desempenho dos alunos em
5
Matemática e Português na Prova Brasil na 4ª e 8ª séries do ensino fundamental. Com o
intuito de atribuir causalidade entre a política e o impacto nas notas que ela busca promover,
foi considerado como grupo de tratamento as escolas estaduais de São Paulo, submetidas à
política, enquanto o grupo de controle foi composto por escolas com características
semelhantes, mas pertencentes a outra rede (municipal paulistas e outros estados) onde
políticas desta natureza não haviam sido implementadas.
O estudo identifica um impacto positivo e estatisticamente significativo na proficiência
dos alunos da 4ª sérieii, mas não encontram impacto na proficiência dos alunos da 8ª série. Os
próprios autores reforçam a necessidade de estudos complementares para se compreender os
motivos desta diferença de impacto entre as séries, assim como a carência de se investigar
como os agentes envolvidos avaliam a política.
Elaborado em ambiente acadêmico, esta avaliação foi feita com base em dados
secundários e superou dificuldades decorrentes de não ter sido planejada antes da
implementação da política, nem em parceria com a área pública. Sua concepção e execução
não teve qualquer articulação ou interlocução com a secretaria executora da política analisada,
de tal forma que os resultados encontrados não tiveram qualquer desdobramento ou uso
prático por parte dos gestores públicos. Tal qual foi avaliada, a política segue vigente e
inalterada.
4. Método
A literatura mostra a importância das avaliações de políticas públicas (Ceneviva e
Farah, 2012), os possíveis usos deste instrumento em um contexto de institucionalização dos
processos avaliativos na esfera governamental (Calmon e Serpa, 2012), destaca que a
avaliação atende a diferentes objetivos e audiência (Silva, 1999), assim como pode apresentar
diversas motivações e utilizações (Calmon e Serpa, 2009), devendo ser realizada sob
múltiplas perspectivas metodológicas (Marsh et al., 2011).
O presente trabalho faz uma análise descritiva e crítica do processo de avaliação da
política de pagamento de bônus por desempenho em Nova York, ressaltando os diversos
critérios considerados e a relevância deste tipo de análise. O quadro a seguir apresenta as
principais variáveis relacionadas ao processo de avaliação e sintetiza as características do caso
analisado.
Realizou-se aqui uma análise de documentos governamentais, relatórios de avaliação e
artigos científicos que abordaram tal temática. A pesquisa pode ser classificada como
documental, no sentido de que se pauta em trabalhos já publicados. Uma série de aspectos
deve ser tratado de forma cautelosa ao se realizar pesquisas desse tipo, os documentos são
sempre específicos ao contexto no qual foram elaborados Na análise, além da compreensão
das questões e métodos de pesquisa social e do conhecimento do referencial teórico, é muitas
vezes necessário coletar dados a partir de uma ampla gama de fontes, já que precisam ser
situado dentro de um quadro teórico de referência, a fim de que seu conteúdo seja
compreendido. (Autor Desconhecido, sd)
Quadro 1 – Sistematização sobre a avaliação do Programa de Bônus de Nova York
6
Aspecto
Desenho da política
atores envolvidos
tempo dedicado
I mplementação
Escala
critério de seleção
período proposto
formato
Avaliação
Planejamento
Etapas consideradas
Responsável
Atores envolvidos
M etodologia
Situação
Prefeitura, Secretaria de educação, Sindicato
longo, 3 anos
amostral
voluntário e aleatório
2 anos (prorrogado para 3)
piloto
feito junto com o desenho da política
implementação, resultados intermediários, resultado final
avaliador externo
governo, academia e beneficiários (diretores e professores)
qualitativa – grupo focal, estudos de caso, pesquisa de opinião
quantitativa – aplicação de questionários, análise de dados
secundários
Utilização da avaliação
motivação
gestão e aprimoramento
Fonte: Elaborado pelos autores
O quadro anterior elenca as principais variáveis a serem consideradas em um processo
de avaliação de política pública desta natureza, ilustrando a exemplaridade do caso, ao ter
sido realizado sob perspectivas múltiplas e complementares.
5. Análise sobre a avaliação da política de bônus por performance escolar em Nova
York
5.1 O Programa de Bônus por Performance Escolar
A Reforma Educacional de Nova York, chamada “Children First”, foi estruturada com
o intuito de superar diversos obstáculos em relação ao aprimoramento do ensino e da
aprendizagem em instituições educacionais públicas, após décadas de tentativas inócuas no
sentido de reverter uma cultura de fracasso nas escolas da cidade. Esta reestruturação,
liderada pelo prefeito de Nova York, Michael Bloomberg, e pelo secretário de Educação, Joel
Klein, foi iniciada em 2002. Entre os diferentes temas abarcados no processo da reforma
educacional, que produziu mudanças na rede pública de ensino da cidade, foram incluídos a
descentralização e autonomia escolar; o monitoramento dos processos de aprendizagem e a
responsabilização pelos resultados; o processo de formação e apoio aos professores em sala de
aula; a aproximação entre a escola e a família; entre outros (Gall e Guedes, 2009).
Após debates que se estenderam por um longo período, a Secretaria de Educação de
Nova York (NYCDOE) e a Federação Unida de Professores (UFT)| implantaram
conjuntamente o Programa de Bônus por Performance Escolar (SPBP) no ano escolar de
2007-2008.O desenho do projeto contemplou a elaboração, a implementação e a avaliação de
uma política de incentivos por desempenho aos profissionais do setor, com duração inicial
prevista para dois anos, 2007-2008 e 2008-2009, que acabou sendo prolongado por mais um
período, de 2009-2010, como resultado de negociações adicionais posteriores entre as duas
instituições.
7
Concebido para escolas extremamente carentes e vulneráveis, com baixo nível de
proficiência dos alunos, indicadores elevados de pobreza e situações sócio-demográficas
preocupantes, o Programa de Bônus foi implantado como uma iniciativa piloto, em pequena
escala, de modo a possibilitar a avaliação da pertinência de sua expansão, em um segundo
momento, para toda a cidade de Nova York (Lasagna, 2010).
O bônus foi idealizado como uma recompensa e um incentivo para motivar
comportamentos desejados dos professores. Criava-se, assim, um instrumento supostamente
poderoso que permitia relacionar performance e pagamento. Inédito e multifacetado, Lasagna
(2010) ressalta que o Programa teve como objetivos prioritários:
- Aumentar a aprendizagem dos alunos, por meio da criação de incentivos e
recompensas para professores de escolas em situação de elevada vulnerabilidade e
baixa performance
- Instituir um sistema de recompensa profissional para os professores
- Criar um clima de colaboração entre os docentes e estimular uma mudança de
comportamento nas práticas de ensino
- Atrair e reter educadores melhor qualificados
O foco central foi dado à melhora da aprendizagem dos estudantes. O sucesso da política
seria mensurado de maneira objetiva, considerando as notas obtidas pelos estudantes em
provas padronizadas de matemática e língua inglesa, o nível de freqüência às aulas e a
adequação do ambiente escolar à aprendizagem. Conseqüentemente, objetivos intermediários
também seriam atingidos: a retenção de professores altamente qualificados, o aumento de
colaboração e cooperação entre os funcionários da escola e a melhora do nível motivacional
dos professores.
A adesão ao programa era feita de forma voluntária pela unidade escolariii desde que pelo
menos 55% dos seus representantes na UFT escolhesse participar. No primeiro ano, 427
escolas que apresentavam as condições para elegibilidade ao programa se inscreveram e
aproximadamente metade foi selecionada aleatoriamente para participar. Após desistências e
ajustes nesta seleção, o programa foi implantado com a participação de 205 escolas. No
decorrer do tempo, este numero caiu para 198 escolas no segundo ano e para 196 no terceiro.
Como contra partida, cada escola selecionada para participação criou um Comitê de
Compensação (CC), com a atribuição de determinar a maneira como o valor total de
bonificação recebido pela instituição seria distribuído entre os participantes. O Comitê era
composto pelo diretor da escola, um integrante indicado pelo diretor e outros dois
participantes eleitos pela equipe escolar que fossem representantes da UFT, e teria autonomia
completa para a definição do critério de divisão do bônus recebido pela escola. A única
restrição imposta foi não usar critério de senioridade para a distribuição.
Fundamentado em medidas fixas de performance, o bônus foi concedido a partir do
estabelecimento de níveis referenciais – metas - para desempenho da escola no Boletim de
Progresso Escolariv (School Progress Reports - RP) da Secretaria de Educação, elaborado
para cada distrito escolar. O índice criado para a medida do desempenho foi composto pela
performance e progresso dos estudantes, pelo ambiente escolar e por um critério de pontuação
adicional por exemplaridade. O cálculo final da pontuação no RP foi baseado na pontuação
total da escola em relação a todas as outras instituições com população estudantil semelhante.
Conforme Marsh et al. (2011), o número de escolas que receberam o bônus cresceu
substancialmente entre os dois primeiros anos, passando de 62% das instituições participantes
sendo contempladas com bônus integral ou parcial, para 84%. Já no último ano, como
resultado de uma recalibragem das metas nos testes de proficiência dos alunos, as notas das
escolas caíram generalizadamente, provocando uma redução para 13% no percentual de
participantes que receberam o bônus no terceiro ano. Em termos monetários, as transferências
representaram um total de U$20,806 milhões no primeiro ano, pagos por entidades privadas
8
que apoiaram o governo, U$30,629 milhões no segundo ano e apenas U$4,158 milhões no
terceiro, financiados diretamente pelo governo.
5.2 A avaliação – desenho geral e principais resultados encontrados
Em 2009, o Fundo da Cidade de Nova York para Escolas Públicas contratou a RAND
Corporation para, em parceria com a Universidade Vanderbilt e com o Centro Nacional de
Incentivo em Performance (NCPI), avaliar de maneira independente a implementação e a
efetividade do SPBP.
Com este propósito, diversos procedimentos metodológicos foram adotados para a
coleta de informações: revisão de documentos relacionados ao programa; análise de dados
administrativos da secretaria municipal de educação; pesquisas com os integrantes dos CC,
com os professores das escolas participantes do programa (grupo de tratamento) e de escolas
inscritas mas não contempladas pelo sorteio (grupo de controle) e também com membros do
NYCDOE e líderes da UFT; e ainda entrevistas em 14 escolas escolhidas para representarem
estudos de caso.
A avaliação dos efeitos do programa no desempenho escolar dos alunos foi feita a
partir de inúmeras análises e estimativas dos dados do PR, incluindo os resultados acadêmicos
dos estudantes e dados demográficos dos dois grupos de escola desde o ano escolar 20062007 até 2009-2010.
O relatório final da avaliação do programa, intitulado “A Big Apple for Educators New York City’s Experiment with Schoolwide Performance Bonuses” foi publicado em julho
de 2011 (Marsh et al., 2011). Utilizando uma combinação de métodos quantitativos e
qualitativos, a avaliação foi dividida em três grandes blocos temáticos, conforme
detalhamento a seguir:
5.2.1 Como foi feita a implementação do programa?
O sucesso de programas cuja natureza é motivacional pode ser fortemente
influenciado por diferentes variáveis relacionadas a sua implementação, que impactam na
efetividade dos resultados alcançados e do programa de uma maneira global. Por meio de
questionários desenvolvidos para o processo avaliativo da implementação, foi possível
identificar o nível de conhecimento, suporte e atitudes relacionados ao programa, assim como
o grau de legitimidade e funcionamento do CC.
Entre os diversos atores envolvidos - líderes da NYCDOE e UFT, professores e
integrantes do CC – o nível de entendimento e a postura perante ao programa foram variados.
De maneira geral, o público ao qual o SPBP foi destinado demonstrou conhecimento sobre o
mesmo e sobre os princípios do seu funcionamento, mas a avaliação identificou que o
programa não foi o ponto de atenção central das equipes envolvidasv.
O suporte geral oferecido para o programa foi avaliado como suficiente, problemas de
comunicação foram sendo corrigidos com o tempo, mas alguns pontos de desentendimento
sobre o programa e a sua duração permaneceram ao longo dos três anos. Resultados não
conclusivos indicam que os integrantes do CC reportaram baixa compreensão por parte dos
professores em relação ao PR, contribuindo para os níveis de resultados atingidos, mas a
maioria dos professores se posicionou como compreendendo bem o relatório.
A postura das equipes em relação ao bônus financeiro também apresentou resultados
ambíguos. Apesar de a maioria relatar um forte desejo de ganhar o bônus, muitos informaram
que a quantia oferecida era insignificante, não chegando a representar um incentivo para
mudança de comportamento.
9
A avaliação indicou que na maioria das escolas o processo foi implementado sem conflitos e
de maneira justa, as orientações a respeito da composição e atribuições do CC foram seguidas.
Na visão de seus integrantes, o processo de tomada de decisões foi justo, inclusivo e
consensual, ainda que alguns professores tenham reportado problemas neste processo e
considerado suas preferências como não contempladas na elaboração do plano de distribuição.
As conclusões a respeito da implementação do programa indicam tanto aspectos
promissores quanto problemas incidentes. Alguns fatores importantes para o sucesso de um
programa de pagamento por performance não foram devidamente encontrados em todas as
escolas participantes, em decorrência de problemas relacionados à implementação que podem
ter enfraquecido o efeito do bônus e do programa em geral, reduzindo o estímulo
motivacional esperado. Entre os principais itens, foram ressaltados o entendimento
equivocado a respeito do programa - especialmente no que diz respeito ao desentendimento
sobre a mensuração dos resultados - a incerteza com relação à capacidade dos professores em
modificarem suas práticas profissionais ou atuarem de maneira a aumentar as chances de
atingirem as metas propostas, questionamentos a respeito dos processos decisórios,
preocupação com os tempos de implementação e duração do programa.
5.2.2. Quais os resultados intermediários atingidos?
A concepção do programa previu alguns resultados intermediários, principalmente em
relação a atitudes e comportamento dos professores no sentido de desenvolverem trabalhos
em equipe para a implementação de estratégias que pudessem contribuir para uma evolução
no desempenho dos estudantes, no médio prazo, a ponto de receberem o bônus.
A partir da avaliação pautada na auto percepção dos professores com relação a estes
aspectos e aos efeitos do SPBP na melhora escolar dos alunos, as possíveis mudanças
desejáveis referentes aos resultados intermediários esperados são contraditórias, apresentam
efeitos mistos e opiniões variadas a respeito da participação no programa.
Professores demonstraram haver percebido poucos efeitos nos seus próprios
comportamentos e afirmaram não se sentirem pessoalmente motivados a mudarem suas
atitudes. As respostas dos integrantes dos CC revelam que suas interpretações sobre os efeitos
do programa na melhora das estratégias de ensino também não foram consensuais. As
percepções dos professores e dos membros do Comitê ficaram divididas em relação a seus
entendimentos sobre como o SPBP afetou os estudantes - metade acreditou que a
performance dos alunos não mudou e metade acreditou que foi modificada para melhor.
Há, porém, consenso entre os membros deste grupo quando se referem a outros
resultados da participação no programa tais como: maior colaboração entre os professores,
aumento do trabalho em equipe e maior foco na aprendizagem dos alunos.
Pesquisas com professores de escolas do grupo de tratamento e do grupo controle
permitiram comparar atitudes e comportamentos por meio de testes sobre os possíveis efeitos
da intervenção, que criaram escalas de resposta para a utilização da metodologia de intenção
de tratamento na mensuração do impacto. Não foram identificadas diferenças entre os dois
grupos no que diz respeito a atitudes relatadas, percepções ou comportamentos, condições do
ambiente escolar, nem tão pouco na porcentagem de professores que relataram a intenção de
permanecer na mesma escola durante o próximo ano letivo. Neste sentido, o programa não
produziu os efeitos esperados.
A única diferenciação constatada foi com relação ao fato de os professores
participantes do programa terem reportado dedicação um pouco menor para ensino focado nos
testes padronizados. Esse dado contradiz a hipótese de que o incentivo monetário faria
aumentar a ênfase no ensino sabidamente reconhecido como indutor da melhora do
desempenho dos alunos nos indicadores componentes da mensuração do bônus.
10
5.2.3. Como o programa influenciou a aprendizagem dos alunos?vi
O objetivo principal do SPBP era modificar a produtividade educacional por meio de
uma recompensa aos professores e outros membros da UFT que conseguissem promover uma
melhora no desempenho dos estudantes, mensurada pelos resultados apresentados no PR. A
avaliação deste aspecto foi feita utilizando a metodologia de intenção de tratamento, a partir
de uma rigorosa comparação da performance dos alunos das escolas de tratamento com a os
das escolas de controle, considerando todos os componentes do RP e as provas padronizadas
ao longo dos três anos de programa.
Foi constatado que o SPBP não gerou efeitos estatisticamente significativos na
pontuação dos alunos no RP ao longo dos anos e nem em qualquer um dos seus componentes
– ambiente escolar, performance, progresso e melhoria exemplar.
A ausência de impacto foi confirmada para os diferentes níveis escolares, não havendo
melhoria dos alunos no desempenho das provas de matemática e língua inglesa para os três
anos do projeto no ensino elementar e primário, nem para os dois primeiros anos no nível
ensino médio. Foram testados os impactos da participação no programa a cada ano, e a
relação entre a performance dos estudantes com o tipo de plano de distribuição do bônus, mas
nenhum efeito foi encontrado. Diversos testes de robustez para as análises estatísticas foram
feitos para avaliar se as estimativas dos possíveis efeitos do programa eram sensíveis a
determinadas variáveis e especificações, mas nenhuma hipótese verificada apresentou
resultado estatisticamente significativo.
5.3 Aprendizagens sobre o processo avaliativo e a utilização dos resultados em Nova
York
A avaliação do programa, documentada no estudo de Marsh et al. (2011), foi realizada
por uma instituição externa, contratada para conduzir este processo. Constatou-se a ausência
dos efeitos inicialmente esperados tanto para variáveis intermediárias, relacionadas ao
comportamento dos professores, quanto para a meta principal, referente à performance
acadêmica dos estudantes.
Melhorias no processo de implementação do programa poderiam sem realizadas, mas
isso não garantiria um resultado mais efetivo. Motivar indivíduos, mais especificamente no
ambiente escolar público, com recompensa financeira, é um desafio complexo, por haver uma
resistência natural ao reconhecimento do estímulo e pela possível ausência motivacional
gerada por um instrumento parcial e imperfeito.
Em termos de efeitos intermediários, identificados pelos próprios participantes em seus
comportamentos, a avaliação constatou que o programa não os afetou pessoalmente, nem
modificou suas performances profissionais, nível de conhecimentos, motivações, maneira de
se relacionarem com os outros profissionais envolvidos. O bônus não foi compreendido como
uma variável capaz de influenciar tais aspectos.
Diferentes demandas por informações públicas a respeito do trabalho nas escolas têm
contribuindo para que os gestores, professores e outros integrantes da equipe escolar sejam
colocados como co-responsáveis pelo nível do desempenho educacional dos estudantes. Uma
forte cobrança gerada por diversas iniciativas governamentais pode ter se sobreposto ao
programa de bônus no caos de Nova York, reduzindo a sua importância, pois resultados
parecidos podem decorrer de outras formas de estímulos e pressões políticas, também
presentes nas escolas de controle. É provável que algumas percepções sobre mudança
motivacional possam ter sido equivocadamente atribuídas ao programa por decorrerem de
outros estímulos e não devido bônus. Atingir uma pontuação elevada no PR, por exemplo,
11
pode ser uma variável motivacional em si, também presente nas escolas não participantes.
É possível que mudanças nas práticas de professores levem mais do que três anos para
produzirem melhoria no desempenho dos alunos. No entanto, a ausência de impacto
significativo no comportamento dos professores, concebida como etapa intermediária deste
efeito final almejado, reduz a plausibilidade deste argumento. Sendo assim, as evidências
encontradas a partir de uma avaliação estruturada não suportaram a continuidade do programa
de bônus por performance que não atingiu os objetivos a que se propunha.
Tomando como referência as principais conclusões e recomendações feitas a partir deste
processo avaliativo, foi anunciado em julho de 2011 que o programa seria descontinuado.
(CARVALHO, 2011)
6. Considerações finais
Tem sido cada vez mais consensual a legitimidade em reconhecer, prestigiar e premiar
profissionais que apresentam resultados positivamente diferenciados, assim como a
necessidade se apoiar quem não consegue avançar, ainda que se esforce neste sentido, ou
punir os que não têm motivação e não se esforçam para aprimorar. Porém, é preciso encontrar
a melhor maneira de se fazer isto, não tendo sido criada ainda uma fórmula generalizada que
aumente a probabilidade de se atingir estes objetivos.
É fundamental que diversas questões avaliativas sejam formuladas, medidas, planejadas,
acompanhadas, mensuradas e analisadas para se chegar a uma conclusão a respeito dos
resultados atingidos e dos impactos gerados por um programa de incentivo financeiro na área
da educação pública.
A experiência sobre política de bônus como a promovida em Nova York mostra diversos
aspectos relacionados a avaliação de políticas públicas desta área temática. Neste caso, o
programa já começou com uma articulação política diferenciada, tendo sido estabelecido em
parceria pela secretaria municipal de educação e pelo sindicato de professores, de tal forma
que esta parceria em si já representa uma situação diferenciada, dada as inúmeras dificuldades
e a baixa freqüência deste tipo de colaboração entre governo e sindicato.
Esta experiência contribui para reforçar a importância de projetos pilotos menores, de
caráter experimental, associados ao processo de desenho, implementação, monitoramento e
avaliação sistemáticos que possam permitir correções de rumo durante o processo e uma
rigorosa análise dos resultados antes de se disseminar generalizadamente uma inovação, cujos
resultados sejam desconhecidos, em larga escala.
As escolhas metodológicas feitas para a condução do processo avaliativo possibilitaram a
análise de inúmeros aspectos referentes à implementação do programa e a seus efeitos
intermediários na motivação e no comportamento dos professores e ao objetivo prioritário de
melhoria na proficiência dos alunos.
A combinação de diferentes processos e metodologias, com a devida ponderação a
respeito das dificuldades e limitações enfrentadas, gerou resultados relevantes para a gestão
do programa. Apesar de também não haver consenso nem fórmulas pré-estabelecidas a
respeito da maneira ideal de se avaliar políticas de incentivo por performance, o caso do
SPBP apresenta pontos de reflexão relevantes.
No Brasil temos vivenciado uma proliferação de política de bônus implementadas por
diversas secretarias estaduais de educação. A maneira pela qual tais programas foram
desenhados não demonstra qualquer preocupação com um processo de monitoramento e
avaliação. Raras são as experiências avaliativas que, quando existem, utilizam métodos
específicos, com interpretações limitadas, e não foram demandadas pelos gestores, de tal
forma que os resultados encontrados não proporcionam qualquer uso para aprimoramento ou
reflexão a respeito da política vigente.
12
É passada a hora dos governantes brasileiros incluírem a avaliação das políticas na
agenda, para que esta ferramenta possa efetivamente contribuir com o aprimoramento das
ações desenvolvidas.
7. Bibliografia
ALA-HARJA, Marjukka; HELGASON, Sigurdur. Em direção às melhores práticas de
avaliação. Revista do Serviço Público, Brasília, v. 51, n. 4, p. 5-59, 2000.
ATKINSON, A., BURGESS, S., CROXSON. B., GREGG, P., PROPPER, C., SLATER, H.;
WILSON, D. Evaluating the impact of performance-related pay for teachers in England.
Labour Economics v.16, n.3, p.251-261, jun. 2009.
BROOK, N. A Avaliação Externa como Instrumento da Gestão Educacional nos Estados.
São Paulo, Fundação Victor Civita, ago. 2011.
CALMON, P.C. du P.; CERPA, S. M. H. C. Afinal de contas, Por que Avaliar? Resgatando o
debate sobre utilização na avaliação de programas governamentais. In: 33o Encontro da
Associação Nacional de Pós Graduação e Pesquisa em Administração- EnANPAD, 2009, São
Paulo...Anais 33 Encontro da Associação Nacional de Pós Graduação e Pesquisa em
Administração, 2009.
______________. Um referencial teórico para análise da institucionalização dos sistemas de
avaliação no Brasil. 35o Encontro da Associação Nacional de Pós Graduação e Pesquisa em
Administração- EnANPAD, 2012, Rio de Janeiro...Anais 35 Encontro da Associação
Nacional de Pós Graduação e Pesquisa em Administração, 2012.
CAPOBIANGO, R. P.; SILVEIRA, S. F. R. ; ZERBATO, C. ; MENDES, A. C. A. . Análise
das Redes de Cooperação Científica através do estudo das coautorias dos artigos publicados
em evento da ANPAD sobre avaliação de políticas públicas. In: EnAPG, 2010, VitóriaES...Anais do EnAPG 2010. p. 1-15.
CARVALHO, R. Política. Carta Capital. http://www.cartacapital.com.br/politica/copia-fiel/
acessado em: 12 de março de 2013
CENEVIVA.R, FARAH, M.F.S. Avaliação, informação e responsabilização no setor público.
Revista de Administração Pública - RAP, v. 46, n. 4 p. 993-1016,2012
COHEN, E.; FRANCO, R. Avaliação de Projetos Sociais. 7 ed. Petrópolis, RJ:Vozes, 2007.
FALSARELLA, A. M. Avaliação das políticas públicas educacionais no Âmbito escolar. In:
25o Simpósio Nacional da Associação Nacional de Política e Administração na EducaçãoANPAE, 2011, ...Anais 25 Simpósio Nacional da Associação Nacional de Política e
Administração na Educação 2011
FARIA, C.A.P. Idéias, conhecimento e políticas públicas: um inventário sucinto das
principais vertentes analíticas recentes. Revista Brasileira de Ciências Sociais, São Paulo, v.
18, n. 51, p. 21-29, fev. 2003.
FIGLIO, D.; LOEB, S. School Accountability. In Eric A. Hanushek, Stephen Machin, and
Ludger Woessmann, (edt): Handbooks in Economics, Vol. 3, The Netherlands: NorthHolland, 2011, pp. 383-421.
FREY, K. Políticas públicas: um debate conceitual e reflexões referentes à prática da análise
de políticas públicas no Brasil. Planejamento e Políticas Públicas, Brasília, n. 21, p. 211-259,
jun. 2000.
13
GALL, N.; GUEDES, P. A reforma educacional de Nova York: possibilidades para o
Brasil. São Paulo, Instituto Fernand Braudel. 2009. Disponível em:
http://ww2.itau.com.br/itausocial2/pdf/reforma_educacional_ny.pdf . Acesso em: 10 de
março de 2013
LASAGNA, M. New York City’s School-Wide Performance Bonus Program. Center for
Educator Compensation Reform. U.S. Department of Education, Office of Elementary and
Secondary Education, Washington, D.C. 2011.
LAVY,V. Performance Pay and Teacher’s Effort, Productivity, and Grading Ethics,
American Economic Review, v.99.n.5.p.1979-2011, set. 2009.
MARSH, J., SPRINGER, M., McCAFFREY, D., YUAN, K., EPSTEIN, S., KOPPICH, J.,
KALRA, N.; DiMARTINO, C. A Big Apple for Educators: New York City's Experiment
with Schoolwide Performance Bonuses: Final Evaluation Report. Santa Monica, CA:
RAND Corporation, 2011.
MURALIDHARAN, K; SUNDARARAMAN, V. Teacher performance pay: Experimental
evidence from India. National Bureau of Economic Research, v. 15323, 2009
OSHIRO, C.; SCORZAFAVE, L. Efeito do pagamento de bônus ao professores sobre a
proficiência escolar no estado de São Paulo. In: 39o Encontro Nacional de Economia, 2011,
Foz do Iguaçu...Anais 39 Encontro Nacional de Economia, 2011.
PONTUAL, T. Remuneração por mérito, desafio para a educação. Fundação Lemann,
Nov. 2008
SCHWARTZMAN, S. Uses and abuses of education assessment in Brasil, IETS, 2013.
SERPA, S.M.H.C. Para que Avaliar?Identificando a Tipologia, os Propósitos e a Utilização
das Avaliações de Programas Governamentais no Brasil. 2010. 191f. Dissertação de Mestrado
em Administração. Universidade de Brasília. Brasília. 2010
SILVA, P. L. B. (coord.) Modelo de Avaliação de Programas Sociais Prioritários: relatório
final. Programa de Apoio à Gestão Social no Brasil. Campinas, NEPP-UNICAMP, 1999.
SOUZA, S. Z.; OLIVEIRA, R. P. de. Sistemas estaduais de avaliação: uso dos resultados,
implicações e tendências. Cadernos de Pesquisa, v. 40 n.141, p.793-822. 2010
THOENIG, Jean-Claude. A avaliação como conhecimento utilizável para reformas de gestão
pública. Revista do Serviço Público, Brasília, v. 51, n. 2, p. 54-70, abr./jun. 2000.
i
Estão em andamento dois estudos que buscam avaliar programas da mesma natureza. Estes trabalhos já foram
apresentados preliminarmente em seminários, mas ainda não foram concluídos. Um deles investiga os efeitos do
Bônus por desempenho escolar em Pernambuco (Bruns e Ferraz) e o outro compara os impactos das políticas de
São Paulo e Pernambuco (Foguel e Guerra).
ii
6,4 pontos na escala SAEB em Matemática e 3,7 em Português
iii
Para os níveis pré-escolar (alunos de 4 a 6 anos), elementar (alunos de 6 a 11 anos), primário (alunos de 11 a
14 anos) e ensino médio (alunos de 14 a 18 anos).
iv
Mais informações sobre o Boletim de Progresso Escolar (School Progress Reports - PR) pode ser encontrada
em Gall eGuedes (2009)
v
Diferentes ações foram desenvolvidas para todas as escolas da rede municipal, independente de fazerem ou não
parte do programa de bônus, e isto criou um sistema generalizado de forte cobrança por melhoria de
desempenho, que incluía severas consequências, tais como: o fechamento de escolas, caso não consigam atingir
o nível de progresso esperado; a responsabilização das equipes de órgãos regionais e central pelo desempenho de
escolas sob sua responsabilidade; entre outros.
vi
Todos as estimativas podem ser encontrados no apêndice D do relatório final da avaliação do programa,
disponível em: www.rand.org
14
Download

1 Avaliação de Políticas de Pagamento por Performance na