Métodos Experimentais
Latin America and the
Caribbean’s Citizen
Security
Team
Caio Piza
Economista
DIME/Banco Mundail
Impact Evaluation 4 Peace
24-27 Março 2014, Lisboa, Portugal
Provocações!
1. Você acha que o seu projeto é um sucesso ou vai se tornar
quando sair do papel? Sim!
2. Se o governo quiser universalizar um programa que não
possou por uma avaliação rigorosa, qual será o seu
conselho?
2
Avaliação de Impacto: como identifico o
impacto do programa?
3
Objetivos de uma AI
• Identificar o efeito causal da política
• O programa funciona? Para quem?
• Há alternativas?
• Implementar o que funciona melhor a um custo mais baixo
• O OBJETIVO NÃO É JULGAR O PROGRAMA E OS SEUS
RESPONSÁVEIS, MAS TORNÁ-LO MAIS EFETIVO
4
Erros comuns… mas
evitáveis!
• Correlação implica causalidade;
• Análise do tipo ‘antes e depois’ informa o
impacto do programa;
• Qualquer grupo de controle é um bom/válido
grupo de controle;
5
Correlação vs. causalidade
• ‘Refrigerante diet engorda porque apenas pessoas acima do
peso bebem’
• Casamento é uma questão de saúde pública já que ‘homens
que casam engordam’
• ‘Excesso de cafeina pode causar câncer’
• ‘O Bolsa Família reduziu a pobreza’
• Um programa desenhado para controlar uma epidêmia deve
ser descontinuado já que o número de infectados aumentou
6
Erros comuns… mas
evitáveis!
• Correlação implica causalidade;
• Análise do tipo ‘antes e depois’ informa o
impacto do programa;
• Qualquer grupo de controle é um bom/válido
grupo de controle;
7
Antes e depois
Grupo de Tratamento
Treatment
Grupo deGroup
tratamento
14
(+6) aumento nos lucros
12
10
Um programa
de crédito foi oferecido em
2008.
8
6
4
Efeito positivo?
2
0
2007
2007
2009
2009
8
Antes e depois
Control
GrupoGroup
de controle
Grupo deGroup
tratamento
Treatment
14
(+) Impacto do
programa
12
10
(+) Impacto de outros
fatores (externos)
8
6
4
2
0
Antes
Before
Depois
After
9
Erros comuns… mas
evitáveis!
• Correlação implica causalidade;
• Análise do tipo ‘antes e depois’ informa o
impacto do programa;
• Qualquer grupo de controle é um bom grupo
de controle;
10
Qualquer grupo de controle é um
bom grupo de controle?!
VS.
Eike Batista
Anônima – beneficiária do
Bolsa Família
11
Qualquer grupo de controle é um
bom grupo de controle? NÃO!!!
• O desafio é encontrar um bom grupo de
controle
– Os grupos devem ser parecidos em características
observáveis e não-observáveis
– Como garantir isso?!
• Ideal: método experimental
• Plano B: método não-experimental
12
Desenho Experimental
• Todos os participantes do estudo têm a mesma chance de estar
no grupo de tratamento ou de controle
• Intencionalmente, os grupos de tratamento e de controle têm as
mesmas características (observadas e não observadas), na média
– A única diferença é o tratamento
• Com grandes amostras, todas as características convergem para a
média populacional
• Estimativas de impacto não enviesadas
13
Formas Alternativas de
Aleatorização
• Sorteio
– (apenas alguns entram no programa)
• Entrada gradual
– (todos entram eventualmente)
• Variação no tratamento
– (cobertura integral, diferentes opções)
• Desenho de incentivo (no caso de adesão parcial)
– Todos podem entrar, alguns são encorajados a fazê-lo
14
Exemplos
Sorteio
(apenas alguns entram no programa)
Sorteio para ter acesso a materiais esportivos doados por
uma empresa esportiva (Nike, Adidas etc.)
Entrada gradual (entrada ao longo do tempo – phase in)
Alguns crianças recebem transporte gratuito primeiro pois não há
micro-ônibus para atender todas as escolas e crianças
Variação no tratamento
Algumas crianças recebem um aulas mais intensivas (mais horas ou dias) por
semana e os demais as aulas que são dadas regularmente
Incentivo
Um grupo de crianças recebe transporte gratuito para se deslocarem da
escola as Vilas Olímpicas
1515
Loteria entre os elegíveis
Deve receber o programa
Aleatorizar quem recebe o programa
Inelegível para o programa
Oportunidades para a
aleatorização (1)
•
As limitações orçamentárias impedem a cobertura
integral
– A distribuição aleatória (sorteio) é justa e
transparente
•
Capacidade limitada de implementação
– A introdução gradual oferece a todos a mesma
chance de serem os primeiros
•
Inexistência de evidências sobre qual a melhor
alternativa
– Distribuição aleatória para alternativas com a mesma
chance ex ante de sucesso
17
Oportunidades para a
aleatorização (2)
•
•
•
Adesão ao programa existente não é completa
– Fornecer informações ou incentivos para a adesão
de alguns
Um novo programa piloto
– Boa oportunidade de testar o desenho antes de
expandi-lo
Mudanças operacionais em programas em
andamento
– Boa oportunidade de testar as mudanças antes de
expandi-las
– Introduzir innovaçoes de manera aleatoria
18
Aleatorização
em diferentes níveis
– Individual (crianças)
– Modalidades (futebol, luta,
dança etc.)
– Turmas
– Vilas Olímpicas
– Comunidades
– Distritos/Bairros
19
Aleatorização individual
ou em grupo?
•
A aleatorização é feita no mesmo nível de
intervenção
•
Mais fácil obter amostras grandes o bastante se os
indivíduos forem aleatorizados
Aleaorização individual
Aleaorização de grupos
Unidade de Aleatorização
• A aleatorização em nível mais alto (e.g. escola ou VO)
às vezes é necessária:
– Limitações políticas a tratamentos diferenciados na
comunidade
– Limitações práticas – confusão para implementar
diferentes versões
– Os efeitos sobre unidades vizinhas podem demandar uma
aleatorização em nível mais alto
• Aleatorizar ao nível de grupo requer muitos grupos
por causa da correlação dentro da comunidade
21
Elementos do desenho
experimental
População alvo
Crianças de áreas pobres/vulneráveis
Participantes potenciais
Crianças de 6 a 15 anos
Esportes coletivos
Amostra de avaliação
Alocação aleatória
Grupo de Tratamento
• Participantes

Grupo de Controle
Desistentes
22
Validade Externa e Interna (1)
• Validade externa
– A amostra é representativa da população total
– Os resultados na amostra representam os resultados na
população
– Podemos aplicar as lições a toda a população
• Validade interna
– O efeito estimado da intervenção ou do programa sobre a
população avaliada reflete o impacto real naquela
população
– Ou seja, os grupos de intervenção e de controle são
comparáveis
23
Validade Externa e Interna(2)
• Uma avaliação pode ter validade interna sem
validade externa
– Exemplo: extrapolar os resultados de uma avaliação
randomizada de um incentivo às empresas informais na
área urbana para se registarem para um programa
semelhante nas áreas rurais
• Uma avaliação sem validade interna não pode ter
validade externa
– Se você desconhece se um programa funciona em um
local, então você não sabe nada sobre se ele funciona em
qualquer outro lugar.
24
Validade externa & interna
População Nacional
Randomização
Amostras da
População Nacional
Randomização
25
Validade interna (APENAS?)
População
Estratificação
Estrato do População
Amostras do Estrato
da População
Randomização
26
Representativo porém
enviesado: inútil
População Nacional
Randomização
Distribuição Enviesada
INÚTIL!
27
Exemplo: programa para um público
específico, validade interna
Amostra de crianças
vulneráveis
Distribuição Randômica
28
Vantagens dos
“experimentos”
• Impacto causal claro e confiável
• Em relação a outros métodos
– Muito mais fácil de analisar
– Mais barato (tamanhos menores de amostra)
– Mais fácil de explicar
– Mais convincente para os formuladores de política
– Metodologicamente incontroverso
29
E se houver restrições sobre a
aleatorização?
• Limitações orçamentárias: randomizar entre os mais
necessitados
• Limitações de capacidade de implantação:
randomizar quem recebe primeiro... (ou a seguir se
você já houver começado)
• Promover (propaganda mesmo!) o programa
aleatoriamente para alguns, não para outros...
(participantes fazem suas próprias escolhas sobre
adoção)
30
Divulgação Aleatória
(Desenho de Encorajamento)
• Quem recebe a divulgação tem maior chance de
participar
• Como quem recebe foi escolhido aleatoriamente,
não há relação com características observáveis
não observáveis dos participantes
– Compare os resultados médios dos dois grupos:
com / sem divulgação
– Efeito da oferta do programa (Intenção de Tratar)
– Efeito da intervenção (Tratamento Médio no Tratado)
– ATT= efeito da oferta do programa / proporção dos
que aderiram
Aleatorização
Alocado para
tratamento
Alocado para
controle
Diferença
Impacto:
efeito médio
do tratamento
sobre os
tratados
Proporção
tratada
100%
0%
100%
100%
Resultado
médio
103
Não-tratados
Tratados
Impacto da alocação
80
23
23/100%=23
Estimativa da intenção
de tratar
Tratamento médio
sobre os tratados
Incentivo randômico
Incentivados
Não
incentivados
Diferença
Impacto:
efeito médio
do tratamento
sobre os que
aderiram
Proporção
tratada
70%
30%
40%
100%
Resultado
100
Não tratados
(não aderiram)
Tratados
(aderiram)
Impacto do incentivo
92
8
8/40%=20
Estimativa da intenção
de tratar
Tratamento médio
sobre os que aderiram
Cuidado com…
• Cálculo incorreto da amostra
– Randomizar um distrito para tratamento e outro
para controle e calcular o tamanho da amostra
sobre o número de pessoas que forem entrevistadas
• Coleta de dados diferentes no tratamento e no
controle
• Contagem dos que foram distribuídos para
tratamento mas não aderiram ao programa como
controle – não desfaça sua randomização!!!
34
Quando é que é realmente
impossível?
O tratamento já foi alocado e anunciado
e não há possibilidade de expansão do tratamento
O programa já acabou (retrospectiva)
Já há adesão universal*
O programa é nacional e não exclui ninguém*
A amostra é muito pequena para ser válida
2/1/10
3535
Download

(+) Impacto do programa