PLAUSIBILIDADE, PROBABILIDADE E
CAUSALIDADE NA AVALIAÇÃO EM
SAÚDE
Novembro de 2009
Luiz Antonio B. Camacho
DEMQS-ENSP-FIOCRUZ
Análise de causalidade na
avaliação
 em que medida mudanças observadas
(incluindo indiretas e não intencionais) no
estado de saúde podem ser atribuídas às
intervenções em saúde ou a fatores
externos ao programa?
Modelo Geral de Causalidade
(Rothman et
al., 1986)
 Causa suficiente: conjunto(s) mínimo(s) de
condições (causas componentes) que
inevitavelmente determina um evento
 Causas necessárias: componentes obrigatórios
em todas as causas suficientes
 Intervenções podem prescindir do
conhecimento completo das causas
suficientes, e basear-se apenas no
conhecimento de uma causa necessária, ou de
componentes.
Critérios de A.B.Hill (1965) para
definição de associação causal
 Temporalidade
 Força da associação
 Plausibilidade científica
 Gradiente
 Coerência
 Consistência
 Analogia
 Especificidade
 Evidência experimental
Critérios de A.B.Hill (1965) para
definição de associação causal
TEMPORALIDADE: causa postulada deve preceder
efeito atribuído
 único dos critérios que é essencial
 Problemas:
 sequencia temporal pode não ser aparente (como
nos estudos seccionais);
 ou pode parecer invertida: causalidade reversa
(ex., pródromos de doença levando à exposição,
seguida pelo aparecimento de manifestações
clinicas (programas de rastreamento de doenças)
Critérios de A.B.Hill (1965) para definição de
associação causal (CONT.)
PLAUSIBILIDADE CIENTÍFICA:
 conhecimento existente sobre o fenômeno dá
sentido às associações.
 Limitada pelo conhecimento corrente
 Ex.: revacinação com BCG em escolares
prometida efeito biologicamente plausível;
 Avaliação do programa de revacinação não
confirmou efetividade esperada.
Critérios de A.B.Hill (1965) para definição de
associação causal (CONT.)
COERÊNCIA:
 Inferencia causal não conflita com o
conhecimento sobre a historia natural da
doença (nem com o modelo lógico do
programa)
ANALOGIA: semelhança com outros cenários com
evidências de efetividade de intervenções
Critérios de A.B.Hill (1965) para definição de associação
causal (CONT.)
FORÇA DA ASSOCIAÇÃO entre intervenção e desfechos
de interesse
 associações estatísticas fortes seriam mais
dificilmente explicáveis por viés, variáveis de
confusão e pelo acaso.
 Exceções: Associações de fraca magnitude como
tabagismo e doença cardiovascular podem ser de
base para intervenções em saúde.
 Associações fortes podem resultar em parte de
variáveis de confusão não reconhecidas ou não
controladas devidamente
Critérios de A.B.Hill (1965) para definição de associação
causal (CONT.)
“GRADIENTE” DA ASSOCIAÇÃO:
magnitude da associação proporcional à
intensidade e duração da intervenção costuma
aumentar confiança na inferencia causal.
Gradientes pode não ser linear nem
monotônico.
Nivel limiar de exposição (Rothman et al.,
2008)
Critérios de A.B.Hill (1965) para definição de associação
causal (CONT.)
ESPECIFICIDADE:
poucos desfechos para uma causa postulada (vice-versa)
Ex.: Rastreamento de câncer com sigmoidoscopia associado à
redução de mortalidade por câncer de reto e colon distal, mas
não à redução a outros tipos de câncer de colon (Weiss, 2002).
CONSISTÊNCIA:
 Resultados da intervenção replicadas em cenários diferentes
 dias nacionais de vacinação contra pólio e redução drástica da
polio em muitos países;
 sucesso da promoção de condom na redução de transmissão
do HIV pode ser limitado por fatores culturais e sócioeconômicos
Critérios de A.B.Hill (1965) para definição de associação
causal (CONT.)
EVIDÊNCIA EXPERIMENTAL:
 intervenções aplicadas e desfechos observados
em condições controladas por pesquisador.
 Tão bom para sustentar inferência causal
quanto o modelo lógico em que se baseia
drenagem de pântanos pode causar a redução
de malária, mas seria inadequado inferir
evidência de causalidade dos miasmas (Poole,
1999).
Abordagens quantitativas e qualitativas
ABORDAGEM QUANTITATIVA medidas de efeito definidas
segundo lógica contrafactual: grupo de referencia
(sem intervenção) representa o que teria ocorrido na
ausencia da exposição.
Em contraste, ABORDAGEM QUALITATIVA se baseia na
investigação do modus operandi para analisar
causalidade (Mohr, 1995).
Enfatiza a coleta e análise detalhada de relações entre
grande número de elementos em poucas unidades de
observação.
Sua validade para avaliação em saúde dependeria do
aprofundamento na análise dos mecanismos de
atuação das intervenções na produção de resultados.
Contribui no “insight” e nas evidências de congruência
a que se referem Habicht, Victora & Vaughan .
Indicadores de impacto
(“exposição” é fator de proteção)
FPE: fração prevenida nos expostos à intervenção
(I0 – I1)/I0 = 1 - RR
I1: incidência em expostos
I0 : incidência em não expostos
IT : incidência na população
RR : risco relativo
(I0 – I1)/I0 = p(1 – RR )
FPP: fração prevenida na população
p : proporção de expostos na população
Métodos quantitativos na avaliação em saúde
Abordagens quantitativas na avaliação em saúde
utilizam
 (1) estratégias de coleta dos dados para obter
evidências de associação entre intervenções e
desfechos controlando a influência de fatores
externos (variáveis de confusão e viés); e
 (2) técnicas analíticas baseadas na
variabilidade de medidas de atributos
selecionados para representar os elementos
considerados relevantes no modelo lógico do
programa.
Métodos quantitativos na avaliação em saúde
Plausibilidade e probabilidade (Habicht, Victora &
Vaughan) e estratégias de controle de fatores
que afetam a validade interna de um estudo:
 Avaliação de plausibilidade: observador
estrutura observações de forma a delimitar
grupos para a comparação indicada nos
objetivos.
 Avaliação de probabilidade: randomização
maximiza a confiança em que diferenças entre
grupos definidos pela intervenção são
atribuíveis à intervenção
Almeida Fº N & Rouquayrol MZ. Fundamentos Metodológicos da
Epidemiologia. In Rouquayrol MZ (ed.) Epidemiologia & Saúde, 4ª
ed. Rio de Janeiro: MEDSI, 1993.
“Hierarquia” dos tipos de estudos segundo poder analítico
I Revisões sistemáticas e metanálises de ensaios clínicos
randomizados comparáveis (homogeneidade), com validade interna
e mínima possibilidade de erro alfa.
Ensaios clínicos randomizados com desfecho e magnitude de
efeito clinicamente relevantes, correspondentes à hipótese
principal em teste, com adequado poder e mínima possibilidade de
erro alfa.
II Revisões sistemáticas de estudos de casos e controles e de coortes
Ensaios clínicos randomizados de menor qualidade metodológica
Estudos de intervenção não-randomizados
Coortes e estudos de casos e controles bem conduzidos, com
baixo risco de vieses e acaso
III Estudos não-analíticos: séries e relatos de casos
IV Opinião de especialistas
Limites à validade interna
(p.ex., estudos de avaliação de programas)
 1. Viés, vício, tendenciosidade
i. alocação das unidades de análise privilegia
subgrupos com probabilidade diferenciada de
apresentar o desfecho
Ex.: voluntários costumam diferir nos fatores de
risco daqueles que recusam participação
Limites à validade interna
1. Viés, vício, tendenciosidade
ii. erro sistemático na classificação de exposição ou
de desfecho
Ex.: antecedentes vacinais ou diagnóstico etiológico
das meningites
Limites à validade interna de estudos de
comparação entre grupos
2. Confusão ou confundimento (“mistura de
efeitos”):
 Fatores prognósticos explicam parte da
associação aparente entre intervenção e
resultados
 Ex.: diferenças etárias entre as crianças vacinadas
e as não vacinadas.
Controles históricos ou “antes e depois”
Coronary care unit versus hospital mortality in acute myocardial
infarction. Robinson, J.S. Israel J. Med. Sci. 5(4):772-776, 1969.
 Os primeiros 200 pacientes com IAM admitidos na UC do Royal
Perth Hospital, comparados com 200 pacientes consecutivos,
admitidos com IAM no mesmo hospital, imediatamente antes
da abertura da UC.
The effects of the DRG-Based Prospective System on Quality of Care for
Hospitalized Medicare Patients. Kahn KL, Rubenstein LV, Draper D, Kosecoff J,
Rogers WH, Keeler EB & Brook RH. JAMA 264 (15):1953-1994.
 Objetivos:
 avaliar a qualidade da atenção hospitalar pelo sistema público aos
idosos (Medicare) antes e depois da implantação do sistema de prépagamento (PPS), segundo grupos diagnósticos em 1982.
Estudo caso-controle
Efetividade de programa de rastreamento de câncer no estômago no Japão.
Oshima et al., 1986
 Avaliação de efetividade do rastreamento para câncer de estômago
em uma pequena cidade rural do Japão, com programa de
rastreamento desde 1962.
Óbitos por Ca de estômago pareados a indivíduos vivos de mesmo
sexo, idade e distrito.
Assessment of the Direct Effectiveness of BC Meningococcal Vaccine in
Rio de Janeiro, Brazil: A Case-Control Study (Noronha et al.,1991)
 Study estimated the protective effect of the Cuban vaccine among
children living in the metropolitan region of Rio de Janeiro
 Casos de meningite meningocócica B e C; controles: outras
meningites (não meningocócicas) internadas no mesmo hospital
(HESS)
Acompanhamento de coorte (de intervenção)
Grupo de
observação
Expostos
(vacinados)
Não expostos
t0
Doentes
Não
doentes
Expostos
a
b
Não
expostos
c
d
t1
tempo
Pitfalls in Evaluating the Impact of Coronary Care Units on
Mortality From Myocardial Infarctions.
Gordis, L.; Naggan, L. & Tonascia, J. The Johns Hopkins Medical Journal 141:287-295, 1977.
Amostra de prontuários revisados para estimar letalidade intrahospitalar de IAM e sua relação com tratamento em Unidades
Coronarianas (UCs).
Hospitais variavam na capacidade diagnóstica: com UC melhor
capacidade e melhor registro
Viés de seleção de raça para hospitais com UC
Arritmia aumentou chances de admissão em UC, enquanto ICC e
choque não influenciaram
Hospitais sem UC: óbito na emergência antes de admissão na
enfermaria
Transferência de pacientes graves para hospitais com UC, inflando
letalidade destes.
Ensaio clínico randomizado
Critérios de elegibilidade
População com a
condição de
interesse
exposta ao risco
Elegíveis
s
R
A
N
D
O
M
I
Z
A
Ç
Ã
O
Desfechos
Intervenção
experimental
Grupo de
controle
Favorável
Desfavorável
Favorável
Desfavorável
A randomised trial of home-versus-hospital management for
patients with suspected myocardial infarction. Hill, J.D.; Hampton, J.R. &
Mitchell, J.R.A. The Lancet 22 April 1978:837-841.
Questão dos clínicos gerais chamados para
atendimento domiciliar de suspeitos de IAM:
excluídos os pacientes cujas condições clínicas ou
familiares indicassem hospitalização, seria possível
manter o paciente de IAM sob tratamento na sua
residência?
Durante 4 anos de estudo, 264 (76%) dos 349 pacientes elegíveis foram
alocados aleatoriamente nos grupos de comparação: tratamento em casa
ou na UC segundo um plano pré-estabelecido.
Sexo masculino
IAM prévio
Angina prévia
ECG na residência
alteração anterior recente
alteração inferior recente
ritmo sinusal + ectopia ventricular
outras arritmias
inconclusivo
normal
Idade (média em anos)
Residência (n=132)% Hospital (n=132)%
79
75
28
25
33
33
17
14
11
4
55
14
58,6
17
13
6
7
61
9
59,9
Tabela 6: Mortalidade (%) em 6 semanas dos
pacientes com suspeita de IAM.
Todos os pacientes
Com diagn. final de IAM
confirmado ou provável
NÃO
Residência Hospital randomizados Total
13
11
26
15
20
18
37
24
Hill et al. 1978.: Resultados
Comparabilidade dos grupos foi assegurada pela
randomização: mortalidade na residência e no
hospital podem ser comparadas diretamente
Análise do subconjunto com diagnóstico confirmado:
maior margem de certeza
Mortalidade nos não randomizados: limites à validade
externa dos resultados
Ensaios pragmáticos e serviços de saúde
 Compara intervenções clinicamente relevantes
 Maior diversidade de participantes (critérios de
elegibilidade mais flexíveis do que ensaios
explanatórios)
 Observações de múltiplos desfechos de interesse
 Tendem a ser maiores (maior n)
de menor duração, menor custo,
minimizam interferência sobre rotina clínica, enfatizam
aplicabilidade dos resultados (efetividade)
Estudos de intervenção “pragmáticos”
 Design of the Brazilian BCG-REVAC trial against
tuberculosis: a large, simple randomized
community trial to evaluate the impact on
tuberculosis of BCG revaccination at school age
 Barreto, M.L.; Rodrigues, L.C.; Cunha, S.S. et al.
Controlled Clinical Trials 23 (2002) 540–553
Effect of BCG revaccination on incidence of tuberculosis
in school-aged children in Brazil: the BCG-REVAC
cluster-randomised trial. Rodrigues et al.,Lancet 2005; 366: 1290–95
 Objetivos do estudo:
estimar a efetividade do BCG em escolares contra
tuberculose em população com alta cobertura
vacinal pelo BCG;
prover evidência científica para fundamentar
decisões de política de imunização.
Pragmatic controlled clinical trials in primary care: the struggle
between external and internal validity
Godwin et al. BMC Medical Research Methodology 2003, 3:28
Two pragmatic randomized controlled trials on
interventions in the management of hypertension in
primary care.
Summary: Clinical trials conducted in community practices
present investigators with difficult methodological
choices related to maintaining a balance between
internal validity and external validity.
Methodological purity can lead to clinically meaningless
results, while attempting to achieve full generalizability
can result in invalid and unreliable results.
Achieving a creative tension between the two is crucial.
Habicht, Victora & Vaughan, 1999