PLAUSIBILIDADE, PROBABILIDADE E CAUSALIDADE NA AVALIAÇÃO EM SAÚDE Novembro de 2009 Luiz Antonio B. Camacho DEMQS-ENSP-FIOCRUZ Análise de causalidade na avaliação em que medida mudanças observadas (incluindo indiretas e não intencionais) no estado de saúde podem ser atribuídas às intervenções em saúde ou a fatores externos ao programa? Modelo Geral de Causalidade (Rothman et al., 1986) Causa suficiente: conjunto(s) mínimo(s) de condições (causas componentes) que inevitavelmente determina um evento Causas necessárias: componentes obrigatórios em todas as causas suficientes Intervenções podem prescindir do conhecimento completo das causas suficientes, e basear-se apenas no conhecimento de uma causa necessária, ou de componentes. Critérios de A.B.Hill (1965) para definição de associação causal Temporalidade Força da associação Plausibilidade científica Gradiente Coerência Consistência Analogia Especificidade Evidência experimental Critérios de A.B.Hill (1965) para definição de associação causal TEMPORALIDADE: causa postulada deve preceder efeito atribuído único dos critérios que é essencial Problemas: sequencia temporal pode não ser aparente (como nos estudos seccionais); ou pode parecer invertida: causalidade reversa (ex., pródromos de doença levando à exposição, seguida pelo aparecimento de manifestações clinicas (programas de rastreamento de doenças) Critérios de A.B.Hill (1965) para definição de associação causal (CONT.) PLAUSIBILIDADE CIENTÍFICA: conhecimento existente sobre o fenômeno dá sentido às associações. Limitada pelo conhecimento corrente Ex.: revacinação com BCG em escolares prometida efeito biologicamente plausível; Avaliação do programa de revacinação não confirmou efetividade esperada. Critérios de A.B.Hill (1965) para definição de associação causal (CONT.) COERÊNCIA: Inferencia causal não conflita com o conhecimento sobre a historia natural da doença (nem com o modelo lógico do programa) ANALOGIA: semelhança com outros cenários com evidências de efetividade de intervenções Critérios de A.B.Hill (1965) para definição de associação causal (CONT.) FORÇA DA ASSOCIAÇÃO entre intervenção e desfechos de interesse associações estatísticas fortes seriam mais dificilmente explicáveis por viés, variáveis de confusão e pelo acaso. Exceções: Associações de fraca magnitude como tabagismo e doença cardiovascular podem ser de base para intervenções em saúde. Associações fortes podem resultar em parte de variáveis de confusão não reconhecidas ou não controladas devidamente Critérios de A.B.Hill (1965) para definição de associação causal (CONT.) “GRADIENTE” DA ASSOCIAÇÃO: magnitude da associação proporcional à intensidade e duração da intervenção costuma aumentar confiança na inferencia causal. Gradientes pode não ser linear nem monotônico. Nivel limiar de exposição (Rothman et al., 2008) Critérios de A.B.Hill (1965) para definição de associação causal (CONT.) ESPECIFICIDADE: poucos desfechos para uma causa postulada (vice-versa) Ex.: Rastreamento de câncer com sigmoidoscopia associado à redução de mortalidade por câncer de reto e colon distal, mas não à redução a outros tipos de câncer de colon (Weiss, 2002). CONSISTÊNCIA: Resultados da intervenção replicadas em cenários diferentes dias nacionais de vacinação contra pólio e redução drástica da polio em muitos países; sucesso da promoção de condom na redução de transmissão do HIV pode ser limitado por fatores culturais e sócioeconômicos Critérios de A.B.Hill (1965) para definição de associação causal (CONT.) EVIDÊNCIA EXPERIMENTAL: intervenções aplicadas e desfechos observados em condições controladas por pesquisador. Tão bom para sustentar inferência causal quanto o modelo lógico em que se baseia drenagem de pântanos pode causar a redução de malária, mas seria inadequado inferir evidência de causalidade dos miasmas (Poole, 1999). Abordagens quantitativas e qualitativas ABORDAGEM QUANTITATIVA medidas de efeito definidas segundo lógica contrafactual: grupo de referencia (sem intervenção) representa o que teria ocorrido na ausencia da exposição. Em contraste, ABORDAGEM QUALITATIVA se baseia na investigação do modus operandi para analisar causalidade (Mohr, 1995). Enfatiza a coleta e análise detalhada de relações entre grande número de elementos em poucas unidades de observação. Sua validade para avaliação em saúde dependeria do aprofundamento na análise dos mecanismos de atuação das intervenções na produção de resultados. Contribui no “insight” e nas evidências de congruência a que se referem Habicht, Victora & Vaughan . Indicadores de impacto (“exposição” é fator de proteção) FPE: fração prevenida nos expostos à intervenção (I0 – I1)/I0 = 1 - RR I1: incidência em expostos I0 : incidência em não expostos IT : incidência na população RR : risco relativo (I0 – I1)/I0 = p(1 – RR ) FPP: fração prevenida na população p : proporção de expostos na população Métodos quantitativos na avaliação em saúde Abordagens quantitativas na avaliação em saúde utilizam (1) estratégias de coleta dos dados para obter evidências de associação entre intervenções e desfechos controlando a influência de fatores externos (variáveis de confusão e viés); e (2) técnicas analíticas baseadas na variabilidade de medidas de atributos selecionados para representar os elementos considerados relevantes no modelo lógico do programa. Métodos quantitativos na avaliação em saúde Plausibilidade e probabilidade (Habicht, Victora & Vaughan) e estratégias de controle de fatores que afetam a validade interna de um estudo: Avaliação de plausibilidade: observador estrutura observações de forma a delimitar grupos para a comparação indicada nos objetivos. Avaliação de probabilidade: randomização maximiza a confiança em que diferenças entre grupos definidos pela intervenção são atribuíveis à intervenção Almeida Fº N & Rouquayrol MZ. Fundamentos Metodológicos da Epidemiologia. In Rouquayrol MZ (ed.) Epidemiologia & Saúde, 4ª ed. Rio de Janeiro: MEDSI, 1993. “Hierarquia” dos tipos de estudos segundo poder analítico I Revisões sistemáticas e metanálises de ensaios clínicos randomizados comparáveis (homogeneidade), com validade interna e mínima possibilidade de erro alfa. Ensaios clínicos randomizados com desfecho e magnitude de efeito clinicamente relevantes, correspondentes à hipótese principal em teste, com adequado poder e mínima possibilidade de erro alfa. II Revisões sistemáticas de estudos de casos e controles e de coortes Ensaios clínicos randomizados de menor qualidade metodológica Estudos de intervenção não-randomizados Coortes e estudos de casos e controles bem conduzidos, com baixo risco de vieses e acaso III Estudos não-analíticos: séries e relatos de casos IV Opinião de especialistas Limites à validade interna (p.ex., estudos de avaliação de programas) 1. Viés, vício, tendenciosidade i. alocação das unidades de análise privilegia subgrupos com probabilidade diferenciada de apresentar o desfecho Ex.: voluntários costumam diferir nos fatores de risco daqueles que recusam participação Limites à validade interna 1. Viés, vício, tendenciosidade ii. erro sistemático na classificação de exposição ou de desfecho Ex.: antecedentes vacinais ou diagnóstico etiológico das meningites Limites à validade interna de estudos de comparação entre grupos 2. Confusão ou confundimento (“mistura de efeitos”): Fatores prognósticos explicam parte da associação aparente entre intervenção e resultados Ex.: diferenças etárias entre as crianças vacinadas e as não vacinadas. Controles históricos ou “antes e depois” Coronary care unit versus hospital mortality in acute myocardial infarction. Robinson, J.S. Israel J. Med. Sci. 5(4):772-776, 1969. Os primeiros 200 pacientes com IAM admitidos na UC do Royal Perth Hospital, comparados com 200 pacientes consecutivos, admitidos com IAM no mesmo hospital, imediatamente antes da abertura da UC. The effects of the DRG-Based Prospective System on Quality of Care for Hospitalized Medicare Patients. Kahn KL, Rubenstein LV, Draper D, Kosecoff J, Rogers WH, Keeler EB & Brook RH. JAMA 264 (15):1953-1994. Objetivos: avaliar a qualidade da atenção hospitalar pelo sistema público aos idosos (Medicare) antes e depois da implantação do sistema de prépagamento (PPS), segundo grupos diagnósticos em 1982. Estudo caso-controle Efetividade de programa de rastreamento de câncer no estômago no Japão. Oshima et al., 1986 Avaliação de efetividade do rastreamento para câncer de estômago em uma pequena cidade rural do Japão, com programa de rastreamento desde 1962. Óbitos por Ca de estômago pareados a indivíduos vivos de mesmo sexo, idade e distrito. Assessment of the Direct Effectiveness of BC Meningococcal Vaccine in Rio de Janeiro, Brazil: A Case-Control Study (Noronha et al.,1991) Study estimated the protective effect of the Cuban vaccine among children living in the metropolitan region of Rio de Janeiro Casos de meningite meningocócica B e C; controles: outras meningites (não meningocócicas) internadas no mesmo hospital (HESS) Acompanhamento de coorte (de intervenção) Grupo de observação Expostos (vacinados) Não expostos t0 Doentes Não doentes Expostos a b Não expostos c d t1 tempo Pitfalls in Evaluating the Impact of Coronary Care Units on Mortality From Myocardial Infarctions. Gordis, L.; Naggan, L. & Tonascia, J. The Johns Hopkins Medical Journal 141:287-295, 1977. Amostra de prontuários revisados para estimar letalidade intrahospitalar de IAM e sua relação com tratamento em Unidades Coronarianas (UCs). Hospitais variavam na capacidade diagnóstica: com UC melhor capacidade e melhor registro Viés de seleção de raça para hospitais com UC Arritmia aumentou chances de admissão em UC, enquanto ICC e choque não influenciaram Hospitais sem UC: óbito na emergência antes de admissão na enfermaria Transferência de pacientes graves para hospitais com UC, inflando letalidade destes. Ensaio clínico randomizado Critérios de elegibilidade População com a condição de interesse exposta ao risco Elegíveis s R A N D O M I Z A Ç Ã O Desfechos Intervenção experimental Grupo de controle Favorável Desfavorável Favorável Desfavorável A randomised trial of home-versus-hospital management for patients with suspected myocardial infarction. Hill, J.D.; Hampton, J.R. & Mitchell, J.R.A. The Lancet 22 April 1978:837-841. Questão dos clínicos gerais chamados para atendimento domiciliar de suspeitos de IAM: excluídos os pacientes cujas condições clínicas ou familiares indicassem hospitalização, seria possível manter o paciente de IAM sob tratamento na sua residência? Durante 4 anos de estudo, 264 (76%) dos 349 pacientes elegíveis foram alocados aleatoriamente nos grupos de comparação: tratamento em casa ou na UC segundo um plano pré-estabelecido. Sexo masculino IAM prévio Angina prévia ECG na residência alteração anterior recente alteração inferior recente ritmo sinusal + ectopia ventricular outras arritmias inconclusivo normal Idade (média em anos) Residência (n=132)% Hospital (n=132)% 79 75 28 25 33 33 17 14 11 4 55 14 58,6 17 13 6 7 61 9 59,9 Tabela 6: Mortalidade (%) em 6 semanas dos pacientes com suspeita de IAM. Todos os pacientes Com diagn. final de IAM confirmado ou provável NÃO Residência Hospital randomizados Total 13 11 26 15 20 18 37 24 Hill et al. 1978.: Resultados Comparabilidade dos grupos foi assegurada pela randomização: mortalidade na residência e no hospital podem ser comparadas diretamente Análise do subconjunto com diagnóstico confirmado: maior margem de certeza Mortalidade nos não randomizados: limites à validade externa dos resultados Ensaios pragmáticos e serviços de saúde Compara intervenções clinicamente relevantes Maior diversidade de participantes (critérios de elegibilidade mais flexíveis do que ensaios explanatórios) Observações de múltiplos desfechos de interesse Tendem a ser maiores (maior n) de menor duração, menor custo, minimizam interferência sobre rotina clínica, enfatizam aplicabilidade dos resultados (efetividade) Estudos de intervenção “pragmáticos” Design of the Brazilian BCG-REVAC trial against tuberculosis: a large, simple randomized community trial to evaluate the impact on tuberculosis of BCG revaccination at school age Barreto, M.L.; Rodrigues, L.C.; Cunha, S.S. et al. Controlled Clinical Trials 23 (2002) 540–553 Effect of BCG revaccination on incidence of tuberculosis in school-aged children in Brazil: the BCG-REVAC cluster-randomised trial. Rodrigues et al.,Lancet 2005; 366: 1290–95 Objetivos do estudo: estimar a efetividade do BCG em escolares contra tuberculose em população com alta cobertura vacinal pelo BCG; prover evidência científica para fundamentar decisões de política de imunização. Pragmatic controlled clinical trials in primary care: the struggle between external and internal validity Godwin et al. BMC Medical Research Methodology 2003, 3:28 Two pragmatic randomized controlled trials on interventions in the management of hypertension in primary care. Summary: Clinical trials conducted in community practices present investigators with difficult methodological choices related to maintaining a balance between internal validity and external validity. Methodological purity can lead to clinically meaningless results, while attempting to achieve full generalizability can result in invalid and unreliable results. Achieving a creative tension between the two is crucial. Habicht, Victora & Vaughan, 1999