AULA Estudos de Teste Diagnóstico 1. Quais as características que um instrumento diagnóstico deve ter? • Validade e Confiabilidade 2. Desenvolvimento de teste diagnóstico – como é feito? Validade diagnóstica • O processo de VALIDAÇÃO é um processo de testar uma hipótese – “se alguém tem determinado atributo e meu teste mede este atributo, meu teste terá validade” • Tipos de VALIDADE: • Validade de face ou conteúdo – inferências possíveis • Validade de construto – objetivo x subjetivo • Validade de critério (sensibilidade e especificidade) Comparação com um padrão (padrão-ouro) Artigo 1 • 1. Moraes & Reichenheim. Validade do exame clínico do recém-nascido para a estimação da idade gestacional: uma comparação do escore New Ballard com a data da última menstruação e ultrasonografia. Cad Saúde Pública. 2000;16(1):83-94. Instrumentos para avaliar idade gestacional: Data da última menstruação – DUM - tempo Ultrassonografia – exame de imagem – antropometria Escore New Ballard – sinais físicos e neurológicos – maturidade do RN Validade do New Ballard Avaliação do desempenho de um instrumento diagnóstico Possíveis Resultados de um Instrumento Diagnóstico para Identificar Atributo Atributo (padrão-ouro) PRESENTE Positivo TESTE a Verdadeiro positivo c Negativo Falso negativo TOTAL Atributo + AUSENTE TOTAL b Falso Testes positivos positivo d Verdadeiro negativo Atributo - Testes negativos a+b+c+d Propriedades do teste – Sensibilidade – dado que existe atributo, qual a probabilidade do teste acertar? Padrão-ouro: USG concordante (72) Prevalência PT no grupo estudado: 30% Se=50% RNPT(22) New + Ballard TOTAL RNT (50) 11 Verdadeiro positivo 11 Falso negativo Atributo+ Atributo - Propriedades do teste – Especificidade – dado que não existe atributo, qual a probabilidade do teste acertar? Padrão-ouro: USG concordante (72) Prevalência PT no grupo estudado: 30% Sp=90% RNPT (22) TESTE 5 + Falso positivo 45 TOTAL RNT (50) Verdadeiro negativo Atributo+ Atributo - Valores preditivos – dado que o teste foi positivo ou negativo, qual a probabilidade de acerto? PRESENTE TESTE + Verdadeiro positivo - Falso negativo TOTAL Atributo+ AUSENTE TOTAL Falso positivo Testes positivos Verdadeiro negativo Atributo - Testes negativos Valores preditivos Maternidade IFF Prevalência no grupo estudado: 30% Em 1.000 puérperas – 300 PT VPP = 150/220 =69% VPN = 630/780 = 80% TESTE + - HIV+ (300) HIV neg (700) TOTAL 150 70 Verdadeiro positivo Falso positivo 220 Testes positivos 150 630 Falso negativo Verdadeiro negativo Se=50% SP=90% 780 Testes negativos Mudança do valor preditivo de acordo com a prevalência Maternidade Baixo risco Prevalência RNPT= 9% 1.000 puérperas - 90 RNPT VPP = 45/126 = 35% VPN = 819/864 = 95% + TESTE TOTAL PT+ (90) RNT(910) 45 81 Verdadeiro positivo Falso positivo 45 819 Falso negativo Verdadeiro negativo Se=50% SP=90% TOTAL 126 Testes positivos 864 Testes negativos Confiabilidade dos testes diagnósticos Coeficiente kappa Medida de concordância: K = Proporção observada – Proporção esperada 1 – proporção esperada K= 1 – concordância perfeita K ≥ 0,80 – excelente concordância 0,60≤K<0,80 – boa concordância 0,40 ≤K<0,60 – concordância razoável K < 40 – concordância ruim Cálculo do kappa – concordância entre dois neonatologistas κ = 91%– 65% = 0,74 1 – 65% Artigo 2 • Castro CB, Costa PA, Ruffino-Netto A, Maciel EL, Kritski AL. Avaliação de um escore clínico para rastreamento de suspeitos de tuberculose pulmonar. Rev Saude Publica. 2011;45(6):1110-6. Diferentes pontos de corte para um mesmo teste diagnóstico: sensibilidade ou especificidade? Curva ROC Diferentes testes combinados • Não existe teste diagnóstico com sensibilidade e especificidade = 100 % • O clínico não pode se basear em apenas um teste para diagnosticar uma doença. • Os testes múltiplos aumentam a qualidade do diagnóstico. • Podem ser feitos: • em paralelo ou simultâneos (OU) • em série ou sequência (E) Testes simultâneos (“ou”) Realizam-se os dois testes simultaneamente: O paciente é considerado positivo se qualquer resultado é positivo (teste A ou B) São utilizados: • quando há urgência de um diagnóstico • quando os testes disponíveis não têm sensibilidade ótima ou dificuldade de acesso • faz aumentar a sensibilidade e diminuir a especificidade (corre-se o risco de tratar pacientes que não têm a doença) • faz aumentar o VPN e diminuir o VPP Investigação de tuberculose em sistema prisional (supondo uma prevalência de 20%) • Dois testes: • A - baciloscopia do escarro (SE=80% e especificidade=80%) • B - Rx tórax (SE=90% e especificidade=90%) A 200 800 + 160 160 - 40 640 B 200 800 + 180 80 - 20 720 Sensibilidade = 98% Diminuo especificidade Downloaded from: StudentConsult (on 16 July 2010 03:03 PM) © 2005 Elsevier Testes em sequência (“e”) Realiza-se o primeiro teste: Somente os positivos ao primeiro teste são encaminhados a um segundo teste São utilizados: quando não há urgência, quando um dos testes é desconfortável, invasivo ou caro • deve-se usar primeiro o de maior sensibilidade / mais barato / menos invasivo. • o segundo teste é o mais específico e só é realizado se o anterior for positivo • faz aumentar o VPP Algoritmo para diagnóstico da infecção pelo HIV Validade da sequência de testes Aumento especificidade Diminuo sensibilidade