Bioestatística Básica Secretaria de Estado de Saúde do Distrito Federal Escola Superior de Ciências da Saúde (ESCS) Paulo R. Margotto Prof. Do Curso de Medicina da ESCS www.paulomargotto.com.br Brasília, 12/6/2015 Entendendo bioestatística básica Autor(es): Paulo R. Margotto Estatística computacional: Uso do SPSS - o essencial Autor(es): Paulo R. Margotto Bioestatística Básica Programa: 1. Importância da Bioestatística 2. Variáveis 3. População e Amostras 4. Apresentação dos dados em tabelas 5. Medidas de Tendência Central 6. Distribuição Normal 7. Correlação e Regressão 8. Risco Relativo / Odds Ratio 9. Teste de Hipóteses 10. Exercício de Medicina Baseado em Evidências 11. Teste de Fisher 12. Teste t 13 Análise de Variância (ANOVA) 14 -Escolha de Teste Estatístico 15-Testes Estatísticos não Paramétricos 16- Sensibilidades/Especificidade/Curva ROC Margotto, PR (ESCS) Bioestatística Básica A condução e avaliação de uma pesquisa Comparação entre dois ou mais grupos ou amostras (grupo tratado / grupo controle) Depende, em boa parte, do conhecimento sobre Bioestatística Avaliação da eficácia do tratamento (significação) Estar alerta a: variáveis interferentes nos resultados ¤ Variações mostrais ¤ Diferenças entre grupos Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Os testes estatísticos são utilizados para: ¤ Comparar amostras (houve modificação dos grupos inicialmente semelhantes após o início da intervenção) ¤ Detectar variáveis interferentes ¤ Analisar se o tratamento depende de outras variáveis (peso, idade, sexo) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica A ciência não é um conhecimento definitivo sobre a realidade, mas é um conhecimento hipotético que pode ser questionado e corrigido. Ensinar ciências não significa apenas descrever fatos, anunciar leis e apresentar novas descobertas, mas Ensinar o método científico Maneira crítica e racional de buscar conhecimento Margotto, PR (ESCS) Vieira S., 1991. www.paulomargotto.com.br - - Variáveis (dados): - Qualitativas :(diferentes categorias sem valores numéricos): -Nominal:: sexo, cor, grupo sanguíneo, causa da morte -Ordinais: (ordenação natural): Grau de instrução, aparência, estágio da doença, status social - Quantitativos ou Contínuos: (dados expressos por nº): idade, altura, peso, renda familiar -Discretas( associação entre valores e números inteiros): idade em anos completos -Contínua (pode assumir qualquer valor no subconjunto de números reais): peso População e Amostra: - População: Conj. de elementos com determinada característica - Amostra: Subconjunto com menor nº de elementos - Independentes: grupo selecionados com tratamento distinto - Dependentes: para cada elemento do grupo tratado existe um grupo controle semelhante (sexo, idade, etc) - Comparação intra-individuo (o grupo submetido ao tratamento é o seu próprio controle) Bioestatística Básica Apresentação dos Dados em Tabelas: Componentes das tabelas: - - Título: Explica o conteúdo - Corpo: Formado pelas linhas e colunas dos dados - Cabeçalho: específica o conteúdo das colunas - Coluna indicadora: específica o conteúdo das linhas - Opcional: fonte, notas, chamadas Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Nascidos vivos no Maternidade do HRAS segundo o ano de registro Título Cabeçalho (separado do corpo por um traço horizontal) Ano de Registro 1998 (1) Freqüência 8328 Freqüência relativa 32,88 (8828/25494) 1999 (1) 8214 32,22 2000 (1) 8898 34,90 Coluna indicadora Total 25494 100 Fonte: Margotto, PR (2001) Nota: dados retirados do livro da sala de parto (1): os RN < 500g não foram incluídos. (chamadas) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Tabela de Contingência ou de Dupla Entrada (cada entrada é relativa a um dos fatores) Gestantes sem pré-natal/gestantes com pré-natal e mortalidade perinatal Fator Mortalidade Perinatal Total Sim Não Gestantes sem pré-natal 55 833 938 Gestantes com pré-natal 156 6720 6876 Permite calcular o risco, a freqüência (incidência) entre expostos e não expostos a um determinado fator (será discutido adiante). Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Tabelas de distribuição de freqüências: Peso ao nascer de nascidos vivos, em Kg - 2,522 3,200 1,900 4,100 4,600 3,400 2,720 3,720 3,600 2,400 1,720 3,400 3,125 2,800 3,200 2,700 2,750 1,570 2,250 2,900 3,300 2,450 4,200 3,800 3,220 2,950 2,900 3,400 2,100 2,700 3,000 2,480 2,500 2,400 4,450 2,900 3,725 3,800 3,600 3,120 2,900 3,700 2,890 2,500 2,500 3,400 2,920 2,120 3,110 3,550 2,300 3,200 2,720 3,150 3,520 3,000 2,950 2,700 2,900 2,400 3,100 4,100 3,000 3,150 2,000 3,450 3,200 3,200 3,750 2,800 2,720 3,120 2,780 3,450 3,150 2,700 2,480 2,120 3,155 3,100 3,200 3,300 3,900 2,450 2,150 3,150 2,500 3,200 2,500 2,700 3,300 2,800 2,900 3,200 2,480 - 3,250 2,900 3,200 2,800 2,450 - Menor peso: 1570g Maior peso: 4600g Como transformar está tabela em uma Tabela de Distribuição de Freqüência ? Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica - Tabelas de distribuição de freqüências: 3 colunas Definir as faixas de peso (Classes): Classe Ponto Médio Freqüência 1,5Ι— 2,0 1,75 3 2,0Ι— 2,5 2,25 16 2,5Ι— 3,0 2,75 31 3,0Ι— 3,5 3,25 34 3,5Ι— 4,0 3,75 11 4,0 Ι— 4,5 4,25 4 4,5Ι— 5,0 4,75 1 - Intervalo de classe (0,5Kg): intervalo coberto pela classe - Extremo de classe:limites dos intervalos de classe 1,5 Ι— 2,0: fechado a esquerda (não pertencem a classe os Valores 2; pertencem a classe os valores 1,5) - Ponto médio: soma dos extremos da classe ÷ 2 -N º de classes: K = 1+ 3,222 log n (em geral: 5-20) no exemplo: K = 1 + 3,222 log 100 = 7,444 (7 ou 8 classes) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Apresentação dos dados em gráficos -título (pode ser colocado tanto acima como abaixo) -escala (crescem da esquerda para a direita e de baixo para cima). - legendas devem ser colocadas à direita do gráfico. Bioestatística Básica Gráfico de barras: é usado para apresentar variáveis qualitativas ou variáveis ordinais. Veja no gráfico de barras os dado da tabela 1. Bioestatística Básica Gráfico de setores: é usado para apresentar variáveis qualitativas ou variáveis ordinais. Calcular os ângulos centrais das diversas categorias, marcando-os na circunferência e separando-os com o traçado de raios. Como calcular o ângulo central de cada categoria: 100 360 Freqüência relativa (f) valerá X e o ângulo central X = 360 x f 100 Bioestatística Básica Histograma: Os dados apresentados em tabelas de distribuição de freqüência são apresentados graficamente em histogramas. Frequência Peso ao nascer Bioestatística Básica BOX PLOT: a caixa é formada por -mediana (linha central): estimativa da tendência central a sua posição indica a presença de simetria (central) e próxima a dos percentis (assimetria) -percentis 25 e 75 (obtidos pelo método Tukey´s Hinges): amplitude interquartil-estima a Variabilidade dos dados -whiskers (bigodes de gatos): -valores máximos e mínimos (distribuição normal) -distribuição assimétrica: os dados máximo e mínimos se desviam do P25-P75 ->1,5 AIQ: valores discrepantes(outliers) ->2,5 AIQ: valores extremos (extremes-assinalados com asterisco) Bioestatística Básica Dias de internação na coleta da hemocultura por faixas de peso ao nascer Denise Nogueira da Gama Cordeiro Fig.1.Amplitude do EEG para o canal C3-C4 em microvolts. •A mediana da amplitude da “linha de base do EEG” foi significativamente maior •que a mediana da amplitude do EEG durante a administração do surfactante, •10, 20 e 30 minutos depois, em todos os casos. ( P<0.008) Box-plot Amplitude da linha de base é livre de medicação / surfactante durante os primeiros 10 minutos do estudo, seguido por administração de surfactante (SA) e 10, 20 e 30 minutos após a administração do surfactante. * Indica o nível significativo de P ≤ 0,008. Os outliers não são mostrados no box-plot. Box-plot Fig.1.Amplitude do EEG para o canal C3-C4 em microvolts. •A mediana da amplitude da “linha de base do EEG” foi significativamente maior •que a mediana da amplitude do EEG durante a administração do surfactante, •10, 20 e 30 minutos depois, em todos os casos. ( P<0.008) Amplitude da linha de base é livre de medicação / surfactante durante os primeiros 10 minutos do estudo, seguido por administração de surfactante (SA) e 10, 20 e 30 minutos após a administração do surfactante. * Indica o nível significativo de P ≤ 0,008. Os outliers não são mostrados no box-plot. Shangle CE, 2012 Bioestatística Básica Medidas de Tendência Central (Valor de ponto em torno do qual os dados se distribuem) Variância e Desvio Padrão: avalia o grau de dispersão quanto cada dado se desvia em relação a média) Média aritmética:soma dos dados nº deles (dá a abscissa do centro de gravidade do conjunto de dados) Peso ao nascer em Kg de 10 RN 2,5 2,0 3,0 4,0 3,0 1,0 1,5 - 3,5 1,5 2,5 - A média aritmética (representa-se por X é: 2,5+3,0+3,5+ ... 4,0 = 2,45 10 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Medidas de Tendência Central Média Aritmética Cálculo da média de dados em Tabela de Distribuição de Frequência Classe Ponto Médio Freqüência 1,5Ι— 2,0 1,75 3 2,0Ι— 2,5 2,25 16 2,5Ι— 3,0 2,75 31 3,0Ι— 3,5 3,25 34 3,5Ι— 4,0 3,75 11 4,0 Ι— 4,5 4,25 4 4,5Ι— 5,0 4,75 1 n=100 Média (X): ponto médio de cada classe x respectiva freqüência divido pelo n X = 1,75x3 + 2,25x16 + ... 4,25x4 + 4,75x1 = 300 3 Kg 100 100 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica - Medida de Tendência Central Medida de dispersão:indicadores do grau de variabilidade dos individuos em torno das medidas de tendência central Variância: Medir os desvios em relação a média (diferença de cada dado e a média) Não há média dos desvios pois sua soma é igual a zero Ex.: 0,4,6,8,7 X (média) : 0+4+6+8+7 = 25 = 5 5 5 X – X (desvio em relação a média) 0-5=-5 4 – 5 = -1 A soma dos desvios é igual a zero 6–5= 1 8–5= 3 (-5 + -1)+1+3+2= - 6 + 6 = 0 7–5= 2 - Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Medidas de Tendência Central Variância Soma dos quadrados dos desvios Dados X Desvios (X – X) Quadrado dos desvios (X – X) 2 0 -5 25 4 -1 1 6 1 1 8 3 9 7 2 4 x = 5 (x –x) = 0 (x – x) 2 = 40 A soma do quadrado dos desvios não é usada como medida de dispersão, porque o seu valor cresce com o nº de dados Grupo I: 60, 70 e 80 Kg - Grupo II: 60, 60, 70, 70, 80, 80 Kg Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Medidas de Tendência Central Variância Cálculo da soma dos quadrados dos desvios Grupo I Grupo II X (x – X) (x – X) 2 X (x – X) (x – X) 2 60 - 10 100 60 - 10 100 70 zero zero 60 - 10 100 80 10 100 70 zero zero 70 zero zero 80 10 100 80 10 100 zero 400 zero 200 Então, para medir a dispersão dos dados em relação à média, usa-se a variância (S2) que leva em consideração o n S2 = soma dos quadrados dos desvios n–1 Para os dados: 0, 4, 6, 8 e 7 a S2 = 40 = 40 = 10 5 –1 4 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica I Medidas de Tendência Central Desvio Padrão Raiz quadrada da variância, sendo representava por S; tem a mesma unidade de medida dos dados Ex.: 0,4,6,8,7. S2 (variância) = 10 s (desvio padrão): √10 = 3,16 Coeficiente de variância (CV) Razão entre o desvio padrão a a média x 100 CV = sx 100 X Ex.: Grupo I: 3,1,5 anos (x = 3 anos; s2 = 4; s=2) : CV = 66,7% Grupo II: 55,57,53 anos (x = 55 anos; s2 = 4; s = 2) : CV = 3,64% Vejam à dispersão dos dados em ambos os grupos é a mesma, mas os CV são diferentes (no grupo I a dispersão relativa é ALTA) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Distribuição Normal • Variáveis aleatórias: variam ao acaso (peso ao nascer) • Gráficos com 2 extremos um máximo e um mínimo e entre eles, uma distribuição gradativa (maioria dos valores ao redor da média) : Curva de Gauss: As medidas que originam a estes gráficos são variáveis com distribuição normal Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Distribuição Normal • Características: A variável (peso ao nascer) pode assumir qualquer valor real O Gráfico da distribuição normal é uma curva em forma de sino, simétrico em torno da média () (se lê “mi”). A área total da curva vale 1, significando que a probabilidade de ocorrer qualquer valor real é 1. Pelo fato da curva ser simétrica em torno da média, os valores maiores do que a média e os valores menores do que a média ocorrem com igual probabilidade. No SPSS, usamos o Kolmogorov-Smirnov ou Shapiro-Wilk na sua determinação Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Distribuição Normal Predicção de uma valor entre dois nº quaisquer: Ex.: A probabilidade de ocorrência de um valor > 0 é 0,5, mas qual é a probabilidade de ocorrer um valor entre 0 e z = 1,25? Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Distribuição Normal Predicção de uma valor Usar tabela de Distribuição Normal Como usar esta tabela? Localizar na 1a coluna o valor 1,2 Na 1a linha, está o valor 5. n0 1,2 compõe com o algarismo 5, o n0 z = 1,25. No cruzamento da linha 1,2 com a coluna 5 está o número 0,3944. Está é a probabilidade (39,44%) do ocorrer valor entre zero e z= 1,25. Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica 0 1 2 3 4 5 6 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 Probabilidade de ocorrer valor entre zero e 1,25 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Distribuição Normal • Predicção de uma valor: qual é a probabilidade de um individuo apresentar um colesterol entre 200 e 225 mg% (média); 200 mg% / = desvio padrão = 20 mg% Cálculo da probabilidade associado à Distribuição normal: Z=X- = média ; = desvio padrão X = valor pesquisado A estatística Z mede quanto um determinado valor afasta-se da média em unidades de Desvio padrão (quando coincide c/ a média, o escore é Z = 0) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Distribuição Normal • Predicção de uma valor: Z = X – 200 = 1,25 20 Consultando a Tabela de Distribuição normal, vemos que a probabilidade de Z assumir valor entre 0 e Z = 1,25 é 0,3944 ou 39,44 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica 0 1 2 3 4 5 6 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 Probabilidade de ocorrer valor entre zero e 1,25 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Distribuição Normal • Predicção de uma valor Outro exemplo: Qual é a probabilidade uma pessoa apresentar menos do que 190mg% de colesterol. Para resolver este problema, é preciso "reduzir" o valor X = 190. Obtém-se então: Z = 190 - 200 = - 0,50 . 20 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Na Tabela de Distribuição Normal, a probabilidade de ocorrer valor maior que a média 0 é 0,5;então, a probabilidade pedida é : 0,5 – 0,1915 = 0,3085 ou 30,85% 0 1 2 3 4 5 6 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Correlação / Regressão • Correlação Associaçao entre duas variaveis peso e altura; em quanto aumenta o peso à medida que aumenta a altura? • Diagrama de dispersão: • X = Horizontal (eixo das abscissas): variável independente ou explanatória • Y = Vertical (eixo das ordenadas) : variável dependente A correlação quantifica quão bem o X e Y variam em conjunto Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Correlação + Margotto, PR (ESCS) Correlação - Sem correlação www.paulomargotto.com.br Bioestatística Básica Correlação / Regressão Comp Peso Comp Peso 104 23,5 98 15,0 107 22,7 95 14,9 103 21,1 92 15,1 105 21,5 104 22,2 100 17,0 94 13,6 104 28,5 99 16,1 108 19,0 98 18,0 91 14,5 98 16,0 102 19,0 104 20,0 99 19,5 100 18,3 Observem que à medida que o comprimento dos cães aumenta (variável explanatória) o peso aumenta (variável dependente) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Correlação / Regressão • Coeficiente de correlação: (r de Pearson) : Expressa quantitativamente as relações entre duas variáveis r = 0,8 – 1 – forte Débito cardíaco e Pressão arterial r = 0,5 – 0,8 – moderada r=0,38 (correlação fraca) R = 0,2 – 0,5 – fraca Kluckow et al r = 0 – 0,2 – insignificante Cálculo do r: r= ∑xy - ∑x∑y n ∑x2 – (∑x)2 n Margotto, PR (ESCS) 000000000 ∑y2 – (∑y)2 n www.paulomargotto.com.br Bioestatística Básica Correlação / Regressão • Correlação: grau de associação / Regressão: capacidade entre 2 variáveis de predicção de um valor baseado no conhecimento do outro (prever Y conhecendo-se o X) Equação da Reta de Regressão: Y = a + bx (a= Y – bx) a : coeficiente angular (inclinação da reta) b: coeficiente linear (intersecção da reta com o eixo X) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Correlação / Regressão • Exemplo: a correlação entre o peso pré-gravídico e o peso do RN foi de 0,22. Aequação da reta: Y = 2547, 79 + 12,8 x Assim, uma gestante com peso pré-gravídico de 60 Kg espera-se um RN c/ peso de 3,315g R2 ( r squared): coeficiente de determinação: proporção da variação total que é explicada. Peso pré –gravídico e peso ao nascer : r2 = 0,22 2 = 4,84 ≈ 5% ( o peso ao nascer é explicado pelo peso da mãe em apenas 5%) (Tese de Doutorado – Curvas de Crescimento Intra-uterinas Margotto, PR) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Correlação / Regressão • Base excess e PaCO2 Equação de regressão: Y = 1,07 BE + 40 ,98 r = 0,94 / r = 0.88 = 88% Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Crematócrito e a Composição Nutricional do Leite Materno Crematócrito X Lipídio Leite congelado: -20oC por 7 dias Wang CD, 1999 Bioestatística Básica Crematócrito e a Composição Nutricional do Leite Materno Crematócrito X Caloria Y=5,99x+32,5 (leite fresco) Y=6,20x+35,1 (leite congelado) Equações de regressão Hoje terminamos por aqui! Wang CD, 1999 INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES • Definição: • O Risco relativo se baseia na observação de que nem todos têm a mesma probabilidade (risco) de padecer um dano, mas que para alguns este risco (probabilidade) é maior do que para outros. INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES I - Conceito de Risco É a probabilidade que tem um indivíduo ou grupo de indivíduos de apresentar no futuro um dano em sua saúde. Risco é probabilístico e não determinista. Exemplo: RN com peso entre 500 -1500g tem maior probabilidade de morrer (na UTINeo do HRAS: 19,58- ano 2000), mas muito deles não morrem. Risco é uma medida que reflete a probabilidade de que ocorra um dano a saúde. Margotto, www.medico.org.br www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES II - Grau de Risco Mede a probabilidade de que o dano ocorra no futuro Refere-se a um resultado não desejando. Não deve ser confundido com o risco !!! O dano em um RN seria a sua morte no período neonatal ou seqüelas neurológicas consecutivas à asfixia, o risco é a probabilidade de que o dano venha ocorrer neste RN, medindo-o como um gradiente que vai de risco alto a baixo risco de morte neonatal ou de seqüelas neurológicas, neste exemplo. 0 Baixo Risco 1 Alto Risco www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Graduar o risco É IMPORTANTE para programar atençã segundo o enfoque de risco, priorizando o grupo, dentro d população de maior necessidade. Exemplo: Dano: Baixo Peso Fatores de Risco: • Pobreza • Analfabetismo da mãe • Doença Intercorrentes • Desnutrição www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES III - Risco Relativo/Qui-quadrado • Risco Relativo (RR): Mede o excesso de risco para um dado dano nos indivíduos expostos ao fator de risco, comparado com os que não estão expostos. Fator Patologia Sim Sim a Não b Total a+b Não Total c a+c d b+d c+d n. = (a+b+c+d) RR = a/a+b c/c+d Margotto, PR (ESCS) RR = Incidência do Risco nos que tem fator p1 = a/a+b RR= Incidência do Risco nos que não tem fato .p2 = c/c+d INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES III – Tecnica da Prova de Hípótese: RR = a/a+b c/c+d RR = Incidência do Risco nos que tem fator p1 = a/a+b RR= Incidência do Risco nos que não tem fato .p2 = c/c+d Uma vez feito o cálculo de RR, torna-se necessário demonstrar • Não há erros de registro, cálculo ou transcrição RR é prático e estatisticamente significativo • Um RR menor que 1,5 geralmente não é de valor prático www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATI EM PERINATOLOGIA/TESTE DE HIPÓTESES • Teste do X 2 (qui-quadrado): (a x d – b x c) ½ )2 (a+b) x (d+c) x (b+d) x (a+c) Qui-quadrado mede a probabilidade de as diferenç encontradas em dois grupos de uma amostra ser devidas ao acaso, partindo do pressuposto que, verdade, não há diferenças entre os dois grupos população donde provêm. Se a probabilidade for a poderemos concluir que não há diferenç estatisticamente significativas. Se a probabilidade baixa (particularmente menor que 5%) poderem concluir que um grupo (A )é diferente do grupo B qua ao fator estudado. www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Exemplo: Cálculo do Risco em estudo: Baixo Pes População total estudada: 6373 Morte perinatais observadas: 211 População com fator Baixo Peso: 724 Morte Perinatais com o fator baixo peso: 150 Fator Baixo Peso Sim Não Total Sim 150 (a) 61 (c) 211 (a+c) Morte Perinatal Não Total 574 (b) 724 (a+b) 5588 (d) 5649 (c+d) 6162 6373 (b+d) n. = (a+b+c+d) INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Exemplo: Fator Baixo Peso Sim Não Total Cálculo do Risco em estudo: Baixo Peso Morte Perinatal Sim Não Total 150 (a) 574 (b) 724 (a+b) 61 (c) 5588 (d) 5649 (c+d) 211 6162 6373 n. = (a+b+c+d) RR = a/a+b c/c+d Ou seja o RR = 19,2 150/724 61/5649 O Risco de Morte Perinatal de um RN de baixo peso excede 19,2 vezes a de um RN de peso > 2500g Margotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Exemplo 2 : Fator de Risco em estudo: ausência de pré - natal Fator Ausência de Pré – Natal Sim Não Total Sim 117 (a) 94 (c) 211(a+c) Morte Perinatal Não 2625 (b) 3537 (d) 6162 (b+d) Total 2742 (a+b) 3631 (c+d) 6373 n. = (a+b+c+d) RR = 1,6 117/2742 94/3631 O Risco de Morte Perinatal de um RN sem pré-natal excede 1,6 vezes a de um RN com pré-natal Margotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Exemplo 2 : Fator de Risco em estudo: ausência de pré - nat Fator Ausência de Pré – Natal Sim Não Total Sim 117 (a) 94 (c) 211(a+c) Morte Perinatal Não 2625 (b) 3537 (d) 6162 (b+d) (a x d – b x c) ½ )2 (a+b) x (d+c) x (b+d) x (a+c) Total 2742 (a+b) 3631 (c+d) 6373 n. = (a+b+c+d) X 2 = 13,71 Podemos dizer que há uma associação significativa (p < 0,01) entre ausência de pré-natal e morte perinatal, sendo que grau de associação é: o risco de morte perinatal é 60% maior nos produtos sem pré-natal (1,6 x 100 = 160: aumento de 60%: 100 + 60). www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Exemplo 3 : Risco de Morte neonatal (nos 1º 7 dias de vida) Fator Ausência de Pré-Natal Sim Não Total Sim 58 38 96 Morte Perinatal Não 2625 2573 6162 Total 2683 2575 6258 Risco Relativo (RR): 2,0 X2 – 11,8 (p<0,01) O RR é o risco de adoecer em um grupo (grupo exposto) em relação ao risco de adoecer em outro grupo (pessoas não expostas). Se não houver associação entre a exposição e a doença, o risco de adoecer não depende da exposição e o RR é igual a 1. Margotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Cálculos estatísticos básicos relacionados ao Risco Relativo ( Braile, DM & Godoy, MF) ** versão 1999 ** Atenção: Digitar apenas nas caselas verdes EVE NTO Gr.Estudo Gr.Controle Todos os cálculos são feitos automaticamente sim 150 130 280 280 não 122 180 302 302 272 272 310 310 582 582 IC 95% Taxa eventos no grupo estudo: (a/(a+b) Taxa dede eventos no G. Estudo (EER) = a/(a+b) Taxa eventos no grupo (c/(c=d) Taxa dede eventos no Gr.Controle (CER) = controle: c/(c+d) Risco relativo (RR)=EER / CER Risco relativo: a/(a+b) / c(c+d) Redução do risco relativo (RRR) = (CER-EER)/CER Redução do risco relativo (RRR) Redução do risco =CER-EER Redução doabsoluto risco (ARR) absoluto Número Necessário p/tratamento(NNT)=(100/ARR) Número Necessário p/tratamento 55,1 % 49,2 61,1 41,9 % 1,32 0,32 36,4 1,11 0,56 47,4 1,56 0,11 13,2 % 8 21,3 19 5,1 5 Observação: Valores em Vermelho são valores negativos www.paulomargotto.com.br Clicar duas vezes Para ativar a planilha Braile DM e Godoy MF INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Exemplo 3 : Risco de Morte neonatal (nos 1º 7 dias de vida) Fator Ausência de Pré-Natal Sim Não Total Sim 58 38 96 Morte Perinatal Não 2625 2573 6162 Total 2683 2575 6258 Risco Relativo (RR): 2,0 X2 – 11,8 (p<0,01) Um risco menor que 1 implica em uma redução da doença com exposição, enquanto que um RR maior que 1, sugere um aumento da doença com exposição. Quanto maior for o RR, maior será a associação entre a exposição e o dano. argotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES • Junto com a obtenção do RR se deve estimar o se intervalo de confiança de 95%, uma vez que é possível obte um valor do RR alto, mas se o tamanho da amostra fo pequeno, o seu valor será duvidoso. • Os limites de confiança estão muito relacionados com o valores de p e se não inclui o valor de 1, é equivalente significação estatística a um nível de 5%. Vamos ao exemplo: www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES O intervalo de confiança a 95% é: … 1 … 1,2 2,05 Como o extremo inferior deste intervalo de confiança excede o valor 1, se pode dizer, neste caso, que há uma associação estatisticamente significativa em um nível de 5% entre a ausência de pré-natal e mortalidade perinatal, sendo que o risco de morte perinatal nos produtos sem pré-natal excede, significativamente 1,6 vezes a dos produtos com prénatal. Margotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES O Intervalo de Confiança 95% significa que há 95% de probabilidade de que o intervalo calculado contenha o verdadeiro valor do parâmetro estudado. Por exemplo RISCO RELATIVO de 1,6 com IC95% de 1,2 a 2,05. Isto quer dizer que no experimento realizado o valor encontrado foi de 1,6 e que há 95% de probabilidade que o verdadeiro valor seja um número qualquer entre 1,2 e2,05. Quando o intervalo de confiança contém o valor 1,00 significa que não há diferença estatística entre o grupo estudado e o grupo controle. Quando o valor máximo do IC 95% é menor que 1,00 o grupo de estudo se comportou de modo significativamente melhor que o grupo de controle e quando o valor mínimo do IC 95% for maior que 1,00 significa que o grupo de estudo foi significativamente pior que o grupo controle. www.braile.com.br www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES V-Odds Ratio (OR) ou Razão das chances Os estudos de casos-controles comparam a freqüência de expostos a um determinado fator entre um grupo de indivíduos que apresenta a doença – casos – e outro que não a tem – controle. Fator Sim Não Total Sim a b a+b Dano Não c d c+d n (a+b+c+d) OR = axd bxc A razão das chances (OR) é definida como a probabilidade de que um evento ocorra dividido pela probabilidade de que ele não ocorra. Margotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Clicar duas vezes Para ativar a planilha Braile DM e Godoy MF INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES IV-Seleção dos fatores de risco com fins de intervenção (Risco Atribuível) Risco Atribuível (RA): este mede a percentagem da incidência do dano que se reduz no grupo exposto ao fator, se este fosse neutralizado (impacto do controle no grupo exposto). Quando se refere à população, temos o risco Atribuível à População (RAP): RA Taxa de Incidência no Grupo Com fator de risco (P1) Menos Taxa de incidência no grupo sem o fator de risco (P2) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES IV-Seleção dos fatores de risco com fins de intervenção (Risco Atribuível) O RA é outra medida de associação entre fatores e danos e pode ser definido com a diferença entre a probabilidade ter o dano nos que estão expostos ao fator e a probabilidade de ter o dano nos que não estão expostos. Assim, é a diferença de probabilidade atribuível à exposição ao fator e se expressa como: RA = P1 – P2 www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES Exemplo: Ausência de pré-natal e o dano mortalidade perinatal, o risco atribuível é: RA = P1 – P2 P1 = 117/2742 = 0,043 P2 = 94/3631 = 0,26 RA = 0,043 – 0,26 = 0,017 Fator Ausência de Pré – Natal Sim Não Total Sim 117 (a) 94 (c) 211(a+c) Morte Perinatal Não Total 2625 (b) 2742 (a+b) 3537 (d) 3631 (c+d) 6162 6373 (b+d) n. = (a+b+c+d) Como interpretar este valor de RA: Significa que 17 mortes perinatais de cada 1.000 (mil) gestantes são atribuíveis à ausência de pré-natal. Margotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES • Para saber o que isto significa em uma comunidade específica, é necessário relacionar esta probabilidade (0,017) com a freqüência do fator na população. • A forma de estimar o impacto é calculando o Risco Atribuível ao fator da população (RAP). Para calcular o RAP emprega-se a seguinte fórmula: RAP% F% (P1 – P2) P (geral) P1 – P2 = a probabilidade encontrada F% = a freqüência do fator na população P (geral) = a probabilidade do dano entre todas as gestantes Margotto, PR (ESCS) www.paulomargotto.com.br INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO EM PERINATOLOGIA/TESTE DE HIPÓTESES • No caso : Ausência de pré-natal e o dano mortalidade perinatal, o risco atribuível ao fator da população (RAP) é: RAP% = 43 X 0,017 = 22 % 211 / 6.373 Significa que 22% da probabilidade de mortalidade perinatal da área em estudo, está associada à freqüência do fator ausência de pré-natal em 43% das gestantes. www.paulomargotto.com.br Bioestatística Básica Teste de Hipótese Hipótese nula (H0): não há diferença Hipótese alternativa (H1): há diferença Hipótese: resposta presumida e provisória que de acordo com critério será ou não rejeitada Processo para testar hipótese: 1. Estabelecer Ho 2. Estabelecer H1 3. Determinar tamanho da amostra 4. Colher dados 5. Estudo estabelecido para verificar se o H0 é verdadeiro 6. Rejeitar ou não a H0 Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Teste de Hipótese Segundo R.A. Fisher: todo experimento existe somente com o propósito de dar os fatos uma oportinidade de afastar a H0 Erro tipo I: rejeitar a H0 sendo verdadeira (fato obtido pelo azar) : rara ocorrência estatística; amostras pequenas Erro tipo II: aceita a H0 sendo falsa (erro mais frequente); significação estatística: máxima probabilidade de tolerar um erro tipo I. α= 5% (p 0,05): ≤ 5% de rejeitar a H0 (sendo verdadeira) e aceitar a H1 α= 1% (p 0,01): ≤ 1% de rejeitar a H0 (sendo verdadeira) e aceitar a H1 α α Margotto, PR (ESCS) erro tipo I e erro tipo I e ‘ erro tipo II erro tipo II www.paulomargotto.com.br Bioestatística Básica Teste de Fisher ou da Probabilidade Exata Usado para amostras pequenas Menos erro tipo I e II em relação ao qui-quadrado n < 20 / n > 20 < 40 Ex.: a) célula da matriz de decisão com o valor 0 Suposição de uma determinada enzima em pessoas submetidas a uma reação sorológica Reação P = (a+b!) x (C=d!) x (a+c!) x (b+d!) n! x 1 / a! b! c! d! Enzima Total Presente Ausente + 5 1 6 - 0 3 3 Total 5 4 9 P = [ (6! 3! 5! 4! / 9!] x [1/5! 1! 0! 3!) P = 0,046 = 4,76% P <=0,05: as pessoas submetidas a uma reação sorológica apresentam significativamente uma determinada enzima (afastamos a H0) Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Teste t Testar o QI médio entre crianças nascidas a termo e prematuras Testar uma droga (grupo tratado/grupo controle) Teste t: analisa grupos simples ou compara 2 grupos (variável com distribuição normal ou aproximadamente normal) Passos: Nível de significância: Média de cada grupo: Variância de cada grupo: S21: variância do grupo 1 S22: variância do grupo 2 letra grega X1: média do grupo 1 X2: média do grupo 2 • Variância Ponderada N1 é o nº de elementos do grupo 1 N2 é o nº de elementos do grupo 2 S2 = (n1 – 1)2 + (n2 – 1) S22 O valor t é definido n1 +pela n2 - fórmula 2 t= √ S2 Margotto, PR (ESCS) X 2 – X1 1 1 n1 + n2 www.paulomargotto.com.br Bioestatística Básica Análise de Variância/Estatística F (ANOVA: Analysis of Variance) Usado para comparar médias de mais de duas populações Ex.: testar 4 drogas diferentes (diuréticos) ao mesmo tempo e avaliar o efeito de cada droga sobre o débito urinário em 16 voluntários. teste t: comparar os grupos 2 a 2 (6 testes t separados) - perda de tempo - erro tipo I de 30% (5% de erro em 6 análises) Então, vamos usar o teste ANOVA (comparação de pares): Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Bioestat ística B ásica I Testes não – paramétricos Usados quando a distribuição da população é altamente assimétrica Não são tão eficientes quanto ao paramétricos Variaveis Nominais Teste do Sinal - Sign Test: variáveis qualitativas ou nominais. Este teste recebe este nome porque a diferença em cada par é convertida nos sinais de (+), de (-) ou (zero) - quando não houver diferença. Alternativa nãp paramétrica (menos poderosa) do teste t para amostras emparelhadas. Pode ser aplidado para amostras não emparelhadas - H0: 1/2 dos sinais são (+) e 1/2 dos sinais são (-) - H1: a proporção de vezes (p) em que aparece o sinal (+) ou (-), seja igual a 0,5; valendo-se disto, é possível gerar um escore Z, utilizando a fórmula: Z = 2 (p´ - 0,5) √ n n: nº de pares em que houve a diferença p,: é a freqüência de sinais (+) ou negativos (-). Margotto, PR (ESCS) www.paulomargotto.com.br Bioestat ística Básica Básica I Bioestatística Testes Estatísticos não – paramétricos Wilcoxon Signed Rank Sum Test (Teste de Wilcoxon): Este teste destina-se a comparar dois grupos emparelhados; é usado exatamente da mesma situação do teste t para amostras emparelhadas. Teste de U de Mann – Whitney • Alternativa para teste t para amostras independentes Bioestatística Básica Bioestatística Básica Bioestatística Básica Básica I Bioestatística Sensibilidade/Especificidade/Valor Predictivo Usamos Tabelas de Dupla entrada (matriz de decisão) para a apresentação numérica já que os dados qualitativos: Patologia confirmada Resultado do procedimento Sim Não Sentido da analise + a verdadeiros positivos b falsos positivos a+b - c falsos negativos d verdadeiros negativos c+ d a+ c b+d a + b + c + d (n) Sensibilidade: a (considera os acertos positivos) a+c p Esfecificidade: d (considera os acertos negativos) b+d Margotto, PR (ESCS) www.paulomargotto.com.br Bioestatística Básica Bioestatística Básica Bioestat ística B ásica I Bioestatística Básica Sensibilidade/Especificidade/Valor Predictivo Para calcularmos o VPP e o VPN, recorremos à matriz de decisão, sendo que agora, a análise é feita por linha (sentido horizontal). Patologia Resultado do Procedimento Sim Não + a b a+b - c d c+d a+c b+d a+b+c+d= (n) Sentido da Análise VPN = Margotto, PR (ESCS) d (expressa a confiabilidade de um c + d resultado de exame negativo) www.paulomargotto.com.br Bioestatística Básica Bioestatística Básica Significância: ausência da unidade no intervalo de confiança Bioestatística Básica Cálculos estatísticos básicos para Testes Diagnósticos (versão 1999) ( Braile, DM & Godoy, MF) Padrão Atenção: Digitar apenas nas caselas verdes Teste diagnóstico + - Todos os cálculos são feitos automaticamente + - 30 21 51 44 74 30 51 74 125 IC % Sensibilidade = a/(a+c) % Especificidade = d/(b+d) % Probabilidade pré-teste = (a+c)/(a+b+c+d) % Valor preditivo positivo = a/(a+b) % Valor preditivo negativo =d/(c+d) % Acurácia = (a+d)/(a+b+c+d) ODDS pré-teste= prob préteste/(1-prob préteste) Likelihood ratio para teste posit=sensib/(100-especif) Likelihood ratio para teste negat=(100-sensib)/especif Estatística Kappa (grau de concordância corrigido) 40,5 58,8 59,2 58,8 40,5 48,0 1,451 1,0 1,0 -0,01 Ouro 95% % 29,4 51,7 % 45,3 72,3 % 50,6 67,8 % 45,3 72,3 % 29,4 51,7 % 39,2 56,8 -0,18 0,16 (<0,20=pobre;0,21-0,40=fraca;0,41-0,60=moderada; 0,61-0,80=boa;>0,80=muito boa) Clicar duas vezes para Ativar a planilha Margotto,PR Braile DM e Godoy MF Bioestatística Básica Curva “ROC” ROC - Receiver Operator Caracteristic COR - Características de Operação do Receptor Forma de representar a relação normalmente antagônica entre SENSIBILIDADE e ESPECIFICIDADE de um teste diagnóstico quantitativo, ao longo de um contínuo de valores ponto de corte (“cut off point”) O “cut off point” vai influenciar as características do teste A Curva ROC descreve diferentes valores de SENS e ESPECIF para um determinado número de valores “cut off point” Margotto,PR Bioestatística Básica Curvas “ROC” -Permitem evidenciar os valores para os quais existe maior otimização da sensibilidade em função da especificidade ponto em que se encontra mais próximo do canto superior esquerdo do diagrama -Permitem quantificar a exatidão de um teste diagnóstico (proporcional à área sob a curva) -Permitem comparar testes diagnósticos Margotto,PR CURVA ROC Falso- positivo (1-especificidade) Teste A-melhor acurácia que o teste B (teste inválido: os seus resultados não são melhores do que os da chance) Ponto 1: maior valor de sensibilidade e especificidade; ponto 2: maior sensibilidade, porem menor especificidade; ponto 3: maior especificidade, porém, menor sensibilidade A escolha do “cut off” vai depender do interesse em aumentar a sensibilidade ou a especificidade Margotto,PR RAZÕES DE VEROSSIMILHANÇA/RAZÃO DE PROBABILIDADES Representam uma forma de descrever o desempenho de um teste diagnóstico, podendo ser usadas para calcular a probabilidade de doença após um teste positivo ou negativo. É definida como a probabilidade de um resultado do teste em pessoas com a doença, dividida pela probabilidade do resultado do teste em pessoas sem a doença. Assim temos: Verossimilhança positiva (RV+): EXPRESSA QUANTAS VEZES É MAIS PROVÁVEL ENCONTRAR UM RESULTADO POSITIVO EM PESSOAS DOENTES QUANDO COMPARADO COM PESSOAS NÃO DOENTES RV+=Sensibilidade/1-Especificidade): (a /a+c) / b/b+d) Margotto,PR -Vesossimilhança negativa (RV-): EXPRESSA QUANTAS VEZES É MAIS PROVÁVEL ENCONTRAR UM RESULTADO NEGATIVO EM PESSOAS DOENTES QUANDO COMPARADO COM PESSOAS NÃO DOENTES RV- = 1-Sensibilidade/especificidade): (c/a+c) / (d/d+b) Uma das vantagens da VEROSSIMILHANÇA é ser menos susceptível a mudanças em função da prevalência da doença. Margotto,PR Vejamos um exemplo, para melhor compreensão: Em 182 pacientes com faringite aguda, o teste rápido foi capaz de diagnosticar faringite em 21 de 22 pacientes (sensibilidade de 95,45%) e afastou a possibilidade de faringite em 154 de 160 pacientes (especificidade de 96,25%). Diante de um resultado positivo, 77,78% dos pacientes eram verdadeiros positivos (valor preditivo positivo) e diante de um resultado negativo, 99,35% dos pacientes eram verdadeiros negativos(valor preditivo negativo) Margotto,PR Qual é a RV positiva? (a /a+c) / b/b+d): 25,3 Qual é a RV negativa? (c/a+c) / (d/d+b): 0,05 Margotto,PR Interpretação: a chance (definida como razão de duas probabilidades) da doença aumenta 25 vezes mais com o resultado positivo. A chance de encontrar um resultado negativo em pessoas doentes é mínima! Questão de Residência Média-2007-Universidade Federal Fluminense-UFF. A razão da probabilidade de um teste positivo em doente, contra a probabilidade de o mesmo teste ser positivo em não doente, define: a) sensibilidade b) razão de prevalências c) valor preditivo de um teste positivo d) razão de falsos negativos e) razão de verossimilhança de um teste positivo Margotto,PR Bioestatística Básica Curva de Kaplan-Meier Nos estudos de avaliação das taxas de sobrevivência: resultado será binário-sobrevivência ou morte do paciente Objetivo: estimar o intervalo de tempo que os pacientes sobrevivem com tipos específicos de tratamento ou em condições específicas. variável dependente (resultado): é sempre o tempo até a ocorrência de determinado evento Na análise de sobrevivência: compara-se a rapidez com que os participantes desenvolvem determinado evento Tempo de sobrevida na análise de sobrevivência tempo até a ocorrência de determinado evento. Margotto,PR Bioestatística Básica Curva de Kaplan-Meier Técnicas estatísticas usadas na análise clássica e na análise de sobrevivência (Botelho F et al) DIFEREM NO TIPO DE VARIÁVEL DEPENDENTE) Margotto,PR Bioestatística Básica Curva de Kaplan-Meier Nos estudos de seguimento: - pacientes que não atingem o tempo total de seguimento previsto, são excluídos. Na análise de sobrevivência: os dados destes pacientes são aproveitados na análise final, mesmo que não desenvolvam o evento em estudo. designa-se o indivíduo como censurado Margotto,PR Bioestatística Básica Curva de Kaplan-Meier Como é feita a análise dos dados na análise de sobrevivência/aparecimento de eventos? O método de Kaplan-Meier consiste em dividir o tempo de seguimento em intervalos, cujos limites correspondem ao tempo de seguimento em que houve eventos. Este método calcula a sobrevivência cada vez que um paciente morre Margotto,PR Bioestatística Básica Curva de Kaplan-Meier Chorioamnionitis Alters the Response to Surfactant in Preterm Infants. . J Pediatr 2010;156:10-5) Been JV et al Observe o TEMPO DE EXTUBAÇÃO (corioamnionite fetal, corioamnionite sem envolvimento fetal e sem corioamnionite) 85% estatística do logrank de Cox-Mantel 65% Kaplan-Meier permite avaliar corretamente o ritmo da ocorrência dos nos diferentes grupos em estudo. Curvas de Kaplan-Meier analisando o tempo até a extubação após primeira dose dose de surfactante exógeno para os grupos com base na histologia da placenta Margotto,PR Bioestatística Básica Curva de Kaplan-Meier Teste estatístico na análise de significância: -Logrank test (também conhecido por estatística do logrank de Mantel, estatística do logrank de Cox-Mantel Análise multivariada: Regressão de Cox A idade gestacional poderia explicar a menor chance de extubação após corioamnionite? A regressão de Cox foi realizada com ajuste para a idade gestacional e peso. Margotto,PR Curva de Kaplan-Meier Regressão de Cox estimando o tempo de extubação após a segunda dose de surfactante exógeno, ajustado para a idade gestacional e peso nos grupos de acordo com a histologia da placenta, p <0,05 HC+F VS HC- Hazard Rate-HR- de 0,12 com intervalo de confiança de 0,01-0,06 – p=0,046 (a menor idade gestacional explica parcialmente estas diferenças!) Bioestatística Básica Curva de Kaplan-Meier o tamanho da amostra diminui ao longo do tempo de observação (as estimativas nos períodos finais de observação (parte direita da curva) são bastante imprecisas censura dos Quanto menor o número de censurados, menor será o viés de seguimento O método de Kaplan-Meier é um método não paramétrico, sendo o único que supõe que os indivíduos censurados comportaram do mesmo modo dos indivíduos seguidos até que ocorra o evento. Para cada período de tempo se calcula a probabilidade de sobreviver. Margotto,PR Curva de Kaplan-Meier Análise de Sobrevivência usando o SPSS para Windows, usando o método de Kaplan-Meier e obtenção de Curvas de Sobrevivência e compará-las mediante a realização do teste logrank O tempo de seguimento é uma variável quantitativa (expressa em dias, meses, anos) e expressa a diferença entre as datas de início e de finalização do estudo. O estado do paciente ao final do seguimento é uma variável categórica dicotômica (1: evento que pode ser morte, recaída, etc e 0: não ocorreu evento, casos censurados ou apresentaram um evento após o término do estudo). Exercício com o SPSS Margotto,PR Bioestatística Básica Regressão Logística É uma regressão múltipla, mas com variável de saída categórica dicotômica (dependentesim/não/alto-baixo/bom-ruim)) e variáveis previsoras (explicativas ou independentes) contínuas ou categóricas. A resposta na regressão logística é expressa por meio de uma probabilidade de ocorrência Importância: análise de variáveis interferentes Bioestatística Básica Sódio sérico como um fator de risco para a mortalidade intrahospitalar em pacientes grave à admissão Regressão Logística A Odds ratio para a morte dentro de 30 dias da admissão foi de -4,07 (IC a 95%%: 2,95-5,63) quando o paciente apresentava hipernatremia e -3,36 (IC a 95% de 2,59-4,36) quando apresentava hiponatremia. A regressão logística foi usada para calcular a Odds ratio ajustada: fatores que foram incluídos neste ajuste foram o escore de severidade da doença, permanência na UTI, efeito da idade, sexo, transfusão de sangue e sepse. Após o ajuste, para hipernatremia, A Odds ratio (ajustada) para a morte no paciente com hipernatremia passou para 1,41 (Intervalo de confiança de 0,97-2,07: não alcançou a significância, pois no intervalo de confiança contém a unidade) A Odds ratio (ajustada) para hiponatremia passou para 2,00 (Intervalo de confiança a 95% de 1,44-2,77, ou seja, foi menor, porém continuou significativa, pois no intervalo de confiança não contém a unidade). Assim, o sódio sérico é um poderoso marcador inicial para a mortalidade, mas a mortalidade no grupo hipernatrêmico é primariamente um fator de severidade da doença. Já para a hiponatremia o aumento da mortalidade é independente de outras variáveis. Bioestatística Básica Regressão Logística: Associação de ranitidina com infecções, enterocolite necrosante e desfecho fatal em recém-nascidos Foi realizada análise multivariada usando a regressão logística binária para avaliar se a idade gestacional, peso ao nascer, escore de Apgar, CRIB, hemorragia intraventricular, canal arterial pérvio, acesso vascular central ou ventilação mecânica afetaram a precrição de ranitidina. Terrin, 2012 Bioestatística Básica Regressão Logística: Resultados A regressão logística binária (constante B de 6.334) mostrou que a ranitidina prescrita pelos médicos não foi afetada pela: . Idade gestacional (B 2 0.167, odds ratio [OR] 0.846, 95% IC 0.694 –1.031, P = .098), Peso ao nascer (B 2 0.001, OR 0.999, 95% IC 0.997–1.001, P = .444), sexo (B 0.708, OR 2.031, 95% IC 0.972–4.243, P = .060), Escore de Apgar (1 minute: B 2 0.147, OR 0.863, 95% IC 0.653–1.141, P = .301; 5 minute: B 2 0.099, OR 0.905, 95% IC 0.486 – 1.687, P = . 754) Escore do CRIB ((B 0.008, OR 1.008, 95% IC 0.869 –1.169, P = . 918 ), IV (B 0. 755, OR 2. 12 7, 9 5% IC 0.635–7.124, P =.221) Canal arterial pérvio: (B 20.281, OR 0. 75 5, 95 % IC 0 .3 23–1.764, P = .516), Acesso vascular central (B 0.004, OR 1.004, 95% IC 0.960–1.050, P =.855) ou Ventilação mecânica ( B 20.062, OR 0.940, 95% IC 0.850–1.040, P = .233) RN tratados com ranitidina tiveram mais infecções (OR 5.5; IC a 95%:2.9-10.4, P < 0,001) Bioestatística Básica [Survival and morbidity of premature babies with less than 32 weeks of gestation in the central region of Brazil]. Castro MP, Rugolo LM, Margotto PR. Rev Bras Ginecol Obstet. 2012 May;34(5):235-42. Portugues Margotto, PR Bioestatística Básica Bioestatística Básica Controle da influência do peso ao nascer e idade gestacional (análise multivariada com regressão logística binária) Hemorragia pulmonar: OR=3,3 (IC 95%:1,4-7,9-p=0,01) SDR (doença da membrana hialina): OR=2,5 (IC 95%:1,1-6,0-p=0,04 Persistiram no modelo Margotto, PR Bioestatística Básica Regressão Logística: No exemplo a seguir vamos realizar uma Regressão Logística Binária utilizando o SPSS. No exemplo: a variável resposta será a ocorrência de Apgar<= 3 no 5º minuto (sim ou não), caracterizando uma variável binária. as variáveis independentes escolhidas foram aquelas que se associaram individualmente ao Apgar <=3 no 5º minuto: corticóide, hipertensão materna, tipo de parto e pré-natal. Margotto, PR, 2012 Bioestatística Básica Regressão Logística: Neste exemplo, podemos afirmar que as chances do RN cuja mãe recebeu esteróide pré-natal de apresentar um Apgar < =3 reduziu em 57,3% (Exp (B) de 0,427: 10,427=0,573 x 100= 57,3%) em relação ao RN não exposto ao esteróide pré-natal. Já a hipertensão materna constituiu um fator de risco, aumentando em 2,3 vezes mais o risco de do RN cuja mãe teve hipertensão de apresentar um Apgar <= 3 em relação ao RN cuja mãe não teve hipertensão. Observe que no intervalo de confiança de ambas variáveis previsora incluídas no modelo NÃO contém a unidade). Para busca Eletrônica, consultem! BUSCA ELETRÔNICA-RESUMINDO Paulo R. Margotto –ESCS www.paulomargoto.com.br / [email protected] É importante que se reconheça a necessidade da informação e a coloque em forma de questão clínica respondível MEDLINE (www.pubmed.com) Iniciamos a busca sempre pelo Busca Eletrônica: como fazer Autor(es): Paulo R. Margotto Consultem também: BIOESTATÍSTICA -RESUMINDO Bioestatística-resumindo Autor(es): Paulo R. Margotto Bioestatística Básica ESPERO TER SIDO ÚTIL! Brasília, 18/5/2012