Bioestatística Básica
Secretaria de Estado de Saúde do Distrito Federal
Escola Superior de Ciências da Saúde
(ESCS)
Paulo R. Margotto
Prof. Do Curso de Medicina da ESCS
www.paulomargotto.com.br
Brasília, 12/6/2015
Entendendo bioestatística básica
Autor(es): Paulo R. Margotto
Estatística computacional: Uso do SPSS - o essencial
Autor(es): Paulo R. Margotto
Bioestatística Básica
Programa:
1. Importância da Bioestatística
2. Variáveis
3. População e Amostras
4. Apresentação dos dados em tabelas
5. Medidas de Tendência Central
6. Distribuição Normal
7. Correlação e Regressão
8. Risco Relativo / Odds Ratio
9. Teste de Hipóteses
10. Exercício de Medicina Baseado em Evidências
11. Teste de Fisher
12. Teste t
13 Análise de Variância (ANOVA)
14 -Escolha de Teste Estatístico
15-Testes Estatísticos não Paramétricos
16- Sensibilidades/Especificidade/Curva ROC
Margotto, PR (ESCS)
Bioestatística Básica


A condução e avaliação
de uma pesquisa
Comparação entre dois
ou mais grupos ou
amostras (grupo
tratado / grupo
controle)
Depende, em boa parte,
do conhecimento sobre
Bioestatística
Avaliação da eficácia do
tratamento (significação)
Estar alerta a: variáveis interferentes nos resultados
¤ Variações mostrais
¤ Diferenças entre grupos
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Os testes estatísticos são utilizados para:
¤ Comparar amostras
(houve modificação dos grupos inicialmente
semelhantes após o início da intervenção)
¤ Detectar variáveis interferentes
¤ Analisar se o tratamento depende de outras
variáveis (peso, idade, sexo)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
A ciência não é um conhecimento definitivo sobre a
realidade, mas é um conhecimento hipotético que
pode ser questionado e corrigido.
Ensinar ciências não significa apenas descrever fatos,
anunciar leis e apresentar novas descobertas, mas
Ensinar o método científico
Maneira crítica e
racional de buscar
conhecimento
Margotto, PR (ESCS)
Vieira S., 1991.
www.paulomargotto.com.br
-
-
Variáveis (dados):
- Qualitativas :(diferentes categorias sem valores numéricos):
-Nominal:: sexo, cor, grupo sanguíneo, causa da morte
-Ordinais: (ordenação natural): Grau de instrução, aparência,
estágio da doença, status social
- Quantitativos ou Contínuos: (dados expressos por nº): idade,
altura, peso, renda familiar
-Discretas( associação entre valores e números inteiros):
idade em anos completos
-Contínua (pode assumir qualquer valor no subconjunto de
números reais): peso
População e Amostra:
- População: Conj. de elementos com determinada característica
- Amostra:
Subconjunto com menor nº de elementos
- Independentes: grupo selecionados com tratamento distinto
- Dependentes: para cada elemento do grupo tratado existe
um grupo controle semelhante (sexo, idade, etc)
- Comparação intra-individuo (o grupo submetido ao
tratamento é o seu próprio controle)
Bioestatística Básica
Apresentação dos Dados em Tabelas:
Componentes das tabelas:
-
-
Título: Explica o conteúdo
-
Corpo: Formado pelas linhas e colunas dos dados
-
Cabeçalho: específica o conteúdo das colunas
-
Coluna indicadora: específica o conteúdo das linhas
-
Opcional: fonte, notas, chamadas
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Nascidos vivos no Maternidade do HRAS segundo o ano de registro
Título
Cabeçalho (separado do corpo por um traço horizontal)
Ano de Registro
1998 (1)
Freqüência
8328
Freqüência relativa
32,88 (8828/25494)
1999 (1)
8214
32,22
2000 (1)
8898
34,90
Coluna indicadora
Total
25494
100
Fonte: Margotto, PR (2001)
Nota: dados retirados do livro da sala de parto
(1): os RN < 500g não foram incluídos. (chamadas)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Tabela de Contingência ou de Dupla Entrada
(cada entrada é relativa a um dos fatores)
Gestantes sem pré-natal/gestantes com pré-natal
e mortalidade perinatal
Fator
Mortalidade Perinatal
Total
Sim
Não
Gestantes sem pré-natal
55
833
938
Gestantes com pré-natal
156
6720
6876
Permite calcular o risco, a freqüência (incidência) entre expostos e não
expostos a um determinado fator (será discutido adiante).
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Tabelas de distribuição de freqüências:
Peso ao nascer de nascidos vivos, em Kg
-
2,522
3,200
1,900
4,100
4,600
3,400
2,720
3,720
3,600
2,400
1,720
3,400
3,125
2,800
3,200
2,700
2,750
1,570
2,250
2,900
3,300
2,450
4,200
3,800
3,220
2,950
2,900
3,400
2,100
2,700
3,000
2,480
2,500
2,400
4,450
2,900
3,725
3,800
3,600
3,120
2,900
3,700
2,890
2,500
2,500
3,400
2,920
2,120
3,110
3,550
2,300
3,200
2,720
3,150
3,520
3,000
2,950
2,700
2,900
2,400
3,100
4,100
3,000
3,150
2,000
3,450
3,200
3,200
3,750
2,800
2,720
3,120
2,780
3,450
3,150
2,700
2,480
2,120
3,155
3,100
3,200
3,300
3,900
2,450
2,150
3,150
2,500
3,200
2,500
2,700
3,300
2,800
2,900
3,200
2,480
-
3,250
2,900
3,200
2,800
2,450
-
Menor peso:
1570g
Maior peso:
4600g
Como transformar está tabela em uma
Tabela de Distribuição de Freqüência ?
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
-
Tabelas de distribuição de freqüências: 3 colunas
Definir as faixas de peso (Classes):
Classe
Ponto Médio
Freqüência
1,5Ι— 2,0
1,75
3
2,0Ι— 2,5
2,25
16
2,5Ι— 3,0
2,75
31
3,0Ι— 3,5
3,25
34
3,5Ι— 4,0
3,75
11
4,0 Ι— 4,5
4,25
4
4,5Ι— 5,0
4,75
1
- Intervalo de classe (0,5Kg): intervalo coberto pela classe
- Extremo de classe:limites dos intervalos de classe
1,5 Ι— 2,0: fechado a esquerda (não pertencem a classe os
Valores  2; pertencem a classe os valores  1,5)
- Ponto médio: soma dos extremos da classe ÷ 2
-N º de classes: K = 1+ 3,222 log n (em geral: 5-20)
no exemplo: K = 1 + 3,222 log 100 = 7,444 (7 ou 8 classes)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Apresentação dos dados em gráficos
-título (pode ser colocado tanto acima
como abaixo)
-escala (crescem da esquerda para a
direita e de baixo para cima).
- legendas devem ser colocadas à direita
do gráfico.
Bioestatística Básica
Gráfico de barras: é usado para apresentar variáveis
qualitativas ou variáveis ordinais. Veja no gráfico de
barras os dado da tabela 1.
Bioestatística Básica
Gráfico de setores: é usado para apresentar variáveis
qualitativas ou variáveis ordinais. Calcular os ângulos
centrais das diversas categorias, marcando-os na
circunferência e separando-os com o traçado de raios.
Como calcular o ângulo central
de cada categoria:
100
360
Freqüência relativa (f) valerá X
e o ângulo central X = 360 x f
100
Bioestatística Básica
Histograma:
Os dados apresentados em tabelas de distribuição de
freqüência são apresentados graficamente em histogramas.
Frequência
Peso ao nascer
Bioestatística Básica
BOX PLOT: a caixa é formada por
-mediana (linha central): estimativa da tendência central
a sua posição indica a presença de simetria (central) e
próxima a dos percentis (assimetria)
-percentis 25 e 75 (obtidos pelo método Tukey´s Hinges):
amplitude interquartil-estima a Variabilidade dos dados
-whiskers (bigodes de gatos):
-valores máximos e mínimos (distribuição normal)
-distribuição assimétrica: os dados máximo e mínimos se
desviam do P25-P75
->1,5 AIQ: valores discrepantes(outliers)
->2,5 AIQ: valores extremos (extremes-assinalados
com asterisco)
Bioestatística Básica
Dias de internação na coleta da hemocultura por faixas de peso ao nascer
Denise Nogueira da Gama Cordeiro
Fig.1.Amplitude do EEG para o canal C3-C4 em microvolts.
•A mediana da amplitude
da “linha de base do
EEG” foi
significativamente maior
•que a mediana da
amplitude do EEG
durante a administração
do surfactante,
•10, 20 e 30 minutos
depois, em todos os
casos. ( P<0.008)
Box-plot
Amplitude da linha de base é livre de medicação / surfactante durante os primeiros 10
minutos do estudo, seguido por administração de surfactante (SA) e 10, 20 e 30
minutos após a administração do surfactante. * Indica o nível significativo de P ≤ 0,008.
Os outliers não são mostrados no box-plot.
Box-plot
Fig.1.Amplitude do EEG para o canal C3-C4 em microvolts.
•A mediana da amplitude
da “linha de base do
EEG” foi
significativamente maior
•que a mediana da
amplitude do EEG
durante a administração
do surfactante,
•10, 20 e 30 minutos
depois, em todos os
casos. ( P<0.008)
Amplitude da linha de base é livre de medicação / surfactante durante os primeiros 10
minutos do estudo, seguido por administração de surfactante (SA) e 10, 20 e 30
minutos após a administração do surfactante. * Indica o nível significativo de P ≤ 0,008.
Os outliers não são mostrados no box-plot.
Shangle CE, 2012
Bioestatística Básica
Medidas de Tendência Central
(Valor de ponto em torno do qual os dados se distribuem)
Variância e Desvio Padrão: avalia o grau de dispersão
quanto cada dado se desvia em relação a média)
Média aritmética:soma dos dados  nº deles
(dá a abscissa do centro de gravidade do conjunto de dados)
Peso ao nascer em Kg de 10 RN
2,5
2,0
3,0
4,0
3,0
1,0
1,5
-
3,5
1,5
2,5
-
A média aritmética (representa-se por X é: 2,5+3,0+3,5+ ... 4,0 = 2,45
10
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Medidas de Tendência Central
Média Aritmética
Cálculo da média de dados em Tabela de Distribuição de Frequência
Classe
Ponto Médio
Freqüência
1,5Ι— 2,0
1,75
3
2,0Ι— 2,5
2,25
16
2,5Ι— 3,0
2,75
31
3,0Ι— 3,5
3,25
34
3,5Ι— 4,0
3,75
11
4,0 Ι— 4,5
4,25
4
4,5Ι— 5,0
4,75
1
n=100 Média (X): ponto médio de cada classe x respectiva freqüência
divido pelo n
X = 1,75x3 + 2,25x16 + ... 4,25x4 + 4,75x1 = 300
3 Kg
100
100
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
-
Medida de Tendência Central
Medida de dispersão:indicadores do grau de variabilidade
dos individuos em torno das medidas de tendência central
Variância:
Medir os desvios em relação a média
(diferença de cada dado e a média)
Não há média dos desvios pois sua soma é igual a zero
Ex.: 0,4,6,8,7
X (média) : 0+4+6+8+7 = 25 = 5
5
5
X – X (desvio em relação a média)
0-5=-5
4 – 5 = -1
A soma dos desvios é igual a zero
6–5= 1
8–5= 3
(-5 + -1)+1+3+2= - 6 + 6 = 0
7–5= 2
-
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Medidas de Tendência Central
Variância
Soma dos quadrados dos desvios
Dados
X
Desvios
(X – X)
Quadrado dos desvios
(X – X) 2
0
-5
25
4
-1
1
6
1
1
8
3
9
7
2
4
x = 5
 (x –x) = 0
 (x – x) 2 = 40
A soma do quadrado dos desvios não é usada como medida de dispersão,
porque o seu valor cresce com o nº de dados
Grupo I: 60, 70 e 80 Kg - Grupo II: 60, 60, 70, 70, 80, 80 Kg
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Medidas de Tendência Central
Variância
Cálculo da soma dos quadrados dos desvios
Grupo I
Grupo II
X
(x – X)
(x – X) 2
X
(x – X)
(x – X) 2
60
- 10
100
60
- 10
100
70
zero
zero
60
- 10
100
80
10
100
70
zero
zero
70
zero
zero
80
10
100
80
10
100
zero
400
zero
200
Então, para medir a dispersão dos dados em relação à média, usa-se a
variância (S2) que leva em consideração o n
S2 = soma dos quadrados dos desvios
n–1
Para os dados: 0, 4, 6, 8 e 7 a S2 = 40 = 40 = 10
5 –1 4
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica I
Medidas de Tendência Central
Desvio Padrão
Raiz quadrada da variância, sendo representava por S; tem a
mesma unidade de medida dos dados
Ex.: 0,4,6,8,7. S2 (variância) = 10
s (desvio padrão): √10 = 3,16
Coeficiente de variância (CV)
Razão entre o desvio padrão a a média x 100
CV = sx 100
X
Ex.: Grupo I: 3,1,5 anos (x = 3 anos; s2 = 4; s=2) : CV = 66,7%
Grupo II: 55,57,53 anos (x = 55 anos; s2 = 4; s = 2) : CV = 3,64%
Vejam à dispersão dos dados em ambos os grupos é a mesma,
mas os CV são diferentes (no grupo I a dispersão relativa é
ALTA)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Distribuição Normal
• Variáveis aleatórias: variam ao acaso (peso ao nascer)
• Gráficos com 2 extremos um máximo e um mínimo e entre eles,
uma distribuição gradativa (maioria dos valores ao redor da
média) : Curva de Gauss: As medidas que originam a estes
gráficos são variáveis com distribuição normal
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Distribuição Normal
• Características:
 A variável (peso ao nascer) pode assumir qualquer valor real
 O Gráfico da distribuição normal é uma curva em forma de
sino, simétrico em torno da média () (se lê “mi”).
 A área total da curva vale 1, significando que a probabilidade
de ocorrer qualquer valor real é 1.
 Pelo fato da curva ser simétrica em torno da média, os valores
maiores do que a média e os valores menores do que a média
ocorrem com igual probabilidade.
No SPSS, usamos o Kolmogorov-Smirnov ou Shapiro-Wilk na sua determinação
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Distribuição Normal
 Predicção de uma valor entre dois nº quaisquer:
Ex.: A probabilidade de ocorrência de um valor > 0 é 0,5, mas
qual é a probabilidade de ocorrer um valor entre 0 e z = 1,25?
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Distribuição Normal
Predicção de uma valor
Usar tabela de Distribuição Normal
Como usar esta tabela?
Localizar na 1a coluna o valor 1,2
Na 1a linha, está o valor 5.
n0 1,2 compõe com o algarismo 5, o n0 z = 1,25.
No cruzamento da linha 1,2 com a coluna 5 está o número
0,3944. Está é a probabilidade (39,44%) do ocorrer valor entre
zero e z= 1,25.
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
0
1
2
3
4
5
6
0,0
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,3
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,4
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,5
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,6
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,7
0,2580
0,2611
0,2642
0,2673
0,2703
0,2734
0,2764
0,8
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,9
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
1,0
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
1,3
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
1,4
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
Probabilidade de ocorrer valor entre zero e 1,25
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Distribuição Normal
• Predicção de uma valor: qual é a probabilidade de um individuo
apresentar um colesterol entre 200 e 225 mg%
 (média); 200 mg% /  = desvio padrão = 20 mg%
Cálculo da probabilidade associado à
Distribuição normal:
Z=X-
 = média ;

 = desvio padrão

X = valor pesquisado
A estatística Z mede quanto um
determinado valor afasta-se da média
em unidades de Desvio padrão
(quando coincide c/ a média, o escore é Z = 0)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Distribuição Normal
• Predicção de uma valor:
Z = X – 200 = 1,25
20
Consultando a Tabela de Distribuição normal, vemos que
a probabilidade de Z assumir valor entre 0 e Z = 1,25 é 0,3944 ou 39,44
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
0
1
2
3
4
5
6
0,0
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,3
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,4
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,5
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,6
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,7
0,2580
0,2611
0,2642
0,2673
0,2703
0,2734
0,2764
0,8
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,9
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
1,0
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
1,3
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
1,4
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
Probabilidade de ocorrer valor entre zero e 1,25
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Distribuição Normal
• Predicção de uma valor
Outro exemplo: Qual é a probabilidade uma pessoa apresentar
menos do que 190mg% de colesterol.
Para resolver este problema, é preciso "reduzir" o valor X = 190.
Obtém-se então:
Z = 190 - 200 = - 0,50 .
20
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Na Tabela de Distribuição Normal, a probabilidade de ocorrer valor maior
que a média 0 é 0,5;então, a probabilidade pedida é :
0,5 – 0,1915 = 0,3085 ou 30,85%
0
1
2
3
4
5
6
0,0
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,3
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,4
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,5
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,6
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,7
0,2580
0,2611
0,2642
0,2673
0,2703
0,2734
0,2764
0,8
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,9
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
1,0
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
1,3
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
1,4
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Correlação / Regressão
• Correlação
Associaçao entre duas variaveis peso e altura; em quanto
aumenta o peso à medida que aumenta a altura?
• Diagrama de dispersão:
• X = Horizontal (eixo das abscissas): variável independente ou
explanatória
• Y = Vertical (eixo das ordenadas) : variável dependente
A correlação quantifica quão bem o X e Y variam em conjunto
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Correlação +
Margotto, PR (ESCS)
Correlação -
Sem correlação
www.paulomargotto.com.br
Bioestatística Básica
Correlação / Regressão
Comp
Peso
Comp
Peso
104
23,5
98
15,0
107
22,7
95
14,9
103
21,1
92
15,1
105
21,5
104
22,2
100
17,0
94
13,6
104
28,5
99
16,1
108
19,0
98
18,0
91
14,5
98
16,0
102
19,0
104
20,0
99
19,5
100
18,3
Observem que à medida que o comprimento dos cães aumenta
(variável explanatória) o peso aumenta (variável dependente)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Correlação / Regressão
• Coeficiente de correlação: (r de Pearson) :
Expressa quantitativamente as relações entre duas variáveis
r = 0,8 – 1 – forte
Débito cardíaco e Pressão arterial
r = 0,5 – 0,8 – moderada
r=0,38 (correlação fraca)
R = 0,2 – 0,5 – fraca
Kluckow et al
r = 0 – 0,2 – insignificante
Cálculo do r:
r=
∑xy - ∑x∑y
n
∑x2 – (∑x)2
n
Margotto, PR (ESCS)
000000000
∑y2 – (∑y)2
n
www.paulomargotto.com.br
Bioestatística Básica
Correlação / Regressão
• Correlação: grau de associação / Regressão: capacidade
entre 2 variáveis
de predicção de um valor baseado
no conhecimento do outro
(prever Y conhecendo-se o X)
Equação da Reta de Regressão:
Y = a + bx (a= Y – bx)
a : coeficiente angular (inclinação da reta)
b: coeficiente linear (intersecção da reta com o eixo X)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Correlação / Regressão
• Exemplo: a correlação entre o peso pré-gravídico e o peso do RN foi de
0,22. Aequação da reta: Y = 2547, 79 + 12,8 x
Assim, uma gestante com peso pré-gravídico de 60 Kg espera-se um RN c/
peso de 3,315g
R2 ( r squared): coeficiente de determinação: proporção da variação total que
é explicada. Peso pré –gravídico e peso ao nascer :
r2 = 0,22 2 = 4,84 ≈ 5%
( o peso ao nascer é explicado pelo peso da mãe em apenas 5%)
(Tese de Doutorado – Curvas de Crescimento Intra-uterinas Margotto, PR)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Correlação / Regressão
• Base excess e PaCO2
Equação de regressão: Y = 1,07 BE + 40 ,98
r = 0,94 / r = 0.88 = 88%
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Crematócrito e a Composição Nutricional do Leite Materno
Crematócrito
X
Lipídio
Leite congelado:
-20oC por 7 dias
Wang CD, 1999
Bioestatística Básica
Crematócrito e a Composição Nutricional do Leite Materno
Crematócrito
X
Caloria
Y=5,99x+32,5 (leite fresco)
Y=6,20x+35,1 (leite congelado)
Equações de regressão
Hoje terminamos por aqui!
Wang CD, 1999
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
• Definição:
• O Risco relativo se baseia na observação de que nem
todos têm a mesma probabilidade (risco) de padecer um
dano, mas que para alguns este risco (probabilidade) é
maior do que para outros.
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
I - Conceito de Risco
É a probabilidade que tem um indivíduo ou grupo de
indivíduos de apresentar no futuro um dano em sua saúde.
Risco é probabilístico e não determinista.
Exemplo:
RN com peso entre 500 -1500g tem maior probabilidade de morrer
(na UTINeo do HRAS: 19,58- ano 2000), mas muito deles não morrem.
Risco é uma medida que reflete a probabilidade de que ocorra um
dano a saúde.
Margotto, www.medico.org.br
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
II - Grau de Risco
Mede a probabilidade de que o dano ocorra no futuro
Refere-se a um resultado não desejando.
Não deve ser confundido com o risco !!!
O dano em um RN seria a sua morte no período neonatal ou
seqüelas neurológicas consecutivas à asfixia, o risco é a
probabilidade de que o dano venha ocorrer neste RN, medindo-o
como um gradiente que vai de risco alto a baixo risco de morte
neonatal ou de seqüelas neurológicas, neste exemplo.
0
Baixo Risco
1
Alto Risco
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Graduar o risco É IMPORTANTE para programar atençã
segundo o enfoque de risco, priorizando o grupo, dentro d
população de maior necessidade.
Exemplo:
Dano:
Baixo Peso
Fatores de Risco:
• Pobreza
• Analfabetismo da mãe
• Doença Intercorrentes
• Desnutrição
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
III - Risco Relativo/Qui-quadrado
• Risco Relativo (RR): Mede o excesso de risco para um
dado dano nos indivíduos expostos ao fator de risco,
comparado com os que não estão expostos.
Fator
Patologia
Sim
Sim
a
Não
b
Total
a+b
Não
Total
c
a+c
d
b+d
c+d
n. = (a+b+c+d)
RR =
a/a+b
c/c+d
Margotto, PR (ESCS)
RR = Incidência do Risco nos que tem fator
p1 = a/a+b
RR= Incidência do Risco nos que não tem fato
.p2 = c/c+d
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
III – Tecnica da Prova de Hípótese:
RR =
a/a+b
c/c+d
RR = Incidência do Risco nos que tem fator
p1 = a/a+b
RR= Incidência do Risco nos que não tem fato
.p2 = c/c+d
Uma vez feito o cálculo de RR, torna-se necessário demonstrar
• Não há erros de registro, cálculo ou transcrição
RR é prático e estatisticamente significativo
• Um RR menor que 1,5 geralmente não é de valor prático
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATI
EM PERINATOLOGIA/TESTE DE HIPÓTESES
• Teste do X 2 (qui-quadrado):
(a x d – b x c) ½ )2
(a+b) x (d+c) x (b+d) x (a+c)
Qui-quadrado mede a probabilidade de as diferenç
encontradas em dois grupos de uma amostra ser
devidas ao acaso, partindo do pressuposto que,
verdade, não há diferenças entre os dois grupos
população donde provêm. Se a probabilidade for a
poderemos
concluir
que
não
há
diferenç
estatisticamente significativas. Se a probabilidade
baixa (particularmente menor que 5%) poderem
concluir que um grupo (A )é diferente do grupo B qua
ao fator estudado.
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Exemplo:
Cálculo do Risco em estudo: Baixo Pes
População total estudada: 6373
Morte perinatais observadas: 211
População com fator Baixo Peso: 724
Morte Perinatais com o fator baixo peso: 150
Fator
Baixo Peso
Sim
Não
Total
Sim
150 (a)
61 (c)
211
(a+c)
Morte Perinatal
Não
Total
574 (b)
724 (a+b)
5588 (d)
5649 (c+d)
6162
6373
(b+d)
n. = (a+b+c+d)
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Exemplo:
Fator
Baixo Peso
Sim
Não
Total
Cálculo do Risco em estudo: Baixo Peso
Morte Perinatal
Sim
Não
Total
150 (a)
574 (b)
724 (a+b)
61 (c)
5588 (d)
5649 (c+d)
211
6162
6373
n. = (a+b+c+d)
RR = a/a+b
c/c+d
Ou seja o RR = 19,2 150/724
61/5649
O Risco de Morte Perinatal de um RN de baixo peso
excede 19,2 vezes a de um RN de peso > 2500g
Margotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Exemplo 2 : Fator de Risco em estudo: ausência de pré - natal
Fator
Ausência de
Pré – Natal
Sim
Não
Total
Sim
117 (a)
94 (c)
211(a+c)
Morte Perinatal
Não
2625 (b)
3537 (d)
6162 (b+d)
Total
2742 (a+b)
3631 (c+d)
6373
n. = (a+b+c+d)
RR = 1,6 117/2742
94/3631
O Risco de Morte Perinatal de um RN sem pré-natal
excede 1,6 vezes a de um RN com pré-natal
Margotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Exemplo 2 : Fator de Risco em estudo: ausência de pré - nat
Fator
Ausência de
Pré – Natal
Sim
Não
Total
Sim
117 (a)
94 (c)
211(a+c)
Morte Perinatal
Não
2625 (b)
3537 (d)
6162 (b+d)
(a x d – b x c) ½ )2
(a+b) x (d+c) x (b+d) x (a+c)
Total
2742 (a+b)
3631 (c+d)
6373
n. = (a+b+c+d)
X 2 = 13,71
Podemos dizer que há uma associação significativa (p < 0,01) entre
ausência de pré-natal e morte perinatal, sendo que grau de
associação é: o risco de morte perinatal é 60% maior nos produtos
sem pré-natal (1,6 x 100 = 160: aumento de 60%: 100 + 60).
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Exemplo 3 : Risco de Morte neonatal (nos 1º 7 dias de vida)
Fator
Ausência de
Pré-Natal
Sim
Não
Total
Sim
58
38
96
Morte Perinatal
Não
2625
2573
6162
Total
2683
2575
6258
Risco Relativo (RR): 2,0
X2 – 11,8 (p<0,01)
O RR é o risco de adoecer em um grupo (grupo exposto)
em relação ao risco de adoecer em outro grupo (pessoas
não expostas). Se não houver associação entre a
exposição e a doença, o risco de adoecer não depende da
exposição e o RR é igual a 1.
Margotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Cálculos estatísticos básicos
relacionados ao Risco Relativo
( Braile, DM & Godoy, MF) ** versão 1999 **
Atenção:
Digitar apenas nas caselas verdes
EVE NTO
Gr.Estudo
Gr.Controle
Todos os cálculos são feitos automaticamente
sim
150
130
280
280
não
122
180
302
302
272
272
310
310
582
582
IC 95%
Taxa
eventos
no grupo
estudo: (a/(a+b)
Taxa dede
eventos
no G. Estudo
(EER) = a/(a+b)
Taxa
eventos
no grupo
(c/(c=d)
Taxa dede
eventos
no Gr.Controle
(CER) = controle:
c/(c+d)
Risco relativo
(RR)=EER
/ CER
Risco
relativo:
a/(a+b)
/ c(c+d)
Redução
do
risco
relativo
(RRR)
=
(CER-EER)/CER
Redução do risco relativo
(RRR)
Redução do risco
=CER-EER
Redução
doabsoluto
risco (ARR)
absoluto
Número Necessário
p/tratamento(NNT)=(100/ARR)
Número
Necessário
p/tratamento
55,1 %
49,2
61,1
41,9 %
1,32
0,32
36,4
1,11
0,56
47,4
1,56
0,11
13,2 %
8
21,3
19
5,1
5
Observação: Valores em Vermelho são valores negativos
www.paulomargotto.com.br
Clicar duas vezes
Para ativar a planilha
Braile DM e Godoy MF
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Exemplo 3 : Risco de Morte neonatal (nos 1º 7 dias de vida)
Fator
Ausência de
Pré-Natal
Sim
Não
Total
Sim
58
38
96
Morte Perinatal
Não
2625
2573
6162
Total
2683
2575
6258
Risco Relativo (RR): 2,0
X2 – 11,8 (p<0,01)
Um risco menor que 1 implica em uma redução da doença
com exposição, enquanto que um RR maior que 1, sugere
um aumento da doença com exposição. Quanto maior for o
RR, maior será a associação entre a exposição e o dano.
argotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
• Junto com a obtenção do RR se deve estimar o se
intervalo de confiança de 95%, uma vez que é possível obte
um valor do RR alto, mas se o tamanho da amostra fo
pequeno, o seu valor será duvidoso.
• Os limites de confiança estão muito relacionados com o
valores de p e se não inclui o valor de 1, é equivalente
significação estatística a um nível de 5%.
Vamos ao exemplo:
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
O intervalo de confiança a 95% é:
… 1 … 1,2
2,05
Como o extremo inferior deste intervalo de confiança
excede o valor 1, se pode dizer, neste caso, que há uma
associação estatisticamente significativa em um nível de 5%
entre a ausência de pré-natal e mortalidade perinatal, sendo
que o risco de morte perinatal nos produtos sem pré-natal
excede, significativamente 1,6 vezes a dos produtos com prénatal.
Margotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
O Intervalo de Confiança 95% significa que há 95% de probabilidade de
que o intervalo calculado contenha o verdadeiro valor do parâmetro
estudado.
Por exemplo RISCO RELATIVO de 1,6 com IC95% de
1,2 a 2,05.
Isto quer dizer que no experimento realizado o valor
encontrado foi de 1,6 e que há 95% de probabilidade que o verdadeiro
valor seja um número qualquer entre 1,2 e2,05. Quando o intervalo de
confiança contém o valor 1,00 significa que não há diferença estatística
entre o grupo estudado e o grupo controle. Quando o valor máximo do
IC 95% é menor que 1,00 o grupo de estudo se comportou de modo
significativamente melhor que o grupo de controle e quando o valor
mínimo do IC 95% for maior que 1,00 significa que o grupo de estudo
foi significativamente pior que o grupo controle. www.braile.com.br
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO
RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
V-Odds Ratio (OR) ou Razão das chances
Os estudos de casos-controles comparam a freqüência de
expostos a um determinado fator entre um grupo de indivíduos que
apresenta a doença – casos – e outro que não a tem – controle.
Fator
Sim
Não
Total
Sim
a
b
a+b
Dano
Não
c
d
c+d
n (a+b+c+d)
OR = axd
bxc
A razão das chances (OR) é definida como a probabilidade de que
um evento ocorra dividido pela probabilidade de que ele não ocorra.
Margotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO
RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Clicar duas vezes
Para ativar a planilha
Braile DM e Godoy MF
INTERPRETAÇÃO DO RISCO
RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
IV-Seleção dos fatores de risco com fins de intervenção
(Risco Atribuível)
Risco Atribuível (RA): este mede a percentagem da
incidência do dano que se reduz no grupo exposto ao fator,
se este fosse neutralizado (impacto do controle no grupo
exposto). Quando se refere à população, temos o risco
Atribuível à População (RAP):
RA
Taxa de Incidência no
Grupo
Com fator de risco (P1)
Menos
Taxa de incidência no
grupo sem o fator de risco (P2)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO
RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
IV-Seleção dos fatores de risco com fins de intervenção
(Risco Atribuível)
O RA é outra medida de associação entre fatores e
danos e pode ser definido com a diferença entre a
probabilidade ter o dano nos que estão expostos ao fator e a
probabilidade de ter o dano nos que não estão expostos.
Assim, é a diferença de probabilidade atribuível à exposição
ao fator e se expressa como:
RA = P1 – P2
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO
RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
Exemplo: Ausência de pré-natal e o dano mortalidade
perinatal, o risco atribuível é:
RA = P1 – P2
P1 = 117/2742 = 0,043
P2 = 94/3631 = 0,26
RA = 0,043 – 0,26 = 0,017
Fator
Ausência
de Pré –
Natal
Sim
Não
Total
Sim
117 (a)
94 (c)
211(a+c)
Morte Perinatal
Não
Total
2625 (b)
2742 (a+b)
3537 (d)
3631 (c+d)
6162
6373
(b+d)
n. = (a+b+c+d)
Como interpretar este valor de RA:
Significa que 17 mortes perinatais de cada 1.000 (mil)
gestantes são atribuíveis à ausência de pré-natal.
Margotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO
RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
• Para saber o que isto significa em uma comunidade
específica, é necessário relacionar esta probabilidade (0,017)
com a freqüência do fator na população.
• A forma de estimar o impacto é calculando o Risco
Atribuível ao fator da população (RAP). Para calcular o
RAP emprega-se a seguinte fórmula:
RAP% F% (P1 – P2)
P (geral)
P1 – P2 = a probabilidade encontrada
F% = a freqüência do fator na população
P (geral) = a probabilidade do dano
entre todas as gestantes
Margotto, PR (ESCS)
www.paulomargotto.com.br
INTERPRETAÇÃO DO RISCO
RELATIVO/ODDSRATIO
EM PERINATOLOGIA/TESTE DE HIPÓTESES
• No caso : Ausência de pré-natal e o dano mortalidade
perinatal, o risco atribuível ao fator da população (RAP) é:
RAP% = 43 X 0,017 = 22 %
211 / 6.373
Significa que 22% da probabilidade de mortalidade
perinatal da área em estudo, está associada à freqüência
do fator ausência de pré-natal em 43% das gestantes.
www.paulomargotto.com.br
Bioestatística Básica
Teste de Hipótese


Hipótese nula (H0): não há diferença
Hipótese alternativa (H1): há diferença
Hipótese: resposta presumida e provisória que de acordo
com critério será ou não rejeitada
Processo para testar hipótese:
1. Estabelecer Ho
2. Estabelecer H1
3. Determinar tamanho da amostra
4. Colher dados
5. Estudo estabelecido para verificar se o H0 é verdadeiro
6. Rejeitar ou não a H0
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Teste de Hipótese

Segundo R.A. Fisher: todo experimento existe somente com o
propósito de dar os fatos uma oportinidade de afastar a H0

Erro tipo I: rejeitar a H0 sendo verdadeira (fato obtido pelo azar) :
rara ocorrência estatística; amostras pequenas

Erro tipo II: aceita a H0 sendo falsa (erro mais frequente);
significação estatística: máxima probabilidade de tolerar um erro tipo I.
α= 5% (p 0,05): ≤ 5% de rejeitar a H0 (sendo verdadeira) e aceitar a H1
α= 1% (p 0,01): ≤ 1% de rejeitar a H0 (sendo verdadeira) e aceitar a H1
α
α
Margotto, PR (ESCS)
erro tipo I e
erro tipo I e
‘
erro tipo II
erro tipo II
www.paulomargotto.com.br
Bioestatística Básica
Teste de Fisher ou da Probabilidade Exata

Usado para amostras pequenas

Menos erro tipo I e II em relação ao qui-quadrado

n < 20 / n > 20 < 40
Ex.: a) célula da matriz de decisão com o valor 0
Suposição de uma determinada enzima em pessoas submetidas a uma reação
sorológica
Reação
P = (a+b!) x (C=d!) x (a+c!) x (b+d!)
n! x 1 / a! b! c! d!
Enzima
Total
Presente
Ausente
+
5
1
6
-
0
3
3
Total
5
4
9
P = [ (6! 3! 5! 4! / 9!] x [1/5! 1! 0! 3!)
P = 0,046 = 4,76%
P <=0,05: as pessoas submetidas a uma reação sorológica
apresentam significativamente uma determinada enzima (afastamos a
H0)
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica


Teste t
Testar o QI médio entre crianças nascidas a termo e prematuras
Testar uma droga (grupo tratado/grupo controle)
Teste t: analisa grupos simples ou compara 2 grupos
(variável com distribuição normal ou aproximadamente normal)

Passos:
 Nível de significância:
 Média de cada grupo:
Variância de cada grupo:
S21: variância do grupo 1
S22: variância do grupo 2

letra grega 
X1: média do grupo 1
X2: média do grupo 2
• Variância Ponderada
N1 é o nº de elementos do grupo 1
N2 é o nº de elementos do grupo 2
S2 = (n1 – 1)2 + (n2 – 1)
S22
O valor t é definido
n1 +pela
n2 - fórmula
2
t=
√ S2
Margotto, PR (ESCS)
X 2 – X1
1
1
n1 + n2
www.paulomargotto.com.br
Bioestatística Básica
Análise de Variância/Estatística F
(ANOVA: Analysis of Variance)
Usado para comparar médias de mais de duas populações
Ex.: testar 4 drogas diferentes (diuréticos) ao mesmo tempo e
avaliar o efeito de cada droga sobre o débito urinário em 16
voluntários.
teste t: comparar os grupos 2 a 2 (6 testes t separados)
- perda de tempo
- erro tipo I de 30% (5% de erro em 6 análises)
Então, vamos usar o teste ANOVA (comparação de pares):

Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística
Básica
Bioestat
ística B
ásica I
Testes não – paramétricos
 Usados quando a distribuição da população é altamente assimétrica
 Não são tão eficientes quanto ao paramétricos
 Variaveis Nominais
 Teste do Sinal - Sign Test: variáveis qualitativas ou nominais. Este
teste recebe este nome porque a diferença em cada par é convertida
nos sinais de (+), de (-) ou (zero) - quando não houver diferença.
Alternativa nãp paramétrica (menos poderosa) do teste t para amostras
emparelhadas. Pode ser aplidado para amostras não emparelhadas
- H0: 1/2 dos sinais são (+) e 1/2 dos sinais são (-)
- H1: a proporção de vezes (p) em que aparece o sinal (+) ou (-), seja igual
a 0,5; valendo-se disto, é possível gerar um escore Z, utilizando a
fórmula:
Z = 2 (p´ - 0,5) √ n
n: nº de pares em que houve a diferença
p,: é a freqüência de sinais (+) ou negativos (-).
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestat
ística Básica
Básica I
Bioestatística
Testes Estatísticos não – paramétricos
Wilcoxon Signed Rank Sum Test (Teste de Wilcoxon):
Este teste destina-se a comparar dois grupos emparelhados; é usado
exatamente da mesma situação do teste t para amostras emparelhadas.
Teste de U de Mann – Whitney
•
Alternativa para teste t para amostras independentes
Bioestatística Básica
Bioestatística Básica
Bioestatística Básica
Básica I
Bioestatística

Sensibilidade/Especificidade/Valor Predictivo
Usamos Tabelas de Dupla entrada (matriz de decisão) para a
apresentação numérica já que os dados qualitativos:
Patologia confirmada
Resultado do
procedimento
Sim
Não
Sentido da
analise
+
a verdadeiros
positivos
b falsos positivos
a+b
-
c falsos negativos
d verdadeiros
negativos
c+ d
a+ c
b+d
a + b + c + d (n)
Sensibilidade: a (considera os acertos positivos)
a+c
p
Esfecificidade:
d (considera os acertos negativos)
b+d
Margotto, PR (ESCS)
www.paulomargotto.com.br
Bioestatística Básica
Bioestatística Básica
Bioestat
ística B
ásica I
Bioestatística
Básica
Sensibilidade/Especificidade/Valor Predictivo
Para calcularmos o VPP e o VPN, recorremos à matriz de decisão,
sendo que agora, a análise é feita por linha (sentido horizontal).
Patologia
Resultado do
Procedimento
Sim
Não
+
a
b
a+b
-
c
d
c+d
a+c
b+d
a+b+c+d= (n)
Sentido da Análise
VPN =
Margotto, PR (ESCS)
d (expressa a confiabilidade de um
c + d resultado de exame negativo)
www.paulomargotto.com.br
Bioestatística Básica
Bioestatística Básica
Significância: ausência da unidade no intervalo de confiança
Bioestatística Básica
Cálculos estatísticos básicos
para Testes Diagnósticos (versão 1999)
( Braile, DM & Godoy, MF)
Padrão
Atenção:
Digitar apenas nas caselas verdes
Teste
diagnóstico
+
-
Todos os cálculos são feitos automaticamente
+
-
30
21
51
44
74
30
51
74
125
IC
% Sensibilidade = a/(a+c)
% Especificidade = d/(b+d)
% Probabilidade pré-teste = (a+c)/(a+b+c+d)
% Valor preditivo positivo = a/(a+b)
% Valor preditivo negativo =d/(c+d)
% Acurácia = (a+d)/(a+b+c+d)
ODDS pré-teste= prob préteste/(1-prob préteste)
Likelihood ratio para teste posit=sensib/(100-especif)
Likelihood ratio para teste negat=(100-sensib)/especif
Estatística Kappa (grau de concordância corrigido)
40,5
58,8
59,2
58,8
40,5
48,0
1,451
1,0
1,0
-0,01
Ouro
95%
%
29,4
51,7
%
45,3
72,3
%
50,6
67,8
%
45,3
72,3
%
29,4
51,7
%
39,2
56,8
-0,18
0,16
(<0,20=pobre;0,21-0,40=fraca;0,41-0,60=moderada; 0,61-0,80=boa;>0,80=muito boa)
Clicar duas vezes para
Ativar a planilha
Margotto,PR
Braile DM e Godoy MF
Bioestatística Básica
Curva “ROC”

ROC - Receiver Operator Caracteristic

COR - Características de Operação do Receptor
Forma de representar a relação normalmente
antagônica entre SENSIBILIDADE e ESPECIFICIDADE
de um teste diagnóstico quantitativo, ao longo de um
contínuo de valores ponto de corte (“cut off point”)
O “cut off point” vai influenciar as características do teste
A Curva ROC descreve diferentes valores de SENS e
ESPECIF para um determinado número de valores “cut
off point”



Margotto,PR
Bioestatística Básica
Curvas “ROC”
-Permitem evidenciar os valores para os
quais existe maior otimização da
sensibilidade em função da especificidade
ponto em que se encontra
mais próximo do canto superior esquerdo
do diagrama
-Permitem quantificar a exatidão de um
teste diagnóstico (proporcional à área sob a
curva)
-Permitem
comparar
testes
diagnósticos
Margotto,PR
CURVA ROC
Falso- positivo (1-especificidade)
Teste A-melhor acurácia que o teste B (teste inválido: os seus resultados
não são melhores do que os da chance)
Ponto 1: maior valor de sensibilidade e especificidade; ponto 2: maior
sensibilidade, porem menor especificidade; ponto 3: maior especificidade,
porém, menor sensibilidade
A escolha do “cut off” vai depender do interesse em aumentar a
sensibilidade ou a especificidade
Margotto,PR
RAZÕES DE
VEROSSIMILHANÇA/RAZÃO DE
PROBABILIDADES

Representam uma forma de descrever o desempenho de um
teste diagnóstico, podendo ser usadas para calcular a probabilidade
de doença após um teste positivo ou negativo.
É definida como a probabilidade de um resultado do teste em
pessoas com a doença, dividida pela probabilidade do resultado do
teste em pessoas sem a doença.
Assim temos:
Verossimilhança positiva (RV+): EXPRESSA QUANTAS VEZES
É MAIS PROVÁVEL ENCONTRAR UM RESULTADO POSITIVO
EM PESSOAS DOENTES QUANDO COMPARADO COM
PESSOAS NÃO DOENTES
RV+=Sensibilidade/1-Especificidade): (a /a+c) / b/b+d)
Margotto,PR


-Vesossimilhança negativa (RV-):
EXPRESSA QUANTAS VEZES É MAIS
PROVÁVEL ENCONTRAR UM RESULTADO
NEGATIVO EM PESSOAS DOENTES
QUANDO COMPARADO COM PESSOAS NÃO
DOENTES
RV- = 1-Sensibilidade/especificidade): (c/a+c) /
(d/d+b)
Uma das vantagens da VEROSSIMILHANÇA é
ser menos susceptível a mudanças em função
da prevalência da doença.
Margotto,PR

Vejamos um exemplo, para melhor
compreensão:
Em 182 pacientes com faringite aguda, o teste
rápido foi capaz de diagnosticar faringite em 21
de 22 pacientes (sensibilidade de 95,45%) e
afastou a possibilidade de faringite em 154 de
160 pacientes (especificidade de 96,25%).
Diante de um resultado positivo, 77,78% dos
pacientes eram verdadeiros positivos (valor
preditivo positivo) e diante de um resultado
negativo, 99,35% dos pacientes eram
verdadeiros negativos(valor preditivo negativo)
Margotto,PR
Qual é a RV positiva? (a /a+c) / b/b+d):
25,3
 Qual é a RV negativa? (c/a+c) / (d/d+b):
0,05

Margotto,PR
Interpretação: a chance (definida como razão de
duas probabilidades) da doença aumenta 25 vezes
mais com o resultado positivo. A chance de
encontrar um resultado negativo em pessoas
doentes é mínima!
 Questão de Residência Média-2007-Universidade
Federal Fluminense-UFF.
A razão da probabilidade de um teste positivo em
doente, contra a probabilidade de o mesmo teste ser
positivo em não doente, define:
a) sensibilidade
b) razão de prevalências
c) valor preditivo de um teste positivo
d) razão de falsos negativos
e) razão de verossimilhança de um teste positivo

Margotto,PR
Bioestatística Básica
Curva de Kaplan-Meier
Nos estudos de avaliação das taxas de sobrevivência:
resultado será binário-sobrevivência ou morte do
paciente
Objetivo: estimar o intervalo de tempo que os
pacientes sobrevivem com tipos específicos de
tratamento ou em condições específicas.
variável dependente (resultado): é sempre o tempo
até a ocorrência de determinado evento
Na análise de sobrevivência: compara-se a rapidez
com que os participantes desenvolvem determinado
evento
Tempo de sobrevida na análise de sobrevivência
tempo até a ocorrência de determinado evento.
Margotto,PR
Bioestatística Básica
Curva de Kaplan-Meier
Técnicas estatísticas usadas na análise clássica e na
análise de sobrevivência (Botelho F et al)
DIFEREM NO TIPO DE VARIÁVEL DEPENDENTE)
Margotto,PR
Bioestatística Básica
Curva de Kaplan-Meier
Nos estudos de seguimento:
- pacientes que não atingem o tempo total
de seguimento previsto, são excluídos.
Na análise de sobrevivência:
os dados destes pacientes são
aproveitados na análise final, mesmo que
não desenvolvam o evento em estudo.
designa-se o indivíduo como censurado
Margotto,PR
Bioestatística Básica
Curva de Kaplan-Meier



Como é feita a análise dos dados na análise de
sobrevivência/aparecimento de eventos?
O método de Kaplan-Meier consiste em dividir o
tempo de seguimento em intervalos, cujos
limites correspondem ao tempo de seguimento
em que houve eventos.
Este método calcula a sobrevivência cada vez
que um paciente morre
Margotto,PR
Bioestatística Básica

Curva
de
Kaplan-Meier
Chorioamnionitis Alters the Response to Surfactant in Preterm Infants.
.
J Pediatr 2010;156:10-5) Been JV et al Observe o TEMPO DE EXTUBAÇÃO
(corioamnionite fetal, corioamnionite sem envolvimento fetal e sem corioamnionite)
85%
estatística do logrank de Cox-Mantel
65%
Kaplan-Meier permite avaliar corretamente o ritmo
da ocorrência dos nos diferentes grupos em estudo.
Curvas de Kaplan-Meier analisando o tempo até a extubação após primeira dose
dose de surfactante exógeno para os grupos com base na histologia da placenta
Margotto,PR
Bioestatística Básica
Curva de Kaplan-Meier
Teste estatístico na análise de significância:
-Logrank test (também conhecido por
estatística do logrank de Mantel, estatística
do logrank de Cox-Mantel
 Análise multivariada: Regressão de Cox
A idade gestacional poderia explicar a menor
chance de extubação após corioamnionite? A
regressão de Cox foi realizada com ajuste para
a idade gestacional e peso.
Margotto,PR
Curva de Kaplan-Meier
Regressão de Cox estimando o tempo de extubação após a segunda dose de surfactante
exógeno, ajustado para a idade gestacional e peso nos grupos de acordo com a histologia da
placenta, p <0,05 HC+F VS HC-
Hazard Rate-HR- de 0,12 com intervalo de confiança de 0,01-0,06 – p=0,046
(a menor idade gestacional explica parcialmente estas diferenças!)
Bioestatística Básica
Curva de Kaplan-Meier




o tamanho da amostra diminui ao longo do tempo de
observação (as estimativas nos períodos finais de
observação (parte direita da curva) são bastante
imprecisas
censura dos
Quanto menor o número de censurados, menor será o
viés de seguimento
O método de Kaplan-Meier é um método não
paramétrico, sendo o único que supõe que os indivíduos
censurados comportaram do mesmo modo dos
indivíduos seguidos até que ocorra o evento. Para cada
período de tempo se calcula a probabilidade de
sobreviver.
Margotto,PR
Curva de Kaplan-Meier
Análise de Sobrevivência usando o SPSS para Windows, usando o
método de Kaplan-Meier e obtenção de Curvas de Sobrevivência e
compará-las mediante a realização do teste logrank


O tempo de seguimento é uma variável
quantitativa (expressa em dias, meses, anos) e
expressa a diferença entre as datas de início e
de finalização do estudo.
O estado do paciente ao final do seguimento é
uma variável categórica dicotômica (1: evento
que pode ser morte, recaída, etc e 0: não
ocorreu evento, casos censurados ou
apresentaram um evento após o término do
estudo).
Exercício com o SPSS
Margotto,PR
Bioestatística Básica


Regressão Logística
É uma regressão múltipla, mas com
variável de saída categórica dicotômica (dependentesim/não/alto-baixo/bom-ruim)) e
variáveis previsoras (explicativas ou independentes)
contínuas ou categóricas.
A resposta na regressão logística é expressa por
meio de uma probabilidade de ocorrência
Importância: análise de variáveis interferentes
Bioestatística Básica
Sódio sérico como um fator de risco para a mortalidade intrahospitalar em
pacientes grave à admissão
Regressão Logística




A Odds ratio para a morte dentro de 30 dias da admissão foi de
-4,07 (IC a 95%%: 2,95-5,63) quando o paciente apresentava
hipernatremia e
-3,36 (IC a 95% de 2,59-4,36) quando apresentava hiponatremia.
A regressão logística foi usada para calcular a Odds ratio ajustada:
fatores que foram incluídos neste ajuste foram o escore de severidade da
doença, permanência na UTI, efeito da idade, sexo, transfusão de sangue e
sepse. Após o ajuste, para hipernatremia,
A Odds ratio (ajustada) para a morte no paciente com hipernatremia
passou para 1,41 (Intervalo de confiança de 0,97-2,07: não alcançou a
significância, pois no intervalo de confiança contém a unidade)
A Odds ratio (ajustada) para hiponatremia passou para 2,00 (Intervalo de
confiança a 95% de 1,44-2,77, ou seja, foi menor, porém continuou
significativa, pois no intervalo de confiança não contém a unidade).
Assim, o sódio sérico é um poderoso marcador inicial para a mortalidade,
mas a mortalidade no grupo hipernatrêmico é primariamente um fator de
severidade da doença. Já para a hiponatremia o aumento da mortalidade é
independente de outras variáveis.
Bioestatística Básica
Regressão Logística:
Associação de ranitidina com infecções,
enterocolite necrosante e desfecho
fatal em recém-nascidos

Foi realizada análise multivariada usando a regressão
logística binária para avaliar se a idade gestacional, peso ao
nascer, escore de Apgar, CRIB, hemorragia intraventricular,
canal arterial pérvio, acesso vascular central ou ventilação
mecânica afetaram a precrição de ranitidina.
Terrin, 2012
Bioestatística Básica
Regressão Logística:
Resultados
A regressão logística binária (constante B de 6.334) mostrou que a ranitidina
prescrita pelos médicos não foi afetada pela:








.
Idade gestacional (B 2 0.167, odds ratio [OR] 0.846, 95% IC 0.694 –1.031,
P = .098),
Peso ao nascer (B 2 0.001, OR 0.999, 95% IC 0.997–1.001, P = .444),
sexo (B 0.708, OR 2.031, 95% IC 0.972–4.243, P = .060),
Escore de Apgar (1 minute: B 2 0.147, OR 0.863, 95% IC 0.653–1.141, P =
.301; 5
minute: B 2 0.099, OR 0.905, 95% IC 0.486 – 1.687, P = . 754)
Escore do CRIB ((B 0.008, OR 1.008, 95% IC 0.869 –1.169, P = . 918 ), IV
(B 0. 755, OR 2. 12 7, 9 5% IC 0.635–7.124, P =.221)
Canal arterial pérvio: (B 20.281, OR 0. 75 5, 95 % IC 0 .3 23–1.764, P =
.516),
Acesso vascular central (B 0.004, OR 1.004, 95% IC 0.960–1.050, P =.855)
ou
Ventilação mecânica ( B 20.062, OR 0.940, 95% IC 0.850–1.040, P = .233)
RN tratados com ranitidina tiveram mais infecções (OR 5.5;
IC a 95%:2.9-10.4, P < 0,001)
Bioestatística Básica



[Survival and morbidity of premature babies with less than 32 weeks of gestation in the central region of Brazil].
Castro MP, Rugolo LM, Margotto PR.
Rev Bras Ginecol Obstet. 2012 May;34(5):235-42. Portugues
Margotto, PR
Bioestatística Básica
Bioestatística Básica
Controle da influência do peso ao nascer e idade gestacional
(análise multivariada com regressão logística binária)
Hemorragia pulmonar:
OR=3,3 (IC 95%:1,4-7,9-p=0,01)
SDR (doença da membrana hialina): OR=2,5 (IC 95%:1,1-6,0-p=0,04
Persistiram no modelo
Margotto, PR
Bioestatística Básica
Regressão Logística:



No exemplo a seguir vamos realizar uma
Regressão Logística Binária utilizando o SPSS.
No exemplo:
a variável resposta será a ocorrência de
Apgar<= 3 no 5º minuto (sim ou não),
caracterizando uma variável binária.
as variáveis independentes escolhidas foram
aquelas que se associaram individualmente ao
Apgar <=3 no 5º minuto: corticóide, hipertensão
materna, tipo de parto e pré-natal.
Margotto, PR, 2012
Bioestatística Básica
Regressão Logística:


Neste exemplo, podemos afirmar que as chances do
RN cuja mãe recebeu esteróide pré-natal de apresentar
um Apgar < =3 reduziu em 57,3% (Exp (B) de 0,427: 10,427=0,573 x 100= 57,3%) em relação ao RN não
exposto ao esteróide pré-natal.
Já a hipertensão materna constituiu um fator de risco,
aumentando em 2,3 vezes mais o risco de do RN cuja
mãe teve hipertensão de apresentar um Apgar <= 3 em
relação ao RN cuja mãe não teve hipertensão. Observe
que no intervalo de confiança de ambas variáveis
previsora incluídas no modelo NÃO contém a unidade).
Para busca Eletrônica,
consultem!
BUSCA ELETRÔNICA-RESUMINDO
Paulo R. Margotto –ESCS www.paulomargoto.com.br /
[email protected]
É importante que se reconheça a necessidade da informação e a
coloque em forma de questão clínica respondível
MEDLINE
(www.pubmed.com)
Iniciamos a busca sempre pelo
Busca Eletrônica: como fazer
Autor(es): Paulo R. Margotto
Consultem também: BIOESTATÍSTICA -RESUMINDO
Bioestatística-resumindo
Autor(es): Paulo R. Margotto
Bioestatística Básica
ESPERO TER SIDO ÚTIL!
Brasília, 18/5/2012
Download

Bioestatística Básica I - Paulo Roberto Margotto