ANÁLISE DE SOBREVIVÊNCIA
M Eduarda D. S. Matos
Coimbra, 19 de Abril de 2010
O que é a análise de sobrevivência?
A análise de sobrevivência é um conjunto de processos estatísticos, utilizados na análise
dos dados, para a qual a variável de interesse é o tempo que decorre até que um
acontecimento se verifique.
Calcula-se o tempo de sobrevivência iniciando-o num ponto de partida natural para o
estudo (ex: data da cirurgia ou diagnóstico de uma doença) até ao ponto em que o doente
alcança o limite de interesse.
O tempo pode ser analisado em anos, meses, semanas ou dias, desde o início do “follow-up” até que o
acontecimento ocorra
Por acontecimento, significamos morte, incidência da doença, recaída/ remissão, cura, ou
qualquer experiência de interesse que pode acontecer a uma pessoa (por ex. regresso ao
trabalho)
Exemplos:
• Doentes com leucemia/ tempo em remissão (semanas)
• Coorte livre de doença/ tempo até ocorrer um enfarte
• População idosa (60+) / tempo até à morte
• Transplantes de coração/ tempo até à morte (meses)
Na maioria das análises existem dados truncados ou censurados (censored),
quando temos informação acerca do tempo de sobrevivência, mas não temos o
tempo de sobrevivência exacto, ou seja o doente durante o estudo não alcançou
o limite de interesse.
EXEMPLO DE DADOS TRUNCADOS OU CENSURADOS
Os doentes de um ensaio de um novo medicamento para a infecção de HIV
podem permanecer sem SIDA até à conclusão do estudo. Isto pode dever-se ao
facto do ensaio acabar num momento em que ainda não tinham contraído SIDA,
ou porque se retiraram estes indivíduos do estudo antes de contraírem a doença,
ou ainda porque morreram por causas não ligadas à SIDA, antes do final do
estudo.
Há geralmente três razões para isto acontecer:
O acontecimento não se dá antes do fim do estudo
A pessoa não é seguida até ao fim
A pessoa não continua no estudo porque por exemplo morre (a morte não é o
que se está a analisar).
Objectivos da análise de sobrevivência
Estimar e interpretar sobrevivência e/ou funções de
risco (hazard) de dados de sobrevivência
Comparar funções de sobrevivência e/ou de risco
Avaliar a relação das variáveis explicativas
(exploratórias) com o tempo de sobrevivência
REPRESENTAÇÃO DE DADOS DE SOBREVIVÊNCIA
Pode ser desenhada uma linha horizontal para cada doente, sendo o seu
comprimento o tempo de sobrevivência. Desenham-se as linhas da esquerda para
a direita e é possível distinguir-se os doentes que alcançam o limite dos que são
censurados, através de diferentes símbolos no final da linha.
Contudo, estes gráficos não resumem os dados e é difícil obter-se um significado
da sobrevivência global.
As curvas de sobrevivência são geralmente calculadas pelo método de KaplanMeier
Quando se desconhece o tempo exacto de sobrevivência, calculam-se as
probabilidades de sobrevivência, através do método actuarial.
Muitas vezes, traduz-se a sobrevivência referindo-se às probabilidades de
sobrevivência (com intervalos de confiança) em determinados pontos temporais
na curva, tal como por exemplo, as taxas de sobrevivência aos 5 anos, em
doentes pós tratamento ao cancro da mama. Em alternativa, pode indicar-se a
mediana do tempo de sobrevivência (o tempo em que 50% dos indivíduos fizeram
progressos).
Pode-se pretender verificar o impacto de inúmeros factores de interesse na
sobrevivência, tal como por exemplo, o tratamento e a gravidade da doença.
Assim podem representar-se as curvas de sobrevivência, de forma separada, para
subgrupos de doentes; estas fornecem um meio de se verificar visualmente se os
diferentes grupos de doentes alcançam o limite a taxas diferentes.
Exemplo:
Acontecimento X: morte
•O indivíduo A, por exemplo é seguido desde o início do estudo até ter ocorrido o
acontecimento de interesse na 5ª semana; o tempo de sobrevivência foi de 5
semanas e não é truncado
•O indivíduo B também é observado no início do estudo mas é seguido até ao fim
das 12 semanas de estudo sem se ter verificado o acontecimento (morte); o
tempo de sobrevivência é truncado, porque apenas podemos dizer que esteve
vivo 12 semanas.
•O indivíduo C entra no estudo entre a 2ª e a 3ª semana, e é seguido até ter
desaparecido à 6ª semana; o tempo de sobrevivência é truncado em 3,5 semanas.
•O indivíduo D entra na 4ª semana, e é seguido até ao fim do estudo sem se
verificar o acontecimento; o tempo de sobrevivência truncado é de 8 semanas.
•O indivíduo E entra no estudo na 3ª semana e é seguida até à 9ª semana, em que
é perdido de vista; o seu tempo de sobrevivência truncado é de 6 semanas.
•O indivíduo F entra na 8ª semana e é seguido até que decorre o acontecimento à
semana 11,5. Tal como o indivíduo A não é truncado, o tempo de sobrevivência é
de 3,5 semanas.
Assim obteríamos a seguinte tabela
Indivíduo
Tempo de
sobrevivência
Morto (1)
Truncado
(0)
A
5
1
B
12
0
C
3,5
0
D
8
0
E
6
0
F
3,5
1
Outro exemplo
ID data do diagnostico
1
2
3
4
5
2005/01
2005/04
2005/03
2005/05
2005/02
morte mês da morte
1
1
0
0
0
última observação follow-up
2005/07
2005/09
2005/10
2005/10
2005/08
6
5
7
5
6
FUNÇÃO OU DISTRIBUIÇÃO DE SOBREVIVÊNCIA- É uma função cronológica
habitualmente designada pela letra S(t) , que se inicia num determinado momento
no tempo, com 100% da população ainda viva e com saúde e nos permite calcular
qual a percentagem dessa população ainda viva e com saúde noutros momentos
ao longo do tempo.
DADOS COMPLETOS
O tempo de sobrevivência de 10 doentes é o seguinte
1, 2, 2, 4, 5, 7, 11, 16, 20, 33
1.Construa a tabela pelo método intuitivo.
ti
ni
di
si
Si (si/N)
1
10
1
9
0,9
2
9
2
7
0,7
4
7
1
6
0,6
5
6
1
5
0,5
7
5
1
4
0,4
11
4
1
3
0,3
16
3
1
2
0,2
20
2
1
1
0,1
33
1
1
0
0,0
O tempo de sobrevivência mediano é de 5 meses ou seja 50% dos doentes têm
um tempo de sobrevivência de 5 meses.
2. Construa a tabela de sobrevivência pelo método produto-limite (Kaplan-Meier).
n1=N
n i+1= n i-d i
t0=0 e
S0=1
ti
ni
di
qi
pi=1- qi
Si = Si-1 pi
1
10
1
1/10
9/10
1*9/10=0,9
2
9
2
2/9
7/9
9/10*7/9=7/10=0,7
4
7
1
1/7
6/7
7/10*6/7=6/10=0,6
5
6
1
1/6
5/6
0,5
7
5
1
1/5
4/5
0,4
11
4
1
1/4
3/4
0,3
16
3
1
1/3
2/3
0,2
20
2
1
1/2
1/2
0,1
33
1
1
1/1
0/1
0,0
ti - momento no tempo
ni – nº de sobreviventes até ao momento ti
di – nº de mortos no instante ti
wi – nº de censurados no instante ti
qi- probabilidade de morrer no instante ti
pi – probabilidade de sobreviver no instante ti
si – nº de sobreviventes no instante ti
Si– Sobrevivência cumulativa (probabilidade de sobreviver ao ao instante ti )
A sobrevivência no final de cada intervalo é igual ao produto da sobrevivência
cumulativa até ao final do intervalo anterior pela sobrevivência condicional
nesse intervalo
• As curvas de sobrevivência geralmente calculadas pelo método de Kaplan
Meier, representam a probabilidade cumulativa (a probabilidade de sobrevivência)
de um indivíduo permanecer livre de doença (acontecimento) em qualquer
momento posterior à altura base.
• A probabilidade de sobrevivência apenas se altera quando ocorre o
acontecimento em estudo, sendo a curva resultante numa série de segmentos
(curva em escada).
•Assim o modelo de Kaplan Meier baseia-se na estimativa das probabilidades
condicionais, da taxa de sobrevivência em cada ponto no tempo.
• Um dos pressupostos para a realização das tabelas de sobrevivência pelo
método produto-limite de Kaplan Meier é que os indivíduos em que os dados são
incompletos têm o mesmo risco que os indivíduos em que o acontecimento se
verificou.
Exemplo 1 – dados completos
O tempo de aleitamento, isto é o tempo decorrido desde o nascimento até ao desmame,
pode ser considerado como uma variável tempo de sobrevivência
Suponha que o tempo até ao desmame, em meses, tenha sido registado para 15
crianças:
12 10 3 5 1 6 8 1 5 2 2 5 8 1
Considerando que não se verificou censura:
Represente os tempos de observação das 15 crianças
Como representaria uma base de dados para analisar estes dados?
Criança
tempo
status
1
6
1
2
12
1
3
10
1
4
3
1
5
5
1
6
1
1
7
6
1
8
8
1
9
1
1
10
5
1
11
2
1
12
2
1
13
5
1
14
8
1
15
1
1
Construa a tabela de Kaplan- Meier
ti
ni
di
qi= di/ ni
pi=1- qi
Si=Si-1pi
1
15
3
3/15
1-3/15=0,8
0,8
2
12
2
2/12
1-2/12=0,833
0,8*0,833=0,6667
3
10
1
1/10
1-1/10=0,9
0,6667*0,9=0,6000
5
9
3
3/9
1-3/9=0,6667
0,6000*0,6667=0,4
6
6
2
2/6
1-2/6=0,6667
0,4*0,6667=0,2667
8
4
2
2/4
1-2/4=0,5
0,2667*0,5=0,1333
10
2
1
1/2
1-1/2=0,5
0,1333*0,5=0,0667
12
1
1
1/1
1-0
0,0667*0=0,0000
Represente a curva de Kaplan Meier
Com base na tabela que criou , responda
Qual a probabilidade de uma criança ser amamentada pelo menos até ao sexto
mês de vida?
S(6) =0,2667
Qual a probabilidade de ser amamentada por mais de 3 meses?
S(3)=0,6
Qual a probabilidade de ser amamentada por mais de 10 meses?
S(10)=0,0667
Qual foi o tempo mediano de aleitamento?
O tempo mediano de aleitamento está entre 3 e 5 meses
EXEMPLO 2- Dados censurados
A tabela anexa representa o tempo de sobrevivência de 10 doentes
1+, 3, 4+, 5, 5, 6+, 7, 7, 7+, 8+
(+) dados incompletos
Construa a tabela de sobrevivência pelo método produto-limite (Kaplan-Meier)
ti
ni
di
wi
qi
pi
Si
1
10
0
1
0/10
1
1
3
9
1
0
1/9
8/9
0,889
4
8
0
1
0/8
1
0,889
5
7
2
0
2/7
5/7
0,635
6
5
0
1
0/5
1
0,635
7
4
2
1
2/4
½
0,317
8
1
0
1
0/1
1
0,317
ti - momento no tempo
ni – nº de sobreviventes até ao momento ti
di – nº de mortos no instante ti
wi – nº de censurados no instante ti
qi- probabilidade de morrer no instante ti
pi – probabilidade de sobreviver no instante ti
Si– Sobrevivência cumulativa
O output do software estatístico SPSS é o seguinte
Kaplan-Meier
Time Status
Cumulative Standard Cumulative
Survival
Error
Events
1
,00
0
3
1,00
,8889
,1048
1
4
,00
1
5
1,00
2
5
1,00
,6349
,1692
3
6
,00
3
7
1,00
4
7
1,00
,3175
,1799
5
7
,00
5
8
,00
5
Number of Cases: 10
Survival Time
Mean:
6
Median:
7
Censored: 5
Number
Remaining
9
8
7
6
5
4
3
2
1
0
( 50,00%) Events: 5
Standard Error 95% Confidence Interval
1
( 5; 7 )
1
( 5; 9 )
CURVA DE KAPLAN-MEIER
SOBREVIVÊNCIA CUMULATIVA
1,0
,9
,8
,7
,6
,5
,4
,3
,2
,1
0,0
0
2
4
TEMPO DE SOBREVIVÊNCIA (MESES)
6
8
10
EXERCÍCIO 1
Os dados seguintes apresentados de acordo com o sexo relativos ao tempo de
sobrevivência (em semanas) de 42 doentes com leucemia, retirados de um
estudo clínico que pretendia comparar tratamento com placebo.
Preencha os espaços vazios da tabela de sobrevivência obtida pelo método
produto limite só para o sexo masculino e represente a curva de Kaplan Meier
Sexo masculino:
35+, 34+, 32+, 32+, 25+, 23, 22, 20+, 16, 6, 23, 8, 5, 4, 4, 3, 2, 2, 1, 1
Sexo feminino:
19+, 17+, 13, 11, 10+, 10, 9+, 7, 6+, 6, 6, 22, 17, 15, 12, 12, 11, 11, 8, 8, 8, 5
EXERCÍCIO 1
ti
ni
di
wi
qi
pi
Si
1
20
2
0
2/20=0,10
0,90
0,90
2
18
2
0
0,111
0,89
3
16
1
0
0,062
0,937
4
15
2
0
0,133
0,867
0,65
13
1
0
0,077
0,923
0,60
0,89 × 0,90 = 0,80
6
12
1
0
0,083
0,917
0,55
8
11
1
0
0,091
0,909
0,50
16
10
1
0
0,100
0,900
0,45
20
9
0
1
0
1
0,45
0,394
22
8
1
0
0,125
0,875
23
7
2
0
0,286
0,714
25
5
0
1
0
1
32
4
0
2
0
1
34
2
0
1
0
1
35
1
0
1
0
1
MÉTODO ACTUARIAL (CUTLER-EDERER)
Pode-se utilizar um método alternativo de cálculo das probabilidades de
sobrevivência, mediante uma abordagem da tabela da vida, quando o tempo para
se alcançar o limite apenas se conhece num determinado intervalo de tempo (ex:
no espaço de um ano).
Um dos pressupostos para a realização das tabelas de sobrevivência é que os
censurados durante um dado intervalo ocorram aleatoriamente nesse intervalo.
EXEMPLO 3
Os dados que se seguem representam o tempo de sobrevivência (em meses) de
63 doentes com linfoma de Hodgkin, separados em dois grupos ( Aassintomáticos; B- com febre ou sudação ou emagrecimento superior a 10%).
GRUPO A
3.1+, 4.4+, 6.2, 9.0, 9.9, 14.4, 15.8, 18.5, 27.6+, 28.5, 30.1+, 31.5+, 32.2+, 41.0, 41.8+, 44.5+, 50.6+, 54.3+, 55.0,
60.0+, 60.4+, 63.6+, 63.7+, 63.8+, 66.1+, 68.0+, 68.7+, 68.8+, 70.9+, 71.5+, 74.8+, 75.3+, 75.7+
GRUPO B
2.5, 4.1, 4.6, 6.4, 6.7, 7.4, 7.6, 7.7, 8.8, 13.3, 13.4, 18.3, 19.7, 21.9, 24.7, 27.5, 29.7, 30.1+, 32.9, 33.5, 35.4+,
37.7+, 40.9+, 42.6+, 45.4+, 48.5+, 48.9+, 60.4+, 64.4+, 66.4+
Construa a tabela de sobrevivência pelo método actuarial só para o grupo A
Tabela de sobrevivência dos 33 doentes com linfoma de Hodgkin assintomáticos
(método actuarial)
ti
ni
dI
wi
qi
pi
Si
0-6
33
0
2
0
1
1
6-12
31
3
0
0,097
0,903
0,903
12-18
28
2
0
0,071
0,929
0,839
20-24
26
1
0
0,038
0,962
0,806
24-30
25
1
1
0,041
0,959
0,773
30-36
23
0
3
0
1
0,773
36-42
20
1
1
0,051
0,949
0,734
42-48
18
0
1
0
1
0,734
48-54
17
0
1
0
1
0,734
54-60
16
1
1
0,064
0,936
0,687
60-66
14
0
5
0
1
0,687
66-72
9
0
6
0
1
0,687
72-78
3
0
3
0
1
0,687
78+
0
0
0
0
1
0,683
Em que
q
=
d
n
−
w/2
Sendo o output
Number
Entering
Interval
,000
30
0
30,000
3
,10
,90
,90
,05
6,000
27
0
27,000
6
,22
,78
,70
,08
12,000
21
0
21,000
2
,10
,90
,63
,09
18,000
19
0
19,000
3
,16
,84
,53
,09
24,000
16
0
16,000
3
,19
,81
,43
,09
30,000
13
2
12,000
2
,17
,83
,36
,09
36,000
9
2
8,000
0
,00
1,00
,36
,09
42,000
7
2
6,000
0
,00
1,00
,36
,09
48,000
5
2
4,000
0
,00
1,00
,36
,09
54,000
3
0
3,000
0
,00
1,00
,36
,09
60,000
3
2
2,000
0
,00
1,00
,36
,09
66,000
1
1
,500
0
,00
1,00
,36
,09
Interval Start
Time
Number
Exposed to
Risk
Number
of
Terminal
Events
Cumulative
Proportion
Surviving at
End of
Interval
Number
Withdrawing
during
Interval
Proportion
Terminating
Proportion
Surviving
Std. Error of
Cumulative Proportion
Surviving at End of
Interval
COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA
Como se pode avaliar se duas ou mais curvas são estatisticamente
equivalentes?
O teste mais utilizado é designado por teste de log-rank.
Quando dizemos que duas curvas de Kaplan Meier não são estatisticamente
significativas, queremos dizer , baseados no teste, que compara as duas curvas
na globalidade, que não temos evidência para indicar que as curvas de
sobrevivência reais (população) são diferentes.
No exemplo dos doentes com linfoma de Hodgkin (exemplo 2) fomos comparar as
curvas de sobrevivência dos dois grupos A e B.
Pelo teste de log rank (estatístico=3,18, gl=1 p=0,07), p>0,05, concluindo-se que
as curvas não diferem significativamente, isto é são equivalentes.
H0: não há diferença entre as curvas de sobrevivência
2
2
(
O
−
E
)
(
O
−
E
)
1
1
2
+ 2
Teste de Log- rank Χ2 =
E1
E2
e1j = (
n1j
n1j + n 2 j
e2 j = (
) * ( m1 j + m 2 j )
n2j
n1j + n 2 j
) * (m1j + m 2 j )
n 1j
n 1j + n
No caso de apenas dois grupos
Proporção em risco do grupo 1 no total
2 j
m1j + m 2 j
Nº de mortes nos dois grupos
A estatística de Log- rank segue uma distribuição do Quiquadrado com 1
grau de liberdade segundo H0
L IN F O M A D E H O D G IN
M É T O D O P R O D U T O L IM IT E D E K A P L A N M E IE R
1,0
,9
,8
,7
Si
,6
,5
,4
B
,3
,2
A
,1
0,0
0
6
12
18
24
30
36
42
T em po de sobre vivênc ia (m eses)
48
54
60
66
72
78
EXERCÍCIO 2
Complete a tabela de sobrevivência para os doentes com leucemia pertencentes
ao grupo B, segundo o método actuarial.
ti
ni
di
wi
qi
pi
Si
0-6
30
3
0
0,1
0,9
0,9
6-12
27
6
0
0,222
0,778
0,700
21
2
0
0,0952
0,905
0,633
18-24
19
3
0
0,158
0,842
24-30
16
3
0
0,187
0,813
0,433
30-36
13
2
2
0,167
0,833
0,361
36-42
9
0
2
0
1
42-48
7
0
2
0
1
5
0
2
0
1
54-60
3
0
0
0
1
60-66
3
0
2
0
1
66-72
1
0
1
0
1
BIBLIOGRAFIA
• Basic and Clinical Biostatistics. Chap 11
Beth Dawson-Saunders and Robert G. Trapp
1990, Prentice-Hall International Inc
• Survival Analysis
David G. Kleinbaum
1996 Springer-Verlag New-York,Inc
Download

probabilidade de ser