Universidade Federal do Rio de Janeiro
NESC- Mestrado em Epidemiologia e Bioestatística
Disciplina: Análise de Regressão em Saúde
Análise de Sobrevida
Análise de sobrevida
Definições:
Tipo de estudo estudos de coorte ou ensaios clínicos
Variável resposta tempo transcorrido entre a entrada do
indivíduo no estudo e a ocorrência de um evento a ser relacionado
com a exposição ou tratamento.
Evento (falha ) pode ser doença, morte, cura etc.
Tempo de sobrevida:
Medido para cada indivíduo, desde sua entrada no estudo até a
ocorrência do "evento" (falha).
Indivíduos podem entrar no estudo em qualquer período
durante o tempo do estudo.
Tania Guillén de Torres
Rejane Sobrino Pinheiro
Tempo pode ser medido em qualquer unidade
dias, semanas, meses, etc.
Análise de sobrevida
Nesta seção serão apresentadas técnicas de analise de tempos de
sobrevida para o caso de um único desfecho de interesse.
Exemplos de aplicação:
Tempo de remissão, em semanas, para pacientes com Leucemia.
Tempo até a ocorrência do evento
Métodos especiais de análise
Distribuição dos tempos não é gaussiana
Tempo, em anos, até a ocorrência de doença coronariana, numa corte de
indivíduos sem doença.
Tempo, em anos, até a morte numa população de idosos (>60 anos)
Tempo (meses) até morte em pacientes transplantados.
Dados com censura
Observação:
É possível avaliar simultaneamente a ocorrência de vários desfechos num único
desenho de estudo, por exemplo mortes por Câncer em mulheres (Ca. de colo
uterino, Ca. Mama, etc.). Podem ser abordados como um problema de Riscos
Competitivos, porem este tópico não faz parte da disciplina.
Dado censurado:
Censura
Indivíduo não sofre o "evento" durante o período de estudo, de
modo que o tempo exato de sobrevida não é conhecido.
Pacientes de Leucemia em remissão
Censura devida a:
O indivíduo não experimenta o evento antes do fim do
estudo (estudo termina antes da ocorrência do evento)
Perda de follow-up (seguimento) durante o período do
estudo
Saída do estudo por causa de óbito (por outra causa), ou por
outra razão (reação adversa à droga)
Início do
estudo
×
Fim do
estudo
Tempo de sobrevida censurado, observado no estudo
Indivíduos podem entrar no estudo em qualquer instante depois
do início do estudo e pode ser censurado em qualquer instante
de tempo durante o estudo.
Dados censurados
Tempo de sobrevida verdadeiro
Exemplo: Leucemia
Comparar os tempos de remissão, de um grupo de pacientes com
leucemia tratados com a droga 6-mercaptopurine com os tempos
de remissão de um grupo controle não tratado.
Desfecho (evento) recidiva (recaída)
Tempo de sobrevida número de semanas em remissão
Grupo controle:
1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
Grupo tratado:
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
* = follow-up incompleto (censura)
Grupo tratado:
Como comparar os tempos:
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
1: Controle
Obs Tempo recidiva Grupo
1
1
1
1
2
1
1
1
3
2
1
1
4
2
1
1
5
3
1
1
6
4
1
1
7
4
1
1
8
5
1
1
9
5
1
1
10
8
1
1
11
8
1
1
12
8
1
1
13
8
1
1
14
11
1
1
15
11
1
1
16
12
1
1
17
12
1
1
18
15
1
1
19
17
1
1
20
22
1
1
21
23
1
1
2:Tratamento
Obs Tempo recidiva Grupo
0
2
22
6
23
6
1
2
24
6
1
2
25
6
1
2
26
7
1
2
27
9
0
2
28
10
0
2
29
10
1
2
30
11
0
2
31
13
1
2
32
16
1
2
33
17
0
2
34
19
0
2
35
20
0
2
36
22
1
2
37
23
1
2
38
25
0
2
39
32
0
2
40
32
0
2
41
34
0
2
42
35
0
2
Interpretação:
6* indivíduo ainda em remissão
depois de 6 semanas no estudo, e
não observado após este tempo.
6 indivíduos conhecidos como em
remissão por 6 semanas, mas
tiveram recaída entre a 6a. e a
7a. semanas.
Observar:
Nenhuma censura no grupo
controle (todos "falharam")
Parece que o tempo de sobrevida
é maior para os do grupo tratado
Problema: tempos censurados podem enviesar os resultados
Alternativas:
1. Excluir tempos censurados
Tempo de sobrevida pelo tratamento muito baixo, por excluir
os tempos de remissão mais longos (subestimar).
2. Incluir tempos censurados
Ignorar a diferença entre evento e censura. Indivíduos com os
tempos de sobrevida censurados tem atualmente tempos de
sobrevida maiores do que as semanas representadas no estudo
Stata:
Stata:
2 - Declarar um banco para Análise de Sobrevida
1 – Abrir o banco
File Open.. diretório Média ou mediana do tempo de remissão para cada grupo,
ignorando a condição de censura ( ttrt = 17,1 e tcontrole = 8,7 )
banco
. use “C:\Data\leucemia.dta"
Statistics Survival analysis Setups & utilities
Declare data to be survival-time data
. desc
Contains data from E:\Regressao\Sobrevida\AulaPratica\Bancos\leucemia.dta
obs:
42
vars:
4
11 Nov 2009 10:20
size:
336 (99.9% of memory free)
----------------------------------------------------------------------------storage display
value
variable name
type
format
label
variable label
----------------------------------------------------------------------------obs
byte
%8.0g
Obs
tempo
byte
%8.0g
Tempo ate a recaida
recidiva
byte
%8.0g
recidiva
Retorno da doenca
grupo
byte
%8.0g
grp
Grupos de comparacao
----------------------------------------------------------------------------Sorted by:
Comando “stset vartempo varcensura”
Declara o banco como sendo um banco com tempos de sobrevida
Função de sobrevida:
Stata:
S(t) = P(T > t)
T variável aleatória tempo de sobrevida de um indivíduo
t qualquer valor de interesse para a variável aleatória T
. stset tempo, failure(recidiva==1)
failure event:
obs. time interval:
exit on or before:
recidiva == 1
(0, tempo]
failure
-----------------------------------------------------------------------------42 total obs.
0 exclusions
-----------------------------------------------------------------------------42 obs. remaining, representing
30 failures in single record/single failure data
541 total analysis time at risk, at risk from t =
0
earliest observed entry t =
0
last observed exit t =
35
Ex: Se estamos interessados em avaliar se uma pessoa sobrevive
mais de 5 anos após submeter-se a tratamento para câncer
S(5) = P(T > 5)
A função de sobrevida dá a probabilidade de uma pessoa viver
mais do que um tempo específico t = 5.
Isto é, S(T) dá a probabilidade de um indivíduo sobreviver além do
tempo t (probabilidade de uma variável aleatória T exceder um
determinado valor especificado (t).
Teoricamente, como t varia de 0 a ∞, a função de sobrevida decai.
Grupo controle (nenhuma censura):
Se não houver censura:
1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
S (t ) =
N° sobreviventes além de 10 semanas
N° de indivíduos que sobreviveram mais do que t
N° total de indivíduos
S (10) =
A função é decrescente, ou seja, os valores de S(t) decrescem à
medida que t cresce.
Para t = 0 S(t) = = S(0) = 1
Para t = ∞ S(t) = 0
8
= 0.381
21
Probabilidade de sobrevida além de 10 semanas
N° total de indivíduos
1
N° sobreviventes além de 22 semanas
Sempre
decrescente
S(t)
0 ≤ S(t) ≤ 1
0
S ( 22) =
∞
1
= 0.048
21
Probabilidade de sobrevida além de 22 semanas
N° total de indivíduos
Probabilidade de sobrevida para o grupo controle:
Probabilidade de sobrevida para o grupo controle:
t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
mt = n° de falhas no instante t.
S (t ) =
P(D1)=2/21
21
N° de sobreviventes no instante t
n
m t a c u m u la d a
S (t)
0
1
2
3
4
5
8
11
12
15
17
22
23
0
2
2
1
2
2
4
2
2
1
1
1
1
0
2
4
5
7
9
13
15
17
18
19
20
21
( 2 1 - 0 ) /2 1 = 2 1 /2 1 = 1 .0 0
( 2 1 - 2 ) /2 1 = 1 9 /2 1 = 0 .9 1
( 2 1 - 4 ) /2 1 = 1 7 /2 1 = 0 .8 1
( 2 1 - 5 ) /2 1 = 1 6 /2 1 = 0 .7 6
( 2 1 - 7 ) /2 1 = 1 4 /2 1 = 0 .6 7
( 2 1 - 9 ) /2 1 = 1 2 /2 1 = 0 .5 7
( 2 1 - 1 3 ) /2 1 = 8 /2 1 = 0 .3 8
( 2 1 - 1 5 ) /2 1 = 6 /2 1 = 0 .2 9
( 2 1 - 1 7 ) /2 1 = 4 /2 1 = 0 .1 9
( 2 1 - 1 8 ) /2 1 = 3 /2 1 = 0 .1 4
( 2 1 - 1 9 ) /2 1 = 2 /2 1 = 0 .1 0
( 2 1 - 2 0 ) /2 1 = 1 /2 1 = 0 .0 5
( 2 1 - 2 1 ) /2 1 = 0 /2 1 = 0 .0 0
D2
(2)
S1
(19)
1/17
17/19
mt
D3
(1)
S2
(17)
P(S2| S1)
2/16
16/17
21 - 0
= 1.00
21
19 19
= 1×
=
= 0.91
21 21
19 17 17
=
×
=
= 0.81
21 19 21
19 17 16
16
=
×
×
=
= 0.76
21 19 17
21
19 17 16 14 14
=
×
×
×
=
= 0.67
21
21 19 17 16
S(0) =
S(1)
S(2)
S(3)
S(4)
Curva de sobrevida:
É a representação gráfica da Função de sobrevida S(t) no eixo vertical vs. os
tempos de sobrevida (t) no eixo horizontal
D4
(2)
S3
(16)
14/16
t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
S4
(15)
•••
P(S4) = P(S1)×P(S2| S1)×P(S3| S2∩ S1) ×P(S4| S1∩ S2∩ S3)
Função de Hazard (risco)
Densidade instantânea de incidência
Risco instantâneo
P[t < T < (t + ∆t ) | T > t ]
∆t → 0
∆t
h(t ) = lim
Kaplan-Meier survival estimate
0.75
1.00
2/19
P(S1)=19/21
t
Taxa de falha condicional
0.25
0.50
Taxa de falha instantânea (falha durante um intervalo de tempo
bem pequeno de amplitude ∆t, dado que um indivíduo tenha
sobrevivido até o início do intervalo) / ∆t).
Função de Hazard:
0.00
S(t)
D1
(2)
0
5
10
15
analysis time
20
25
(t)
h(t ) =
Nº de indivíduos que morreram por unidade de tempo no intervalo (t, t + ∆t)
Nº sobreviventes no instante t
Exemplo:
Stata:
h(t) para dados de leucemia (grupo tratado), com ∆t = 1
Statistics
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
Survival analysis
Summary statistics, test, & tables
Summarize survival-time data
n° de recidivas no instante de tempo 6
h ( 6) =
3
= 0.143
21
n° sob risco no início do intervalo de tempo 6
n° de recidivas no instante de tempo 7
. stsum
1
h(7) = = 0.059
17
failure _d:
analysis time _t:
n° sob risco no início do intervalo de tempo 7
Calcular o hazard - Risco instantâneo dos tempos
. stsum, by(trtment)
failure _d:
analysis time _t:
relapse == 1
weeks
|
incidence
no. of
|------ Survival time -----|
trtment | time at risk
rate
subjects
25%
50%
75%
---------+--------------------------------------------------------------------0:stand |
182
.1153846
21
4
8
12
1:trt |
359
.0250696
21
13
23
.
---------+--------------------------------------------------------------------total |
541
.0554529
42
6
12
23
recidiva == 1
tempo
|
incidence
no. of
|------ Survival time -----|
| time at risk
rate
subjects
25%
50%
75%
---------+--------------------------------------------------------------------total |
541
.0554529
42
6
12
23
Função de Hazard acumulada
Graphics Survival analysis graphs
Survivor & cumulative hazard functions
1.00
Kaplan-Meier survival estimate
Função de Hazard acumulada
Graphics Survival analysis graphs
Survivor & cumulative hazard functions
0.00
0.25
0.50
0.75
. sts graph
failure _d: relapse == 0 1
analysis time _t: weeks
0
10
40
0.00
0.25
0.50
0.75
failure _d: relapse == 0 1
analysis time _t: weeks
30
Kaplan-Meier survival estimates, by trtment
1.00
. sts graph, by( trtment)
20
analysis time
0
10
20
analysis time
trtment = 0:stand
Função de Hazard acumulada
0.00
1.00
2.00
3.00
4.00
Nelson-Aalen cumulative hazard estimates, by grupo
0
10
20
analysis time
grupo = Controle
30
grupo = Tratamento
. sts graph, by(grupo) na
failure _d:
analysis time _t:
recidiva == 1
tempo
40
30
trtment = 1:trt
40
Função de sobrevida - dados censurados
Função de sobrevida - dados censurados
S(t) pode ser derivada de uma função h(t) para dados censurados
d6
(3)
3/21
S(0) = 1 - h(0)
S(1) = [1-h(0)] x [1 - h(1)]
S(2) = [1-h(0)] x [1 - h(1)] x [1 - h(2)]
C6
(1)
21
d7
(1)
1/17
S(t) = [1-h(0)] x [1 - h(1)] x ... x [1 - h(t)]
C7
S6
(17)
d10
(0)
(1)
Ou:
1/16
16/17
21 - 0
P(S7| S6)
= 1.00
21
3
S(6) = 1 × (1 − ) = 0.86
21
3
1
S(7) = 1 × (1 − ) × (1 - ) = 0.806
21
17
S(0) = 1 - h(0)
S(1) = S(0) x [1 - h(1)]
S(2) = S(1) x [1 - h(2)]
S(3) = S(2) x [1 - h(3)]
S(0) =
S7
C10
(16)
(2)
S10
(13)
S(t) = S(t-1) x [1 - h(t)]
Exemplo:
Método de Kaplan-Meier
Grupo tratado: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
Chama-se de tabela de vida a uma tabela de probabilidades de
sobrevivência acumuladas no período estudado e de curva de
sobrevida ao gráfico destas probabilidades versus o tempo de
sobrevivência.
nj
21
21
mj
0
0
qj
0
0
H(t) = mt
0 / 21 = .000
0 / 21 = .000
S(t) = S(t-1) x [1 – h(t)]
1.0 x [ 1 – 0]
= 1.00
1.0 x [ 1 – 0]
= 1.00
Kaplan-Meier survival estimate
21
17
16
16
15
3
1
0
0
1
1
0
0
1
1
3 / 21 = .143
1 / 17 = .059
0 / 16 = .000
0 / 16 = .000
1 / 15 = .067
1.0 x [ 1 – 0.143] = 0.857
.857 x [1 - .059] = .806
.806 x [1 – 0]
= .806
.806 x [1 – 0]
= .806
.806 x [1 – 0.067] = .752
[13-14)
12
1
0
1 / 12 = .083
.752 x [1 - .083] = .690
0.25
[16-17)
11
1
0
1 / 11 = .091
.690 x [1 - .091] = .627
0.75
[6-7)
[7-8)
[8-9)
[9-10)
[10-11)
0.00
1.00
tj
[0-1)
[1-2)
0.50
As probabilidades acumuladas de
sobrevida nos períodos são:
0
[22-23)
[23-24)
[24-25)
7
6
5
1
1
0
0
0
0
1 / 7 = .143
1 / 6 = .167
0 / 5 = .000
.627 x [1 - .143] = .537
.537 x [1 - .167] = .447
.447 x [1 – 0]
= .447
[35-36)
1
0
1
0 / 1 = .000
.447 x [1 – 0]
10
20
analysis time
30
P(S ao 1º ano) = P(S1) = 0,87
P(S ao 2º ano) = P(S1)*P(S2/ S1) = 0,67
P(S ao 3º ano) = P(S1)*P(S2/ S1)* P(S3/ S1∩ S2)
= 0,60
40
1
1
1
1
0.92
= .447
0.9
0.9
0.87
0.87
[1-2) = 1 semana a < 2 semanas
nt = sob risco; mt = recidivas; qt = censurado
Somente tem-se que calcular S(t) p/ valores de t onde 1 ou + falhas ocorram (mt).
0.77
0.8
0.8
0.71
0.7
0.7
0.67
0.67
0.6
0.6
0.6
0.6
0
1
2
3
0.5
0
1
2
3
Stata:
Statistics
Tabelas de Vida
Tempos de sobrevida agrupados em intervalos.
Kaplan-Meier é uma versão modificada da tabela de vida
Survival analysis
Summary statistics, test, & tables
Life tables for survival data
KM usa tempos exatos de "falha" ou intervalos de tempo
curtos
KM tem poucos ou nenhum empate nos tempos de "falha"
. ltable tempo recidiva, survival by(grupo)
.
ltable tempo recidiva, survival
Interval
Total
Deaths
Lost
1
2
42
2
0
2
3
40
2
0
3
4
38
1
0
4
5
37
2
0
5
6
35
2
0
6
7
33
3
1
7
8
29
1
0
8
9
28
4
0
9 10
24
0
1
10 11
23
1
1
11 12
21
2
1
12 13
18
2
0
13 14
16
1
0
15 16
15
1
0
16 17
14
1
0
17 18
13
1
1
19 20
11
0
1
20 21
10
0
1
22 23
9
2
0
23 24
7
2
0
25 26
5
0
1
32 33
4
0
2
34 35
2
0
1
35 36
1
0
1
Survival
0.9524
0.9048
0.8810
0.8333
0.7857
0.7132
0.6886
0.5902
0.5902
0.5640
0.5090
0.4524
0.4241
0.3959
0.3676
0.3382
0.3382
0.3382
0.2630
0.1879
0.1879
0.1879
0.1879
0.1879
Error
0.0329
0.0453
0.0500
0.0575
0.0633
0.0700
0.0717
0.0765
0.0765
0.0775
0.0791
0.0798
0.0796
0.0792
0.0784
0.0775
0.0775
0.0775
0.0763
0.0706
0.0706
0.0706
0.0706
0.0706
[95% Conf.
0.8227
0.7658
0.7373
0.6819
0.6286
0.5505
0.5247
0.4258
0.4258
0.3999
0.3464
0.2934
0.2679
0.2430
0.2187
0.1939
0.1939
0.1939
0.1294
0.0744
0.0744
0.0744
0.0744
0.0744
Int.]
0.9879
0.9631
0.9486
0.9168
0.8822
0.8258
0.8059
0.7221
0.7221
0.6991
0.6504
0.5987
0.5721
0.5450
0.5174
0.4884
0.4884
0.4884
0.4180
0.3410
0.3410
0.3410
0.3410
0.3410
Beg.
Std.
Interval
Total
Deaths
Lost
Survival
Error
[95% Conf. Int.]
------------------------------------------------------------------------------Controle
1
2
21
2
0
0.9048
0.0641
0.6700
0.9753
2
3
19
2
0
0.8095
0.0857
0.5689
0.9239
3
4
17
1
0
0.7619
0.0929
0.5194
0.8933
4
5
16
2
0
0.6667
0.1029
0.4254
0.8250
5
6
14
2
0
0.5714
0.1080
0.3380
0.7492
8
9
12
4
0
0.3810
0.1060
0.1831
0.5778
11
12
8
2
0
0.2857
0.0986
0.1166
0.4818
12
13
6
2
0
0.1905
0.0857
0.0595
0.3774
15
16
4
1
0
0.1429
0.0764
0.0357
0.3212
17
18
3
1
0
0.0952
0.0641
0.0163
0.2612
22
23
2
1
0
0.0476
0.0465
0.0033
0.1970
23
24
1
1
0
0.0000
.
.
.
Tratamento
6
7
21
3
1
0.8537
0.0781
0.6119
0.9503
7
8
17
1
0
0.8034
0.0882
0.5573
0.9213
9
10
16
0
1
0.8034
0.0882
0.5573
0.9213
10
11
15
1
1
0.7480
0.0980
0.4952
0.8870
11
12
13
0
1
0.7480
0.0980
0.4952
0.8870
13
14
12
1
0
0.6857
0.1078
0.4257
0.8464
16
17
11
1
0
0.6234
0.1146
0.3631
0.8021
17
18
10
0
1
0.6234
0.1146
0.3631
0.8021
19
20
9
0
1
0.6234
0.1146
0.3631
0.8021
20
21
8
0
1
0.6234
0.1146
0.3631
0.8021
22
23
7
1
0
0.5343
0.1283
0.2651
0.7439
23
24
6
1
0
0.4453
0.1343
0.1864
0.6773
25
26
5
0
1
0.4453
0.1343
0.1864
0.6773
32
33
4
0
2
0.4453
0.1343
0.1864
0.6773
34
35
2
0
1
0.4453
0.1343
0.1864
0.6773
35
36
1
0
1
0.4453
0.1343
0.1864
0.6773
-------------------------------------------------------------------------------
Teste Log Rank
Compara 2 ou mais curvas de sobrevida (H0 as curvas são "as
mesmas")
Ordena os tempo de "falhas" dos indivíduos em 2 (ou mais)
grupos e atribui postos
O número esperado de falhas é calculado para cada intervalo para
cada grupo
Calcula um χ2 entre as falhas esperadas vs falhas observadas.
Assume intervalo de tempo pequeno (ex: 1 dia ou 1 "falha").
estatística
do
log − rank =
(O2− E 2)2
Var (O 2 − E 2)
~χ
Teste Log Rank
Statistics
Survival analysis
Summary statistics, test, & tables
Test equality of survivor functions
2
(G −1)
Onde:
(O 2 − E 2) = ∑ (m2 j − e2 j )
G = 2 grupos
k
j =1
k = número de tempos de falha diferentes
G = número de grupos diferente
Teste Log Rank
Teste Log Rank
Exemplo (usando o Stata):
Exemplo (usando o Stata):
. sts test grupo, logrank
. sts test lgwbccat, logrank
recidiva == 1
tempo
failure _d: relapse == 1
analysis time _t: weeks
|
Events
Events
grupo
| observed
expected
-----------+------------------------Controle
|
21
10.75
Tratamento |
9
19.25
-----------+------------------------Total
|
30
30.00
chi2(1) =
Pr>chi2 =
16.79
0.0000
chi2(2) =
Pr>chi2 =
. sts test trtment, peto
failure _d: relapse == 1
analysis time _t: weeks
. sts test
26.39
0.0000
lgwbccat, peto
Peto-Peto test for equality of survivor functions
chi2(1) =
Pr>chi2 =
14.08
0.0002
|
Events
Events
Sum of
lgwbccat | observed
expected
ranks
---------+-------------------------------------Low
|
4
13.06
-5.4643843
Medium
|
10
10.72
-1.2203977
:High
|
16
6.21
6.6847821
---------+-------------------------------------Total
|
30
30.00
0
chi2(2) =
Pr>chi2 =
1.00
0.75
0
failure _d: relapse == 1
analysis time _t: weeks
Peto-Peto test for equality of survivor functions
|
Events
Events
Sum of
trtment | observed
expected
ranks
--------+-------------------------------------0:stand |
21
10.75
6.3622095
1:trt
|
9
19.25
-6.3622095
--------+-------------------------------------Total
|
30
30.00
0
0.50
|
Events
Events
lgwbccat | observed
expected
---------+------------------------Low
|
4
13.06
Medium
|
10
10.72
:High
|
16
6.21
---------+------------------------Total
|
30
30.00
Log-rank test for equality of survivor functions
Kaplan-Meier survival estimates, by lgwbccat
0.25
Log-rank test for equality of survivor functions
0.00
failure _d:
analysis time _t:
21.37
0.0000
10
20
analysis time
lgwbccat = Low
lgwbccat = :High
30
lgwbccat = Medium
40
Exemplo:
Sobrevida de mulheres com câncer cervical após a data do diagnóstico
Tabelas de vida
Função de Hazard (Método atuarial):
h(t ) =
Estágio I:
No. de indivíduos que morrem por unidade de tempo no intervalo
1
No. sobreviventes no instante t − (No. de censuras no intervalo)
2
nt = sob risco; mt = mortes ; qt = censuras
Análise de sobrevida - Modelagem
Regressão de Cox
Como ajustar as curvas de sobrevida do grupo de tratados
(expostos) para um ou mais fatores (confundidores)?
1 confundidor:
Modelo e Pressupostos
Modela os dados usando o hazard ¨força de morbidade ou
mortalidade instantânea¨
Pressuposto:
1. Categorizar e comparar as curvas de sobrevida.
Exemplo: tratamento = 1 e idade > 55
tratamento = 1 e idade ≤ 55
tratamento = 0 e idade > 55
tratamento = 0 e idade ≤ 55
2. Categorizar e usar o teste log rank.
3. Usar um modelo matemático (existem vários)
•Para qualquer tempo t, o hazard entre aqueles expostos a certo
fator de risco [h1(t)] é múltiplo de algum hazard de referência
[h0(t)] (o hazard entre os não expostos)
h1(t) = h0(t) * B
h1(t) = h0(t) * e b
Mais de 1 confundidor:
Modelagem matemática é a escolha mais razoável.
Modelo de Hazard Proporcional de Cox
HR =
h1 (t ) = b
e h 0 (t )
Log(HR) = b
Informação geral:
Seja o conjunto de variáveis explanatórias: X = (X1, X2, ..., Xp)
h(t,X) = função de hazard para uma pessoa com um conjunto de X's
Modelo de Cox ou de Hazard proporcional é chamado de
modelo não paramétrico (ou semi-paramétrico) porque as
distribuições subjacentes não são conhecidas
Alternativa de modelo paramétrico é correta, quando h0(t) é
conhecida.
h0(t) = função de hazard base ou basal
h(t , X ) = h0 (t )e ∑ β X
i
i
Ex: exponencial, Weibull, Gompertz, etc.
h0(t) = não é conhecida no modelo de Cox
Modelo paramétrico é preferível se o modelo correto a ser usado
é conhecido
Observação: log odds basal não é conhecido na regressão logística
para estudos caso controle).
Modelo de Cox dá aproximadamente a mesma resposta do
modelo paramétrico (robusto).
Modelo de Cox é o mais comumente utilizado
Variáveis no modelo de Cox:
Vantagens do modelo de Cox:
Variável dependente tempo (até ocorrência do evento ou censura)
Variável evento
1 = evento
0 = censura
X1, X2, ..., Xp
Útil para avaliar o efeito das variáveis explanatórias
E's exposição (ões)
V's confundidores potenciais
W's modificadores de efeito potenciais
Variáveis explanatórias podem ser contínuas ou categóricas
Pode incluir dados censurados
Não é necessário conhecimento da distribuição da função de
hazard subjacente (basal)
Exemplo:
h(t , X ) = h0 (t )e
[ β ( trtment ) +γ 1 (log wbcc )+γ 2 ( idade )+δ 1 ( trt x wbc )+δ 2 ( trt x idade )]
e∑ β X
i
i
sempre ≥ 0 (apropriado para uma taxa)
Fornece mais informação do que o modelo logístico,
particularmente para eventos não raros e/ou longos tempos de
seguimento.
Obs: Não há intercepto
Razão de Hazard
Razão de Hazard
Caso simples: 1 fator de risco
Caso simples: 1 covariável
trtment:
age:
1 = tratamento experimental
0 = tratamento padrão
h(t,X) = h0(t)eβ(trtment)
X1 = 50
X2 = 50
h(t,X) = h0(t)eβ(age)
trtment = 1:
h(t,trtment) = h0(t)eβ(1)
age = 50:
h(t,age) = h0(t)eβ(50)
trtment = 0:
h(t,trtment) = h0(t)eβ(0)
age = 60:
h(t,age) = h0(t)eβ(60)
h(t ,1) h0 (t )e β (1)
Razão de Hazard ( HR ) =
=
= e β (1−0 ) = e β
β (0)
h(t ,0) h0 (t )e
Razão de Hazard ( HR ) =
h(t ,1) h0 (t )e β (60)
=
= e β (60 −50) = e β *10
(
50
)
β
h(t ,0) h0 (t )e
Caso multivariado: (Varias variáveis independentes)
X* = conjunto de X's para uma pessoa
X = conjunto de X's para outra pessoa
HR =
h0 (t , X *) ∑ β ( X − X )
=e
h0 (t , X )
HR = e
i
*
i
i
[ β1 ( X 1* − X 1 ) + β 2 ( X 2* − X 2 ) +...+ β k ( X k* − X k )]
Observação: análoga à regressão logística, mas possui uma razão de
densidade incidência instantânea em vez de log odds
Resultado da Regressão de cox dos preditores da incidência de doença
coronariana, 3597 indivíduos entre 45 e 65 anos, 1987 a 1994. Washington1
Variável
Sexo (masc=1, fem=0)
Fumo (sim=1, não=0)
Idade55 (idade≥55=1,
Idade<55=0)
Hipertensão (sim=1, não=0)
Hipercolesterolemia (sim=1,
não=0)
Obesidade (sim=1, não=0)
Coeficiente b1
1.2669
0.6803
0.1391
Hazard Ratio
3.55
1.97
1.15
0.5030
0.4552
1.65
1.58
0.1876
1.21
Semelhanças:
CHD é uma doença relativamente rara OR ≈ HR
As perdas de follow-up e a distribuição dos tempos até a
ocorrência do evento são provavelmente não diferenciais
entre os grupos (os vieses tendem a cancelar)
Download

Análise de Sobrevida