Dimensionamento de ensaios de não inferioridade para o
caso de grupos paralelos e resposta binária: algumas comparações
Arminda Lucia Siqueira1
1 Introdução
Dimensionamento de amostras, importante elemento no planejamento de ensaios clínicos
controlados, frequentemente é determinado por fórmulas fechadas, aproximadas ou não. Às
vezes, processos iterativos são necessários, exigindo programação possivelmente trabalhosa,
ou ainda as soluções podem ser obtidas por simulações. Embora fórmulas fechadas sejam
práticas e convenientes, suas acurácias variam e podem às vezes ser questionadas. Assim,
soluções alternativas podem ser preferidas.
Para o caso de resposta binária, o cálculo do tamanho da amostra depende de muitos
fatores, como a medida a ser usada (diferença de proporções, razão de chances (odds ratio ou
OR), teste (Wald, escore, razão de verossimilhanças, Fisher), tipo de solução (exata,
assintótica, com correção de continuidade) e método estatístico (clássico ou Bayesiano).
Este trabalho é sobre o dimensionamento para ensaios de não inferioridade em que o
planejamento é de grupos paralelos e a resposta é binária. Ilustramos a metodologia com
exemplo de uma situação real e com resultados de um estudo de simulação.
2 Material e métodos
Considere-se um estudo planejado em dois grupos em paralelo tal que os indivíduos foram
aleatorizados em novo tratamento (𝑇) ou no controle ativo (𝐢). Sejam 𝑝𝑇 e 𝑝𝐢 as
probabilidades de sucessos, respectivamente nos grupos 𝑇 e 𝐢, que têm tamanhos 𝑛𝑇 e 𝑛𝐢 . A
comparação entre os dois tratamentos pode ser feita pela diferença entre as proporções de
sucesso dos dois grupos (𝑝𝑇 βˆ’ 𝑝𝐢 ), pela razão entre elas (𝑝𝑇 /𝑝𝐢 ), ou ainda pela medida odds
ratio, cuja definição é
𝑝𝑇
1βˆ’π‘ 𝑇
/
𝑝𝐢
1βˆ’π‘ 𝐢
, ou equivalentemente pelo logaritmo de odds ratio,
πœƒ = log{[𝑝𝑇 (1 βˆ’ 𝑝𝐢 )]/[(𝑝𝐢 (1 βˆ’ 𝑝𝑇 )]}. Para comparar os dois tratamentos em termos de odds
ratio, testamos as hipóteses 𝐻0 : πœƒ = πœƒ0 versus 𝐻1 : πœƒ > πœƒ0 , sendo πœƒ0 um valor não negativo
chamado de margem de não inferioridade. Alternativamente as hipóteses podem ser expressas
como 𝐻0 : 𝛿 = 0 versus 𝐻1 : 𝛿 > 0, com 𝛿 = πœƒ βˆ’ πœƒ0 (Siqueira et al., 2008).
1
Departamento de Estatística/ UFMG. e-mail: [email protected]
1
Na literatura existem vários trabalhos sobre tamanho de amostras para estudos de não
inferioridade no contexto estudado (proporções, grupos paralelos). Julious (2010) apresenta
fórmulas para o caso de diferença de proporções com três métodos: usando respostas
antecipadas ou as respostas sob as hipóteses nulas e alternativas e ainda levando em conta a
correção de continuidade. Ainda para a comparação de dois tratamentos baseada em diferença
de proporções e para grupos paralelos, Julious & Owen (2010) destacam o método Bayesiano.
Para a comparação baseada na medida odds ratio utilizando o teste de Wald, o número de
indivíduos necessários no grupo controle é dado por 𝑛𝐢 =
𝑧𝛼 +𝑧 𝛽 2
πœƒ1 βˆ’πœƒ0
1
π‘Ÿπ‘ 1𝑇 1βˆ’π‘ 1𝑇
+𝑝
1
𝐢
1βˆ’π‘ 𝐢
Wang 𝑒𝑑 π‘Žπ‘™. , 2002 . Na fórmula apresentada, πœƒ0 e πœƒ1 são os valores de π‘™π‘œπ‘”(𝑂𝑅) sob 𝐻0 e
𝑒π‘₯𝑝 πœƒ1 𝑝 𝐢
,
πœƒ1 βˆ’1 𝑝 𝐢
𝐻1 , π‘Ÿ = 𝑛𝑇 /𝑛𝐢 é a razão dos tamanhos dos dois grupos, 𝑝1𝑇 = 1+ 𝑒π‘₯𝑝
𝛼 e 1βˆ’π›½
são o nível de significância e o poder do teste da comparação dos grupos, respectivamente, e
𝑧𝛼 e 𝑧𝛽 são os correspondentes percentis da normal padrão.
Dimensionamento de amostras usando métodos exatos para provar não inferioridade
quando a resposta é binária foi proposto, por exemplo por Dunnett & Gent (1977) e o método
foi revisitado por Chan (2003). Wellek (2010) apresenta o tradicional teste exato de Fisher
para ensaios de não inferioridade em termos da medida odds ratio e fornece um programa
Fortran para calcular o tamanho da amostra.
3 Resultados e discussão
Para ilustrar a metodologia, adaptamos um exemplo apresentado por Rousson & Seifert
(2008) comparando os resultados do tamanho de amostra quando utilizamos o teste de Wald e
o teste exato de Fisher para a medida odds ratio. Evidenciamos também o impacto da escolha
da margem de não inferioridade e da incerteza do conhecimento de parâmetros envolvidos nos
cálculos (no caso, 𝑝𝐢 ). Apresentamos também os resultados de um pequeno estudo de
simulação de Monte Carlo usando a mesma medida odds ratio.
3.1 Exemplo: ensaio de não inferioridade para tratamento de vaginose bacteriana
Trata-se do planejamento de ensaio de não inferioridade que tinha como objetivo
comparar o efeito de novo medicamento para tratar vaginose bacteriana, a mais prevalente
causa de vaginite, com o efeito do uso de clindamicina creme vaginal, o medicamento de
2
referência. Para mulheres não grávidas, a literatura relata percentual de cura variando de 80%
a 85% após completar o tratamento com o medicamento de referência.
A Tabela 1 apresenta o número de pacientes por grupo para valores de 𝑝𝐢 variando de
80% a 85% com incremento de um ponto percentual, comparando dois testes.
Tabela 1: Número de pacientes por grupo (𝑛𝑇 = 𝑛𝐢 ) do ensaio de não inferioridade para
tratamento de vaginose bacteriana
Comparação de dois métodos: teste de Wald com fórmula e teste exato de Fisher
𝑂𝑅1 = 1,5
𝑂𝑅1 = 1,0
Margem de não inferioridade
(𝑂𝑅0 )
Teste de Wald
Exato de Fisher
Teste de Wald
Exato de Fisher
Teste de Wald
Exato de Fisher
Teste de Wald
Exato de Fisher
Teste de Wald
Exato de Fisher
Teste de Wald
Exato de Fisher
0,7
0,7
0,5
0,5
0,3
0,3
0,7
0,7
0,5
0,5
0,3
0,3
80%
770
776
205
209
68
73
195
194
94
95
44
43
Possíveis valores de 𝑝𝐢
81% 82% 83% 84%
801
835
873
917
807
842
881
925
213
222
232
244
218
227
238
250
71
74
77
81
76
79
83
88
204
213
224
236
202
212
222
234
98
103
108
114
99
104
109
115
46
48
51
53
49
51
54
56
85%
967
975
257
264
85
93
250
248
121
122
56
60
Nota: nível de significância: 2,5%; poder do teste: 80%; 𝑂𝑅1 : odds ratio sob 𝐻1 .
À medida que 𝑝𝐢 e a margem de não inferioridade aumentam, há necessidade de mais
pacientes. Por outro lado, os tamanhos das amostras para 𝑂𝑅1 = 1,5 são inferiores aos
correspondentes se 𝑂𝑅1 = 1. Em geral, à medida que o valor de 𝑂𝑅1 aumenta, o tamanho da
amostra diminui, mantendo os outros elementos envolvidos nos cálculos constantes. Para
𝑂𝑅1 = 1,0, todos os tamanhos de amostra obtidos pelo teste exato de Fisher são maiores do
que o de Wald (a diferença varia de 4 a 8) e para 𝑂𝑅1 = 1,5, às vezes esse comportamento
se repete ou se inverte, mas a diferença é sempre bem pequena (varia de 1 a 4).
3.2 Estudo de simulação
A determinação do tamanho de amostra a partir de simulações foi baseada nos testes
de Wald e da razão de verossimilhanças com a medida odds ratio. O nível de significância
nominal foi de 2,5% e o poder dos testes foi fixado em 90%. Assumiu-se igual alocação de
3
indivíduos aos tratamentos, isto é, 𝑛𝑇 = 𝑛𝐢 . Os cálculos de cada poder empírico foram
baseados em 1.000.000 simulações. A Tabela 2 apresenta resultados para casos selecionados.
Tabela 2: Tamanho de amostra para ensaios de não inferioridade usando a medida odds ratio
𝑂𝑅0
0,8
0,5
𝑂𝑅1
1,5
2,0
2,5
1,5
2,0
2,5
π‘Šπ‘“
384
205
149
126
90
75
𝑝𝐢 = 0,8
F
π‘Šπ‘†
379
379
197
197
139
138
127
125
88
87
71
70
𝑉𝑆
378
196
137
126
87
70
ο€ 
𝑝𝐢 = 0,5
π‘Šπ‘“
218
107
73
72
47
37
𝐹
217
105
70
72
47
36
π‘Šπ‘†
216
104
70
71
46
35
𝑉𝑆
216
104
69
71
46
35
Nota: nível de significância: 2,5%; poder do teste: 90%; 𝑂𝑅0 : odds ratio sob 𝐻0 ; 𝑂𝑅1 : odds ratio sob 𝐻1 ; π‘Šπ‘“ : teste de Wald
por fórmula; 𝐹: teste exato de Fisher; π‘Šπ‘† : teste de Wald por simulação; 𝑉𝑆 : teste da razão de verossimilhanças por simulação.
Os resultados das simulações a partir do teste da razão de verossimilhanças (𝑉𝑆 ) são muito
semelhantes aos do teste exato de Fisher (𝐹). A fórmula baseada no teste de Wald (π‘Šπ‘“ ) parece
fornecer bons resultados, quando comparado aos obtidos na simulação, tanto para o próprio
teste de Wald (π‘Šπ‘† ) quanto para o teste de razão de verossimilhanças (𝑉𝑆 ).
À medida que 𝑂𝑅1 aumenta, os tamanhos de amostras diminuem e o inverso vale para o
valor da margem de não inferioridade (𝑂𝑅0 ). Os valores de π‘Šπ‘“ tendem a ser ligeiramente
maiores que 𝐹. Os valores (mínimo e máximo) da diferença (π‘Šπ‘“ – 𝐹) são (1 e 10) e (-1 e 4),
respectivamente para 𝑂𝑅0 igual a 0,8 e 0,5. A diferença (π‘Šπ‘“ βˆ’ 𝑉𝑆 ) vai de 2 a 12 e de zero a 5,
respectivamente para 𝑂𝑅0 igual a 0,8 e 0,5, respectivamente.
4 Conclusões e considerações finais
O cálculo do tamanho de amostras é atualmente exigência dos protocolos de ensaios
clínicos controlados. Há várias opções para o dimensionamento de ensaios de não
inferioridade no caso de grupos paralelos e quando a resposta é binária.
Quando os grupos são comparados em termos de diferença de proporções, o tamanho da
amostra é tipicamente bem menor do que o obtido quando a medida escolhida é odds ratio.
Por exemplo, no ensaio da seção 3 sobre tratamento de vaginose bacteriana, usando a medida
odds ratio, com margem de não inferioridade de 0,5 e 𝑝𝐢 = 0,80, o tamanho de amostra
obtido foi 𝑛𝐢 = 𝑛𝑇 = 205. Se a comparação dos tratamentos fosse feita em termos de
diferença de proporções, seriam necessários apenas 142 pacientes em cada grupo, ou seja,
4
haveria redução de 126 pacientes. Apesar dessa aparente vantagem, cresce o interesse pela
utilização da medida odds ratio. De fato, existem vantagens discutidas na literatura (Tu, 1998)
e, por exemplo, aparece de forma natural na interpretação de modelos de regressão logística,
tão usados na área da saúde.
Para o contexto estudado, tamanhos de amostras calculados por vários métodos, usando
fórmulas fechadas, processos iterativos e simulações podem ser programados e/ou obtidos por
programas específicos, tal como Pass® (Power Analysis and Sample Size Software).
5
Referências
[1] CHAN, I. S. F. Proving non-inferiority or equivalence of two treatments with
dichotomous endpoints using exact methods. Statistical Methods in Medical Research.
Sage. v. 12, p. 37-58, 2003.
[2] DUNNETT, C. W.; GENT, M. Significance testing to establishing equivalence between
treatments, with special reference to data in the form of 2x2 tables. Biometrics. Blackwell
Publishing. v. 33, p. 593-602, 1977.
[3] JULIOUS, S. A. Sample Sizes for Clinical Trials. Boca Raton: Chapman and Hall/CRC.
2010. 299 p.
[4] JULIOUS, S. A.; OWEN R. J. A comparison of methods for sample size estimation for
non-inferiority studies with binary outcomes. Statistical Methods in Medical Research.
Sage. v. 20, n. 6, p. 595-612, 2010.
[5] TU, D. On the use of ratio or odds ratio of cure rates in therapeutic equivalence clinical
trials with binary endpoints. Journal of Biopharmaceutical Statistics. Taylor & Francis. v.
8, p. 263-282, 1998.
[6] WANG, H.; CHOW S. C.; LI, G. On sample size calculation based on odds ratio in
clinical trials. Journal of Biopharmaceutical Statistics. Taylor & Francis. v. 12, p. 471-483,
2002.
[7] ROUSSON, V.; SEIFERT, B. A mixed approach for proving non-inferiority in clinical
trials with binary endpoints. Biometrical Journal. John Wiley. v. 50, n. 2, p. 190-204, 2008.
[8] SIQUEIRA, A. L.; WHITEHEAD, A.; TODD, S. Active-control trials with binary data: a
comparison of methods for testing superiority or non-inferiority using odds ratio. Statistics in
Medicine. John Wiley. v. 27, p. 353-370, 2008.
[9] WELLEK, S. Testing Statistical Hypotheses of Equivalence and Noninferiority.
Second Edition, Boca Raton: Chapman and Hall/CRC. 2010. 431 p.
Agradecimentos: à Fapemig pelo apoio ao projeto de pesquisa intitulado β€œMetodologia Estatística para o
planejamento e a análise dos resultados de estudos especiais na área da saúde”, Demanda Universal da
Fapemig, Processo APQ-01865-11, no qual o presente trabalho está inserido.
5
Download

Dimensionamento de ensaios de nΓ£o inferioridade para o