PROCEDIMENTO PARA A ESCOLHA DE UMA DISTRIBUIÇÃO O método de máxima verossimilhança somente deve ser aplicado após ter sido definido um modelo probabilístico adequado para os dados. • Se um modelo for usado inadequadamente, toda a análise estatística fica comprometida e consequentemente as respostas às perguntas de interesse ficam distorcidas. • •A idéia empírica consiste em ajustar os modelos probabilísticos típicos para dados de tempos de vida e com base na comparação entre valores estimados e observados, decidir qual deles “melhor” se ajusta aos dados amostrais. •A escolha da “melhor” distribuição pode ser feita por meio de técnicas gráficas ou testes de hipóteses com modelos encaixados. MÉTODO GRÁFICO I Este método consiste na comparação da função de sobrevivência do modelo proposto com o estimador de Kaplan-Meier. Os modelos propostos são ajustados ao conjunto de dados e, a partir das estimativas dos parâmetros de cada modelo, estimam-se suas respectivas funções de sobrevivência. Para o conjunto de dados obtém-se também, a estimativa de Kaplan-Meier para a função de sobrevivência ( Sˆ (t ) ). A comparação das funções de sobrevivência estimadas para cada modelo proposto com a função obtida pelo estimador de Kaplan-Meier pode ser feita de duas maneiras. Uma forma de comparar as funções é construindo os gráficos das função de sobrevivência estimada via Kaplan-Meier ( Sˆ (t ) ) versus a função de sobrevivência estimada para cada modelo proposto ( Sˆ M (t ) ). O “ melhor” modelo é então aquele cujos pontos da função de sobrevivência estimada estiverem mais próximos dos valores obtidos pelo estimador de Kaplan-Meier. Isto é, o melhor modelo é aquele cujos pontos no gráfico estiverem mais próximos da reta y = x, com x = Sˆ (t ) e y = Sˆ M (t ). Uma outra forma de comparação é colocar no mesmo gráfico as curvas Sˆ (t ) versus t e Sˆ M (t ) versus t, para cada modelo proposto. O modelo (ou os modelos) adequado é aquele em que sua curva de sobrevivência se aproximar daquela do EKM. Esta comparação também pode ser feita através de H(t). MÉTODO GRÁFICO II Este método consiste na linearização da função de sobrevivência, tendo como idéia básica a construção de gráficos que sejam aproximadamente lineares, caso o modelo proposto seja adequado. Esta forma de avaliação se deve ao fato de que violações da linearidade podem ser rapidamente verificadas visualmente. O gráfico utilizado é o de uma transformação que lineariza a função de sobrevivência do modelo proposto. Isto gera, como resultado final, uma reta, se o modelo proposto for adequado. A ideia é baseada, novamente, em uma comparação entre o modelo proposto e o estimador de Kaplan-Meier. Modelo exponencial Para o modelo exponencial, temos que a função de sobrevivência é dada por: S (t ) = e − λ t Para linearizar esta função iremos aplicar o logaritmo. Assim, − ln S (t ) é uma função linear de t, e o gráfico de − ln Sˆ ( t ) (sendo Sˆ ( t ) o estimador de Kaplan-Meier) versus t deve ser aproximadamente linear, passando pela origem, se o modelo exponencial for adequado. Modelo Weibull Para o modelo weibull, temos que a função de sobrevivência é − ( λt )γ dada por: S (t ) = e Para linearizar esta função, iremos aplicar o logaritmo. Assim, ln[ − ln S (t )]é uma função linear de ln(t). O gráfico de ln[− ln Sˆ (t )] versus ln(t), deve ser aproximadamente linear, se o modelo weibull for apropriado. Modelo Lognormal Considerando o modelo Lognormal, temos que a função de sobrevivência é dada por: − ln( t ) + µ S (t (t ) = φ σ A linearização desta função pode ser obtida da seguinte forma. Φ −1 ( S (t )) = − ln t + µ σ Em que φ −1 (.) são os percentis da distribuição normal padrão. O gráfico de φ (Sˆ(t)) versus ln(t), deve ser aproximadamente linear, com intercepto µ / σ e inclinação -1/σ, se o modelo lognormal for adequado. −1 Podem existir situações em que nenhum desses modelos sejam adequado. Estas situações exigem modelos paramétricos mais flexíveis ou uma análise estatística toda baseada em técnicas não-paramétricas. Em situações em que o tamanho da amostra é pequeno ou ocorre um número pequeno de falhas as técnicas gráficas podem indicar que os modelos são igualmente bons. TESTE DE HIPÓTESE Como as técnicas gráficas exigem um componente subjetivo na sua interpretação, uma outra forma de selecionar modelos é através de teste de hipótese. As hipóteses são: Este teste é realizado utilizando-se a estatística da razão de verossimilhanças em modelos encaixados. H0: O modelo é adequado. H1: O modelo não é adequado Um modelo generalizado, tal que os modelos de interesse sejam casos particulares, deve ser identificado. (1) Ajusta-se o modelo generalizado e obtém-se o valor do logaritmo de sua função de verossimilhança (log L(θˆG ) ) . (2) Ajusta-se o modelo de interesse e obtém-se o valor do logaritmo de sua função de verossimilhança (log L(θˆM ) ) . (3) Calcula-se a estatística da razão de verossimilhanças. [ RV = 2 log L (θˆG ) − log L (θˆM ) ] Sob H0 esta estatística tem distribuição Qui-Quadrado com graus de liberdade igual a diferença do número de parâmetros dos modelos sendo comparados. Este teste é usualmente realizado utilizando-se a distribuição gama generalizada que apresenta os modelos exponencial, weibull e lognormal como modelos encaixados. No R • • Estimação Paramétrica da curva de sobrevivência: ajuste<-survreg(Surv(tempo, censura)~1, dist=“distribuição”) Obtenção das estimativas de máxima verossimilhança dos parâmetros: Exponencial: lambda<-exp(ajuste$coefficients[1]) Weibull: lambda<-exp(ajuste$coefficients[1]) gamma<-1/ajuste$scale Obtenção das estimativas das funções de sobrevivência via modelos: Exponencial: ste<- exp(-tempos*lambda) Weibull: stw<- exp(-(tempos*lambda)^gamma) Lognormal: stln<- pnorm((-log(tempos)+ mu)/sigma)