PROCEDIMENTO PARA A ESCOLHA DE UMA
DISTRIBUIÇÃO
O método de máxima verossimilhança somente deve ser
aplicado após ter sido definido um modelo probabilístico
adequado para os dados.
•
Se um modelo for usado inadequadamente, toda a análise
estatística fica comprometida e consequentemente as respostas
às perguntas de interesse ficam distorcidas.
•
•A
idéia empírica consiste em ajustar os modelos
probabilísticos típicos para dados de tempos de vida e com base
na comparação entre valores estimados e observados, decidir
qual deles “melhor” se ajusta aos dados amostrais.
•A
escolha da “melhor” distribuição pode ser feita por meio de
técnicas gráficas ou testes de hipóteses com modelos
encaixados.
MÉTODO GRÁFICO I
Este método consiste na comparação da função de
sobrevivência do modelo proposto com o estimador de
Kaplan-Meier.
Os modelos propostos são ajustados ao conjunto de dados e, a
partir das estimativas dos parâmetros de cada modelo,
estimam-se suas respectivas funções de sobrevivência.
Para o conjunto de dados obtém-se também, a estimativa de
Kaplan-Meier para a função de sobrevivência ( Sˆ (t ) ).
A comparação das funções de sobrevivência estimadas para
cada modelo proposto com a função obtida pelo estimador de
Kaplan-Meier pode ser feita de duas maneiras.
Uma forma de comparar as funções é construindo os gráficos
das função de sobrevivência estimada via Kaplan-Meier ( Sˆ (t ) )
versus a função de sobrevivência estimada para cada modelo
proposto ( Sˆ M (t ) ).
O “ melhor” modelo é então aquele cujos pontos da função de
sobrevivência estimada estiverem mais próximos dos valores
obtidos pelo estimador de Kaplan-Meier.
Isto é, o melhor modelo é aquele cujos pontos no gráfico
estiverem mais próximos da reta y = x, com x = Sˆ (t ) e y = Sˆ M (t ).
Uma outra forma de comparação é colocar no mesmo gráfico
as curvas Sˆ (t ) versus t e Sˆ M (t ) versus t, para cada modelo
proposto.
O modelo (ou os modelos) adequado é aquele em que sua
curva de sobrevivência se aproximar daquela do EKM. Esta
comparação também pode ser feita através de H(t).
MÉTODO GRÁFICO II
Este método consiste na linearização da função de
sobrevivência, tendo como idéia básica a construção de
gráficos que sejam aproximadamente lineares, caso o modelo
proposto seja adequado.
Esta forma de avaliação se deve ao fato de que violações da
linearidade podem ser rapidamente verificadas visualmente.
O gráfico utilizado é o de uma transformação que lineariza a
função de sobrevivência do modelo proposto.
Isto gera, como resultado final, uma reta, se o modelo
proposto for adequado.
A ideia é baseada, novamente, em uma comparação entre o
modelo proposto e o estimador de Kaplan-Meier.
Modelo exponencial
Para o modelo exponencial, temos que a função de
sobrevivência é dada por: S (t ) = e − λ t
Para linearizar esta função iremos aplicar o logaritmo.
Assim, − ln S (t ) é uma função linear de t, e o gráfico de − ln Sˆ ( t )
(sendo Sˆ ( t ) o estimador de Kaplan-Meier) versus t deve ser
aproximadamente linear, passando pela origem, se o modelo
exponencial for adequado.
Modelo Weibull
Para o modelo weibull, temos que a função de sobrevivência é
− ( λt )γ
dada por:
S (t ) = e
Para linearizar esta função, iremos aplicar o logaritmo.
Assim, ln[ − ln S (t )]é uma função linear de ln(t).
O gráfico de ln[− ln Sˆ (t )] versus ln(t), deve ser aproximadamente linear, se
o modelo weibull for apropriado.
Modelo Lognormal
Considerando o modelo Lognormal, temos que a função de sobrevivência é
dada por:
 − ln( t ) + µ 
S (t
(t ) = φ 

σ


A linearização desta função pode ser obtida da seguinte forma.
Φ −1 ( S (t )) =
− ln t + µ
σ
Em que φ −1 (.) são os percentis da distribuição normal padrão.
O gráfico de φ (Sˆ(t)) versus ln(t), deve ser aproximadamente linear, com
intercepto µ / σ e inclinação -1/σ, se o modelo lognormal for adequado.
−1
Podem existir situações em que nenhum desses modelos sejam
adequado.
Estas situações exigem modelos paramétricos mais flexíveis ou uma
análise estatística toda baseada em técnicas não-paramétricas.
Em situações em que o tamanho da amostra é pequeno ou ocorre um
número pequeno de falhas as técnicas gráficas podem indicar que os
modelos são igualmente bons.
TESTE DE HIPÓTESE
Como as técnicas gráficas exigem um componente subjetivo na sua
interpretação, uma outra forma de selecionar modelos é através de
teste de hipótese.
As hipóteses são:
Este teste é realizado utilizando-se a estatística da razão de
verossimilhanças em modelos encaixados.
H0: O modelo é adequado.
H1: O modelo não é adequado
Um modelo generalizado, tal que os modelos de interesse sejam casos
particulares, deve ser identificado.
(1) Ajusta-se o modelo generalizado e obtém-se o valor do logaritmo de
sua função de verossimilhança (log L(θˆG ) ) .
(2) Ajusta-se o modelo de interesse e obtém-se o valor do logaritmo de sua
função de verossimilhança (log L(θˆM ) ) .
(3) Calcula-se a estatística da razão de verossimilhanças.
[
RV = 2 log L (θˆG ) − log L (θˆM )
]
Sob H0 esta estatística tem distribuição Qui-Quadrado com graus de
liberdade igual a diferença do número de parâmetros dos modelos
sendo comparados.
Este teste é usualmente realizado utilizando-se a distribuição gama
generalizada que apresenta os modelos exponencial, weibull e
lognormal como modelos encaixados.
No R
•
•
Estimação Paramétrica da curva de sobrevivência:
ajuste<-survreg(Surv(tempo, censura)~1, dist=“distribuição”)
Obtenção das estimativas de máxima verossimilhança dos
parâmetros:
Exponencial: lambda<-exp(ajuste$coefficients[1])
Weibull: lambda<-exp(ajuste$coefficients[1])
gamma<-1/ajuste$scale
Obtenção das estimativas das funções de sobrevivência via
modelos:
Exponencial: ste<- exp(-tempos*lambda)
Weibull: stw<- exp(-(tempos*lambda)^gamma)
Lognormal: stln<- pnorm((-log(tempos)+ mu)/sigma)
Download

(Microsoft PowerPoint - Aula 8 M\351todos para escolha