Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de
sucesso estimada do modelo de Regressão Logística
José Edson Rodrigues Guedes Gondim1
Joab de Oliveira Lima2
Resumo
Uma das grandes dificuldades no uso de Modelos de Regressão Logística, para
fins de classificação, é a determinação, baseado na probabilidade estimada de sucesso, do
melhor ponto de corte que produz a melhor classificação possível para o modelo proposto.
Neste trabalho será sugerida a utilização de algoritmo genético para encontrar o ponto
de corte ótimo que maximize a proporção de acerto. Os resultados referentes às taxas de
acerto encontradas foram comparados com as taxas de acerto geradas por outros dois
métodos, são eles: (a) um ponto de corte baseado na proporção 0,5, isto é, a classificação
prevista para a variável resposta será 0 se P(Y=1) ≤ 0,5 e 1 caso contrário e (b) um ponto de
corte baseado na proporção amostral (à priori) de 1’s observada na amostra estudada.
As análises mostraram que os pontos de corte gerados pelo algoritmo genético
forneceram, em 99,70% dos casos estudados, taxas de classificações corretas superiores às
taxas de acerto produzidas pelos outros dois métodos. Além disso, observou-se que os pontos
de corte produzidos pelo algoritmo genético melhoraram a proporção estimada de
classificação correta em 19,75% (em média) quando comparada com as dos outros métodos
examinados.
Os resultados mostraram que é possível encontrar uma regra de classificação mais
adequada para a probabilidade estimada de sucesso do Modelo de Regressão Logística e que
as técnicas computacionais evolutivas, como algoritmo genético, podem ser muito úteis
nesses casos.
Palavras-chave: Regressão logística, Ponto de Corte, Algoritmos genéticos
1
2
DEINFO-UFRPE. e-mail: [email protected]
Departamento de Estatística/UFPB. e-mail: [email protected].
Download

Uso de Algoritmo Genético para a otimização do ponto de corte da