Algumas Aplicações Práticas da Tecnologia Data Mining
Por Glaudson M. Bastos
Data Mining constitui-se em uma tecnologia capaz de automatizar processos de busca por
informações predictivas que podem estar ocultas dentro de um amontoado de banco de dados ou
relatórios gerenciais. Questões que tradicionalmente exigem um extensivo trabalho de análise
podem agora ser resolvidas diretamente dos dados — instantâneamente, já que as ferramentas
Data Mining fazem uma verdadeira “varredura” nos bancos de dados, buscando identificar
padrões. Um exemplo são as análises feitas com dados de vendas de varejo para descobrir
supostas relações entre produtos sem conexão aparente mas que são muitas vezes vendidos
juntos. Outras descobertas incluem detecção de transações fraudulentas com cartões de crédito e
identificação de anomalias que podem representar erros nos registros dos dados comerciais.
Quando as ferramentas Data Mining são implementadas em sistemas de processamento de alta
performance, elas podem analisar massivos bancos de dados em questão de minutos. Através de
um processamento mais rápido, os usuários podem executar simulações com diferentes
modelos, compreendendo dados ainda mais complexos, obtendo então predicções mais
aperfeiçoadas.
♣ Aplicações para Assistência Médica
Os laboratórios GTE, construíram um avançado sistema de Data Mining, para reavaliar os
custos relativos a empregados e dependentes de sua carteira de assistência médica. Com o
Software Health-KEFIR (Key Findings Reporter) usando como alvo de modelagem, os centros
de custo que foram divididos por áreas propensas a duplicação no ano seguinte, áreas estas onde
seriam necessárias intervenções estratégicas visando à diminuição dos custos visíveis e
invisíveis. Outra característica do programa Health-KEFIR é a seleção, para análise e estudo de
casos de ocorrências médicas consideradas como “importantes”; sob a forma de procedimentos
médicos capazes de gerar benefícios para a saúde, diminuindo os custos. Por exemplo, a GTE
estuda o padrão das intervenções médicas feitas durante um tratamento de pré-natal, procurando
associação entre este tipo de tratamento e a ocorrência de um parto natural, visando assim uma
redução das possibilidades de surgimento de partos pré-maturos.
O centro médico Southern Califórnia Spinal Disorders em Los Angeles está utilizando o IDIS
(Intelligence Ware) em PCs para ver se descobre fatores que afetam o sucesso e o fracasso das
cirurgias de coluna. Um técnico da Federação Americana de Ginástica está usando o mesmo
programa para descobrir fatores que contribuam positivamente para a performance dos atletas.
Essa informações estão sendo utilizadas com o objetivo de tratar problemas potenciais mais
cedo ou antes que eles ocorram.
© 2001, Glaudson Bastos - [email protected]
♣Aplicações em Ciência e Tecnologia
Técnicas Data Mining estão encontrando padrões de estruturas moleculares, dados genéticos,
mudança global no clima e na temperatura, etc.
O NASA-Jet Propulsion Laboratory e
Caltech,Inc. desenvolveram o SKICAT (SKY Image Cataloging and Analysis Tool), um
avançado sistema Data Mining para analisar e catalogar automatizadamente descobertas do
segundo Observatório Espacial Palomar. Ao término da promeira fase do projeto, o SKICAT
terá observado e analisado o catálogo de mais de 50 milhões de galáxias, 20 bilhões de estrelas e
cem mil quasars e pulsares. O observatório terá uma produção de cerca de 3 terabytes de dados,
que serão garimpados e consequentemente sintetizados em um relatório rico em informações e
descobertas.
O programa SKICAT descobriu recentemente 9 novos pulsares. Com as técnicas
de pesquisas que eram utilizadas anteriormente a descoberta de um número semelhante de
pulsares levaria cerca de três anos. Com SKICAT, os astrônomos da Caltech realizaram esse
feito em menos de seis meses e com um tempo de observação reduzido em relação ao que
levaria sem o desenvolvimento Data Mining.
♣Aplicações para o Poder Judiciário
Beverly Cook, uma pesquisadora da Universidade de Wisconsin em Milwaukee, modelou
algumas aplicações Data Mining com o software IDIS para avaliar um processo judiciário que
envolvia a pena de morte - foram correlacionados dados como opiniões pessoais e votos dados
pela Suprema Corte de Justiça americana em referência a um caso específico que esteve em
julgamento, conhecido como o caso Byron White. O relatório final da Universidade indicava
que o comportamento de escolha pela penalidade de morte estava sempre relacionado com
filiação do membro do júri ao bloco conservador da Corte de Justiça, e que o seu padrão de
voto era geralmente ligado à raça do acusado.
♣Aplicações para Bancos de Varejo
Stratton Trust é um banco full-service com 1 milhão de clientes. O Vice Presidente de
Marketing está interessado em persuadir os clientes mais ricos a transferir os seus saldos de
outros cartões de outros bancos para o cartão da Stratton Trust.
Planeja atiçá-los com uma
oferta de juros baixos para financiar os saldos que forem transferidos. Uma campanha como esta
geralmente apresentaria um custo elevado, portanto o planejamento de marketing deseja dirigir
o foco para aqueles que apresentam maiores chances de aceitar a oferta e que possuem hábitos
de consumo específicos. O Vice Presidente decide fazer um teste e envia uma “mala direta
luxuosa” para uma amostra de 10.000 clientes escolhidos aleatoriamente. Quinhentos clientes
aceitaram a oferta = ( 5% de resposta ). Aplicando um Data Mining com o software Discovery
Server, o banco usa a informação obtida com os 10.000 clientes para criar modelos preditivos de
segmentação, e aplica em seguida este "molde" nos 990.000 clientes restantes para extrair os
© 2001, Glaudson Bastos - [email protected]
registros de clientes que apresentam as mesmas características. O software Segment Viewer
mostra as regras, ou características , de cada segmento encontrado, assim como a participação
na receita bruta.
O Vice Presidente aprende que o número de saques em Caixa Automático e
como também que clientes antigos que vem mantendo contas no banco são fatores preditivos
para determinar quem apresentará maiores chances de aceitar uma oferta de
transferência de saldo. Ele fica surpreso ao saber que o saldo do cartão não é necessariamente
um fator que determina quem vai participar da promoção. Trabalhando com o modelo de
lucratividade Profit Chart® , ele aprende que é possível otimizar os lucros se dirigir os esforços
para os três segmentos que apresentam maiores chances de responder à promoção, mesmo que
estes não sejam os mais volumosos quando comparados a outros segmentos de clientes.
Concentrando o investimento nos três segmentos mais receptivos recebe o mesmo número de
respostas se enviasse para uma lista aleatória 10 vezes maior, obtendo a mesma receita com um
custo dez vezes menor.
Conclusão
A construção de um banco de dados de cunho corporativo que integre dados operacionais com
dados sobre clientes, fornecedores, e informações de mercado têm resultado em uma “explosão”
de informações. E o panorama competitivo atual
requer dos empresários brasileiros,
investimento em tempo e em sofisticadas análises dentro de uma visão interativa dos dados.
Entretanto, existe ainda uma lacuna crescente entre a maior capacidade de armazenamento dos
dados, sistemas de restauração e a habilidade efetiva dos executivos e empresários brasileiros
em analisar e agir com as informações que contenham em suas bases de dados. Um novo salto
tecnológico se faz necessário quando se quer estruturar e priorizar informações críticas de
marketing para a resolução de problemas muito específicos encontrados pelos analistas de
mercado e pelos responsáveis pelos processos de tomada de decisão dentro das empresas. As
ferramentas Data Mining podem promover este salto.
Fontes de Pesquisa: Press Releases de Meta Group Application Developement Strategies. Data Mining for
DataWarehouses: Uncovering Hidden Patterns. Boston: Meta Group, 1998; e Sara Hedberg. The Data Gold Rush,
Washington: Hedberg, 2000.
Glaudson M. B ast os é Consultor de Empresas, Especialista em Marketing Estratégico pela
UCAM, e Especialista em Gestão Financeira pelo I SEP, Consultor da Área de T ecnologia para
Adensamento de Cadeias Produtivas do Sebrae/RJ e Sócio-Gerente da Logike Associados S/C
Ltda.
© 2001, Glaudson Bastos - [email protected]
Download

Algumas Aplicações Práticas da Tecnologia Data Mining