Algumas Aplicações Práticas da Tecnologia Data Mining Por Glaudson M. Bastos Data Mining constitui-se em uma tecnologia capaz de automatizar processos de busca por informações predictivas que podem estar ocultas dentro de um amontoado de banco de dados ou relatórios gerenciais. Questões que tradicionalmente exigem um extensivo trabalho de análise podem agora ser resolvidas diretamente dos dados — instantâneamente, já que as ferramentas Data Mining fazem uma verdadeira “varredura” nos bancos de dados, buscando identificar padrões. Um exemplo são as análises feitas com dados de vendas de varejo para descobrir supostas relações entre produtos sem conexão aparente mas que são muitas vezes vendidos juntos. Outras descobertas incluem detecção de transações fraudulentas com cartões de crédito e identificação de anomalias que podem representar erros nos registros dos dados comerciais. Quando as ferramentas Data Mining são implementadas em sistemas de processamento de alta performance, elas podem analisar massivos bancos de dados em questão de minutos. Através de um processamento mais rápido, os usuários podem executar simulações com diferentes modelos, compreendendo dados ainda mais complexos, obtendo então predicções mais aperfeiçoadas. ♣ Aplicações para Assistência Médica Os laboratórios GTE, construíram um avançado sistema de Data Mining, para reavaliar os custos relativos a empregados e dependentes de sua carteira de assistência médica. Com o Software Health-KEFIR (Key Findings Reporter) usando como alvo de modelagem, os centros de custo que foram divididos por áreas propensas a duplicação no ano seguinte, áreas estas onde seriam necessárias intervenções estratégicas visando à diminuição dos custos visíveis e invisíveis. Outra característica do programa Health-KEFIR é a seleção, para análise e estudo de casos de ocorrências médicas consideradas como “importantes”; sob a forma de procedimentos médicos capazes de gerar benefícios para a saúde, diminuindo os custos. Por exemplo, a GTE estuda o padrão das intervenções médicas feitas durante um tratamento de pré-natal, procurando associação entre este tipo de tratamento e a ocorrência de um parto natural, visando assim uma redução das possibilidades de surgimento de partos pré-maturos. O centro médico Southern Califórnia Spinal Disorders em Los Angeles está utilizando o IDIS (Intelligence Ware) em PCs para ver se descobre fatores que afetam o sucesso e o fracasso das cirurgias de coluna. Um técnico da Federação Americana de Ginástica está usando o mesmo programa para descobrir fatores que contribuam positivamente para a performance dos atletas. Essa informações estão sendo utilizadas com o objetivo de tratar problemas potenciais mais cedo ou antes que eles ocorram. © 2001, Glaudson Bastos - [email protected] ♣Aplicações em Ciência e Tecnologia Técnicas Data Mining estão encontrando padrões de estruturas moleculares, dados genéticos, mudança global no clima e na temperatura, etc. O NASA-Jet Propulsion Laboratory e Caltech,Inc. desenvolveram o SKICAT (SKY Image Cataloging and Analysis Tool), um avançado sistema Data Mining para analisar e catalogar automatizadamente descobertas do segundo Observatório Espacial Palomar. Ao término da promeira fase do projeto, o SKICAT terá observado e analisado o catálogo de mais de 50 milhões de galáxias, 20 bilhões de estrelas e cem mil quasars e pulsares. O observatório terá uma produção de cerca de 3 terabytes de dados, que serão garimpados e consequentemente sintetizados em um relatório rico em informações e descobertas. O programa SKICAT descobriu recentemente 9 novos pulsares. Com as técnicas de pesquisas que eram utilizadas anteriormente a descoberta de um número semelhante de pulsares levaria cerca de três anos. Com SKICAT, os astrônomos da Caltech realizaram esse feito em menos de seis meses e com um tempo de observação reduzido em relação ao que levaria sem o desenvolvimento Data Mining. ♣Aplicações para o Poder Judiciário Beverly Cook, uma pesquisadora da Universidade de Wisconsin em Milwaukee, modelou algumas aplicações Data Mining com o software IDIS para avaliar um processo judiciário que envolvia a pena de morte - foram correlacionados dados como opiniões pessoais e votos dados pela Suprema Corte de Justiça americana em referência a um caso específico que esteve em julgamento, conhecido como o caso Byron White. O relatório final da Universidade indicava que o comportamento de escolha pela penalidade de morte estava sempre relacionado com filiação do membro do júri ao bloco conservador da Corte de Justiça, e que o seu padrão de voto era geralmente ligado à raça do acusado. ♣Aplicações para Bancos de Varejo Stratton Trust é um banco full-service com 1 milhão de clientes. O Vice Presidente de Marketing está interessado em persuadir os clientes mais ricos a transferir os seus saldos de outros cartões de outros bancos para o cartão da Stratton Trust. Planeja atiçá-los com uma oferta de juros baixos para financiar os saldos que forem transferidos. Uma campanha como esta geralmente apresentaria um custo elevado, portanto o planejamento de marketing deseja dirigir o foco para aqueles que apresentam maiores chances de aceitar a oferta e que possuem hábitos de consumo específicos. O Vice Presidente decide fazer um teste e envia uma “mala direta luxuosa” para uma amostra de 10.000 clientes escolhidos aleatoriamente. Quinhentos clientes aceitaram a oferta = ( 5% de resposta ). Aplicando um Data Mining com o software Discovery Server, o banco usa a informação obtida com os 10.000 clientes para criar modelos preditivos de segmentação, e aplica em seguida este "molde" nos 990.000 clientes restantes para extrair os © 2001, Glaudson Bastos - [email protected] registros de clientes que apresentam as mesmas características. O software Segment Viewer mostra as regras, ou características , de cada segmento encontrado, assim como a participação na receita bruta. O Vice Presidente aprende que o número de saques em Caixa Automático e como também que clientes antigos que vem mantendo contas no banco são fatores preditivos para determinar quem apresentará maiores chances de aceitar uma oferta de transferência de saldo. Ele fica surpreso ao saber que o saldo do cartão não é necessariamente um fator que determina quem vai participar da promoção. Trabalhando com o modelo de lucratividade Profit Chart® , ele aprende que é possível otimizar os lucros se dirigir os esforços para os três segmentos que apresentam maiores chances de responder à promoção, mesmo que estes não sejam os mais volumosos quando comparados a outros segmentos de clientes. Concentrando o investimento nos três segmentos mais receptivos recebe o mesmo número de respostas se enviasse para uma lista aleatória 10 vezes maior, obtendo a mesma receita com um custo dez vezes menor. Conclusão A construção de um banco de dados de cunho corporativo que integre dados operacionais com dados sobre clientes, fornecedores, e informações de mercado têm resultado em uma “explosão” de informações. E o panorama competitivo atual requer dos empresários brasileiros, investimento em tempo e em sofisticadas análises dentro de uma visão interativa dos dados. Entretanto, existe ainda uma lacuna crescente entre a maior capacidade de armazenamento dos dados, sistemas de restauração e a habilidade efetiva dos executivos e empresários brasileiros em analisar e agir com as informações que contenham em suas bases de dados. Um novo salto tecnológico se faz necessário quando se quer estruturar e priorizar informações críticas de marketing para a resolução de problemas muito específicos encontrados pelos analistas de mercado e pelos responsáveis pelos processos de tomada de decisão dentro das empresas. As ferramentas Data Mining podem promover este salto. Fontes de Pesquisa: Press Releases de Meta Group Application Developement Strategies. Data Mining for DataWarehouses: Uncovering Hidden Patterns. Boston: Meta Group, 1998; e Sara Hedberg. The Data Gold Rush, Washington: Hedberg, 2000. Glaudson M. B ast os é Consultor de Empresas, Especialista em Marketing Estratégico pela UCAM, e Especialista em Gestão Financeira pelo I SEP, Consultor da Área de T ecnologia para Adensamento de Cadeias Produtivas do Sebrae/RJ e Sócio-Gerente da Logike Associados S/C Ltda. © 2001, Glaudson Bastos - [email protected]