Análises Preditivas com uso
do BIG DATA
Um estudo de caso
BIG DATA
Conceitualmente um ambiente de infinitas possibilidades
“O que sabemos é uma gota, o
que ignoramos é um oceano”
(Isaac Newton)
BIG DATA
O valor das Análises Preditivas



O Mckinsey Global Institute estima que a aplicação de estratégias de
Big Data e Análises Preditivas em alguns segmentos de mercado
podem gerar um valor de US $ 100 bilhões anuais em mercados como
sistemas de saúde pública ou privada como a indústria farmacêutica.
A exata predição atua como alto fator de tangibilidade nas iniciativas
Big Data.
Para que a predição acontecer de forma assertiva deve-se trabalhar
com uma composição adequada de skills e plataforma de
tecnologia.
Análises Preditivas
Exemplo de GANHOS e BENEFÍCIOS – Health Care
Análises Preditivas
Exemplo de GANHOS e BENEFÍCIOS – Health Care
• Análise preditiva aumenta potencialmente a precisão de diagnósticos;
• Análise preditiva ajuda a medicina preventiva e saúde pública;
• Análise preditiva suporta incrementos nas previsões relativas às
despesas de produtos de seguros saúde – empregadores e hospitais;
• A análise preditiva permite aos pesquisadores desenvolver modelos
de previsão que não necessitam de milhares de casos como
amostragem para resultados, tornando-se
então mais precisas ao
longo do tempo;
• As companhias farmacêuticas podem usar análise preditiva para
melhor atender às necessidades de medicamentos para o público.
Análises Preditivas
Exemplo de GANHOS e BENEFÍCIOS – Health Care
O caso da UC – IC Irvine com a Hortonworks.
A IC Irvine Health esta utilizando uma grande plataforma de dados para
análises preditivas. Irvine está construindo toda uma prática médica movida
a análises;
em um esforço para reduzir readmissões, aumentar a
velocidade de projetos de investigação e acompanhar as estatísticas vitais
do paciente em tempo quase real.
Análises Preditivas
Big Data da Hortonworks para a UC Irvine
O Case UC Irvine Saúde
UC Irvine possui um grupo focado em analisar os principais acontecimentos
da instituição. O Grupo tem acesso a um tesouro de informações históricas :
milhares de planilhas, 9 milhões de registros de aproximados 1,2 milhões de
pacientes numa série histórica de 22 anos. Antes do projeto nenhum destes
dados foram sequer recuperados, e dados de radiologia, patologias,
relatórios e notas de cobranças todos valiosos nunca foram agregados ou
analisados.
Análises Preditivas
Big Data da Hortonworks para a UC Irvine
O projeto:
Na etapa 1 foi criado um DW tradicional com ferramentas analíticas logo
em seguida na etapa 2 todo o ambiente foi migrado para Hortonworks
como única plataforma analítica. Antes da existência deste ambiente
Hadoop não era possível acessar ou agrupar dados do DW e do do registro
médico eletrônico de uma forma consistente.
Com a solução os cerca de 9 milhões de registros semi-estruturados
advindos do legado são agora pesquisáveis ​e recuperáveis ​no Hadoop
Distributed File System (HDFS). Isto permitiu à equipe UCIH desligar seu
sistema legado que era utilizado apenas para esta exibição, poupando-lhes
mais de US $ 500.000.
Análises Preditivas
Big Data da Hortonworks para a UC Irvine
O Preditivo causando impacto nos negócios
Com o Big Data a Irvine lançou dois novos programas orientados por dados,
um
focado em pacientes para reduzir a re-admissão e outro para
monitorar os sinais vitais do paciente em tempo real.
A primeira solução que cabe destacar aqui é a análise preditiva para
reduzir a re-admissão no hosp Um dos objetivos da UCIH é prever a
probabilidade de re-admissão hospitalar dentro de 30 dias após a alta.
Pacientes com insuficiência cardíaca congestiva têm uma tendência a
acumular fluido, o que faz com que eles ganhem peso.
Análises Preditivas
Big Data da Hortonworks para a UC Irvine
O Preditivo causando impacto nos negócios
O rápido ganho de peso ao longo de um período de 1 a 2 dias é um sinal
de que algo está errado. UCIH contou com parceiro de integração de
dispositivos médicos chamado iSirona, para desenvolver um programa que
envia a esses pacientes cardíacos que foram para casa uma escala e
instruções para pesar-se uma vez por dia. Os dados de peso são então
transmitidos sem fio para
a base Hadoop onde um algoritmo que
determina alterações de peso indicam risco de possível
readmissão. O
sistema notifica os clínicos sobre apenas os casos críticos. Todos os dados de
monitorização em casa são visíveis no device dos médicos através de uma
API para Hadoop.
BIG DATA
Parceria Hortonworks
Arquitetura de Dados Moderna

Possibilitar as suas aplicações
acesso a TODOS os dados
corporativos através de uma
plataforma de dados
centralizada e eficiente;

Baseada em governança,
segurança e operações
centralizadas;

Versátil para trabalhar com
qualquer aplicação e
qualquer dado, não
importando o tamanho ou o
tipo;

100% Open Source e Open
Community.
Setor Financeiro
Análise de Risco de Crédito e Fraude
Problema: dados fragmentados em silos, orientados por unidade de
negócios
•
Grande dificuldade em estabelecer uma visão integrada de dados;
•
A maior parte do esforço da equipe de modelagem preditiva estava em coletar, cruzar e
preparar os dados;
•
Necessidade de arquitetura de dados moderna, capaz de armazenar dados estruturados com
histórico superior a 10 anos de maneira efeiciente e também dados semi-estruturados.
Solução: Arquitetura de Dados Centralizada
produtividade de time de modelagem preditiva
multiplicando
•
Data Lake: Arquitetura de Dados Centralizada;
•
Plataforma unificada de dados reduziu esforço de integração e preparação de dados;
•
Modelos preditivos agora são construídos de maneira muito mais rápida e com melhores
resultados.
GM
1
Setor Telecom
Análise de CDR (Call Detailed Record)
Problema: custo de armazenamento das soluções utilizadas limitavam captura
e armazenamento de dados
•
Retenção limitada de dados CDR (devido a custos das solucões legadas);
•
Captura limitada de dados de CRM, campanhas de prospecção;
•
Dificuldade em ter visão integrada das fontes de dados.
Solução: Hortonworks para Exploração Dados e análises preditivas
•
Hortonworks retem histórico de CDR por 5 anos e dados de outras fontes, aumentando a
qualidade das análises preditivas;
•
Dados de retenção de clientes são cruzados com dados de qualidade de serviço para redução
de chrun;
•
Execução de algorítmo de recomendação (NPTB – next product to buy).
GM
1
Setor Varejo (Retail)
Recomendação de Produtos e Promoções
Problema: Dificuldade para gerar recomendações de produtos e promoções
personalizadas
•
Empresa de comércio possui múltiplos canais de interação com o cliente, por exemplo: lojas
físicas, web-site, mobile, kiosks;
•
Cada canal possui sua própria plataforma tecnológica para captura e armazenamento de
dados, dificultando uma visão 360o do cliente (cross-channel);
•
Necessidade de melhor relacionamento e interatividade com o cliente.
Solução: Hortonworks em Real-Time para recomendação de produtos e
promoções personalizadas
•
Centralização de dados de todos os canais em uma única plataforma;
•
Recomendação de produtos em real-time;
•
Geração de campanhas e promoções personalizadas baseadas na interação do cliente em
múltiplos canais.
GM
1
Obrigado
LEEGA Consultoria
Sérgio Topfstedt
[email protected]
11 9 9484 5396
Hortonworks
Guilherme Braccialli
[email protected]
11 9 8134 1618
Download

Análises Preditivas