© Copyright 2012 EMC Corporation. Todos os direitos reservados.
1
BIG DATA
TRANSFORMA
OS NEGÓCIOS
Gustavo Tamaki
Sr. Sales Manager
Greenplum – A Division of EMC
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
2
!!!
!!!
“Big Data Is Less
About Size, And
More About Freedom”
!!!
―Techcrunch
!!!
!!!
!!!
“Findings: ‘Big Data’ Is
More Extreme Than “Big Data! It’s Real, It’s
Volume”
― Gartner
Real-time, and It’s
“Total data:
‘bigger’ than big
data” ― 451 Group
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
!!!
Already Changing Your
World”
―IDC
!!!
3
NO ANO 2000, O MUNDO GEROU
DOIS EXABYTES
DE NOVAS INFORMAÇÕES
2,000,000,000,000,000,000
Exa
Peta
Tera
Giga
Mega
Kilo
Byte
Fonte: "How Much Information?" Peter Lyman and Hal Varian, UC Berkeley. Digital Universe Study (Estudo do universo digital) da IDC, 2011.
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
4
NO ANO 2000, O MUNDO GEROU
DOIS EXABYTES
DE NOVAS INFORMAÇÕES
TODOS OS DIAS
Fonte: "How Much Information?" Peter Lyman and Hal Varian, UC Berkeley. Digital Universe Study (Estudo do universo digital) da IDC, 2011.
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
5
Nesta Década o Universo Digital Irá
CRESCER 30X
de 1.2 para 35.2 ZETTABYTES
Source: 2010 IDC Digital Universe Study
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
6
O Que Está Gerando a Inundação de Dados?
O FACEBOOK CARREGA
250 MILHÕES
DE FOTOS POR DIA
Sensores Móveis
A LEITURA DE MEDIDAS
INTELIGENTES
A CADA 15 MINUTOS
CONSOME
3.000X MAIS
Mídia Social
Vigilância em Vídeo
O CUSTO PARA
SEQUENCIAR
AS PLATAFORMAS DE
PETRÓLEO GERAM
UM
GENOMA
25.000
CAIU DE
US$ 100 mi EM 2001
PONTOS DE
DADOS
DADOS
POR SEGUNDO
Smart Grids
Exploração de Petróleo
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Processamento de Vídeo
PARA US$ 10.000 EM
2011
Imagens Médicas
Sequenciamento Genético
7
O Valor dos Dados Está Aumentando
Novos modelos de negócios são baseados em dados!
1.000.000.000 de
consultas/dia
250.000.000 de
fotos novas/dia
290.000.000
de atualizações/dia
4.000.000
de pedidos/dia
2.800.000.000 de
transações/dia
31.000.000.000 de
interações/dia
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
8
90% do
Universo Digital é
NÃO ESTRUTURADO
Source : 2011 IDC Digital Universe Study
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
9
!!!
“Big Data Is Less
About Size, And
More About Freedom”
―Techcrunch
!!!
A ERA DO
BIG DATA
!!!
!!!
!!!
“Findings: ‘Big Data’ Is
More Extreme Than
“Big Data! It’s Real, It’s
Volume”
― Gartner
Real-time, and It’s
É AGORA
“Total data:
‘bigger’ than big !!!
data” ― 451 Group
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
!!!
Already Changing Your
―IDC
World”
!!!
10
Big Data Tem Gerado Novas Demandas
Dentro das Organizações
• Dados estruturados: transações em POS,
call detail records, transações de cartão de
crédito, atualizações de envio, ordens de
compra, pagamentos, envios, transações
de conta
• Dados não-estruturados: Web logs,
newsfeeds, social media, geo-location,
mobile, comentários de consumidores,
reclamações, notas de médicos, estudos
clínicos, imagens, video, audio
• Geradores de dados: sensores RFID,
smart meters, smart grids, GPS spatial,
micro-payments
Industry-specific
Web traffic
Velocity
Transactional
Data
Volume
Video
Social
Text
Complexity
Variety
Sensor/
location-based
Audio
Documents
Smart Grid
Images
Source: Gartner “Big Data Is Only The Beginning Of Extreme Information Management”, April 7, 2011
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
11
Big Data é Todo o Dado que…
…Desafia as Tecnologias
Tradicionais Existentes
“É Preciso Pensar Diferente”
Source: 2011 IDC Digital Universe Study
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
12
A Jornada Rumo ao Big Data
1
Todos os Dados
Respostas Rápidas
Elástico & Escalável
2
Processos & Ferramentas
Ágeis
Motores
AnalyticsAnalíticos
Engines
3
Ciência de Dados
Colaboração Data SelfService
Decisões em Tempo
Real
Novas Aplicações
“Data Monetization”
Apps com Uso de Big Data
Plataforma de Produtividade Analítica
Infraestrutura em Cloud
Infraestrutura Big Data
Foco na Tecnologia
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Processos Analíticos Ágeis
Foco nas Pessoas & Produtividade
Empresa Preditiva
Foco na Aplicação
13
A Jornada Rumo ao Big Data
1
Todos os Dados
Respostas Rápidas
Elástico & Escalável
Motores
AnalyticsAnalíticos
Engines
Infraestrutura em Cloud
Infraestrutura Big Data
Foco na Tecnologia
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
14
Big Data Requer uma Nova Abordagem
Scale Up, Manual
Ilhas de Recursos
Mais Capacidade = Mais Admins
Otimização = “Gato e Rato”
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Scale Out,
Automático
Um Conjunto Integrado
Mais Capacidade = Mesmos
Admins
Escalabilidade Linear
15
Scale Up Model
CPU CPU CPU
CPU
CPU CPU CPU
CPU
CPU CPU CPU
CPU
CPU CPU CPU
CPU
CPU CPU CPU
CPU
CPU CPU CPU
...
CPU
CPU CPU CPU
CPU
CPU CPU CPU
CPU
CPU CPU CPU
CPU
CPU CPU CPU
CPU
CPU CPU CPU
CPU
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
• Modelo de Investimento Caro
• Escalabilidade Cara e Limitada
• Desperdício de Capacidade de
Processamento
• Conectividade Limitada para Ambientes
de Big Data
• Elevado Custo de Disponbilidade
• Crescimento de Performance Não-Linear
16
Scale Out Model
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
CPU CPU
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
• Modelo de Investimento Otimizado (Baseado
em Commodity x86)
• Escalabilidade de Baixo Custo e Vistualmente
Ilimitado
• Otimização da Capacidade de Processamento
• Conectividade Cresce com o Número de Nós
do Cluster
• Custo Baixo de Disponibilidade
• Crescimento de Performance Linear
17
Soluções Scale-Out EMC para Big Data
ARQUITETURAS DE SOFTWARE EM CLUSTER
(Distributed File Systems, Clustered File Systems, etc)
Escalabilidade Ilimitada
Alta Performance
Máxima Proteção dos
Dados
Fácil de Usar / Gerenciar
Alta Disponibilidade
Serviços Enterprise
PLATAFORMA
DE NÓS
PARA BIG DATA
COMMODITY
HARDWARE
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
18
EMC Isilon
Capacidade Recorde
Simplicidade Extraordinária
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
19
Isilon: Armazenamento Scale-out Para
Big Data
Dimensionamento em
grande escala
15 PB em um único
sistema de arquivos
Desempenho inigualável
Throughput e IOPS
líderes do setor
Simplicidade no
gerenciamento
Gerencie PB como
gerenciaria TB
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
20
Desempenho Recorde em File System IO
Single File System
1,100,000+
636,036
403,326
190,675
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
21
Capacidade Recorde de File System
Single File System
15 PB
2 PB
64 TB
100 TB
Source: Vendor Product Specifications
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
22
Big Data Transforma a Produção de Filmes
 Aumenta a colaboração
e eficiência
• Acelera o término dos
projetos
• Permite disponibilidade
máxima dos dados
“Com Isilon, estúdios de ponta podem crescer em
performance e capacidade alinhados com as
mudanças de demanda dos projetos, acelerando a
produtividade enquanto minimiza os custos.”
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
23
Atmos
Globalmente Distribuído
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
24
Nova Abordagem Para Big Data Distribuído
L.A.
BOSTON
LONDRES
Ilhas de armazenamento
•
•
•
•
Sistemas distintos
Administração manual
Um locatário, muitos sistemas
Armazenamento provisionado por IT
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
L.A.
BOSTON
LONDRES
Pool de armazenamento único
•
•
•
•
Sistema único em vários locais
Políticas automatizadas
Vários locatários, um sistema
Acesso com autoatendimento
25
Armazene & Gerencie Big Data
Distribuído de Forma Eficiente
EMC Atmos
Um Único Sistema Através de Várias Localidades
APP
3
Scale-Out de Forma Transparente
Recursos Compartilhados e Segurança Multi-Tenant
Posicionamento, Proteção, Serviços de Dados Automatizados
Acesso Fácil Através de Redes & Plataformas
Medição & Self-Service
NEW YORK
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
U.K.
26
Então… tudo o que tenho a fazer é
gerenciar grandes volumes de
dados, certo?
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
27
ERRADO!
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
28
Big Data Tem a Ver com Novas
Formas de Lidar com os Dados
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
29
Big Data Tem a Ver com
Análises Preditivas!
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
30
Inteligência Analítica
O que é o melhor que pode acontecer?
O que irá acontecer?
Diagnóstico proativo
Por que está acontecendo?
Consultas
Ad Hoc
Relatório
s Padrões
O
Modelagem
Preditiva
Previsão
Análise
Estatística
Alertas
Query
Drill
Down
Otimização
Quais as ações necessárias?
Onde exatamente está o problema?
Quantos, com que frequencia, onde?
que aconteceu?
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
31
Como as Empresas Estão Usando Big Data
Pesquisa global da McKinsey com 1.469 executivos de nível C em diversos setores e empresas de vários portes, "Minding Your Digital Business", 2012.
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
32
Valor do Ciclo de Vida do Cliente
Focando Nos Seus Melhores Clientes
Customer Lifetime Value
Value
Customer Growth
o
Identifying UpsellCrossSell Opportunities
Customer Retention
o
Identifying at risk
customers
Customer Acquisition
o
Customer Targeting
o
Campaign Optimization
o
Social Media Analysis
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
33
Onde o Processo Analítico Adiciona Valor
Customer Life Cycle
By increasing
the avg basket
size
Value
By retaining
valuable
customers
By targeting more
valuable customers
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
34
Respostas Possíveis com Big Data
 O que os clientes estão dizendo e
fazendo?
 Quem são os clientes de maior
valor?
 Como podemos agrupar e
caracterizar entidades?
 Quem são os melhores
pagadores?
 O que poderíamos mudar para
influenciá-los?
 Que clientes são os melhores
alvos de uma campanha?
 O que está mudando no nosso
ambiente?
 Qual a melhor próxima oferta?
 Que artefatos e eventos são
relevantes para nossas questões?
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
 Como identificar clientes mais
propensos ao abandono?
 Como otimizar investimentos?
35
Infraestrutura Analítica para Big Data
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
36
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
37
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
38
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
39
A Plataforma Analítica Unificada
Greenplum
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
40
Big Data Transforma Utilities
 Preveja a utilização e as
paralizações
– Detecção mais rápida de paralisações
– Identifique o roubo de energia
 Ajude os clientes a reduzir custos
– Ofereça visualização em tempo real do
consumo de energia
 Incentive o comportamento do
consumidor
"A plataforma de data warehousing e análise
lógica da Greenplum nos ajuda a transformar
eficientemente os dados de medições em
informações práticas."
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
– Preço baseado na demanda em
momentos de pico e fora do pico
41
Inteligência Analítica em Utilities
Vizinhança com
baixa voltagem…
Problemas a
endereçar
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
42
A Jornada Rumo ao Big Data
1
Todos os Dados
Respostas Rápidas
Elástico & Escalável
2
Ciência de Dados
Colaboração Data SelfService
Processos & Ferramentas
Ágeis
Motores
AnalyticsAnalíticos
Engines
Plataforma de Produtividade Analítica
Infraestrutura em Cloud
Infraestrutura Big Data
Foco na Tecnologia
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Processos Analíticos Ágeis
Foco nas Pessoas & Produtividade
43
CIÊNCIA DE DADOS
A NOVA EQUIPE QUE ORIENTA O BIG DATA
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
44
Identificação da Evolução de Comunidades
Correlacionadas
Um ponto representa uma comunidade inteira
Pearson’s Correlation Coefficient:
Aplicar a Correlação de Pearson permite a identificação de
grupos de comunidades que estão altamente correlacionados
ao longo do tempo, o que significa que os ciclos de vida da
comunidade são semelhantes.
Qual a importância para o negócio?
Empresas podem tomar medidas diferentes para uma
comunidade em expansão em oposição a uma em
contração. As empresas podem também testar ações
em algumas comunidades antes de lançar uma
campanha para todo o grupo. Além disso, pode ser
possível identificar os motivos que levam as
comunidades a serem correlacionados, dando o
negócio muito mais poder preditivo sobre os seus
comportamentos.
Vertical Axes: Active Edges
Horizontal Axes: Time
Wu, B., Ye, Q., Yang,S., Croup CRM: a new Telecom CRM Framework from Social Network Perspective, CNIKM’09, November 6, 2009
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
45
Processo Lógico Pré-Existente
3. Buscar
informações
sobre os dados
1. Localizar
os dados
4. Passar
para o
Sandbox
2. Obter acesso
aos dados
6. Tornar o modelo
operacional
5. Finalmente a
análise!
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
46
Chorus: A Plataforma Social Para Big Data
Espaços de
trabalho do
projeto
Exploração
dos
dados
Colaboração
Publicação
e
iteração
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Análise
de dados
47
Análise Lógica Colaborativa
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
48
A Jornada Rumo ao Big Data
1
Todos os Dados
Respostas Rápidas
Elástico & Escalável
2
Processos & Ferramentas
Ágeis
Motores
AnalyticsAnalíticos
Engines
3
Ciência de Dados
Colaboração Data SelfService
Decisões em Tempo
Real
Novas Aplicações
“Data Monetization”
Apps com Uso de Big Data
Plataforma de Produtividade Analítica
Infraestrutura em Cloud
Infraestrutura Big Data
Foco na Tecnologia
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Processos Analíticos Ágeis
Foco nas Pessoas & Produtividade
Empresa Preditiva
Foco na Aplicação
49
Opções de Aplicativos Tradicionais
Aplicativos em pacotes
Aplicativos
personalizados
Automação
Eficiência e custo
Exige um modelo definido
Inovação
Crescimento e receita
Difíceis, caros, lentos
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
50
Aplicações Big Data
Dados não estruturados
Gene Sequencing Movie Editing Seismic Study
Dados semi-estruturados
Social Media
Clickstream
Productivity
Dados estruturados
CRM/Risk
ERP
Core Banking
Web Content Storage Services
Social Media
Clickstream
Productivity
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Hybrid
Cloud
51
Documentum xCP
xCelerated Composition Platform
Percepção para agir.
Melhor. Mais rápido. Compatível.
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
52
xCP: Desenvolvimento de Aplicações Baseada em
Casos para Big Data
Fácil construção
Uma ferramenta para quem não
é programador!
Modelagem de processos do tipo
arrastar-e-soltar
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
Decisões melhores e mais
rápidas
Forneça os dados mais recentes
Trilha completa de auditoria
Deixe a auditoria de TI feliz!
Reduza os riscos às informações
Permita decisões contextuais
53
POR ONDE
COMEÇAR?
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
54
Greenplum Analytics Lab
 Pacote de soluções que geram valor
comercial e resultados palpáveis
 Acelere os recursos de análise lógica
dos dados com seus analistas
 Aproveite a expertise dos cientistas de
dados da Greenplum
 Estabeleça uma visão estratégica para
o desenvolvimento de análises lógicas
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
55
Vision Workshop
• Entregáveis Chave:
–
–
Priorização de Oportunidades de Negócio orientadas de forma analítica (impactos de negócio,
financeiro ou competitivo, principais patrocinadores funcionais, riscos de implementação)
Use Cases de negócio detalhados (questões de negócio, decisões chave, indicadores chave de
performance, requerimentos de experiência do usuário, preocupações de governança)
Understand
Envision
Brainstorm
Select
Document
• Identify key
business
initiative,
objectives and
timeframe
• “Envision” the
business
potential of big
data advanced
analytics
• Identify
supporting
business
questions and
decisions
• Prioritize
opportunities
• Identify
impediments
• Capture
analytics
opportunities
• Recommend
next steps
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
56
Ciência de Dados e Lógica de Big Data
Curso e Certificação da EMCDSA
Visão geral do curso
Detalhes
• Currículo "aberto"
• Permite a participação imediata em
projetos de análise lógica
• Prepara para a certificação EMCDSA
(EMC Proven Professional Data Science
Associate, colaborador de ciência de
dados EMC Proven Professional)
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
57
A Jornada Rumo ao Big Data
1
2
TRANSIÇÃO PARA UMA
3
EMPRESA
PREDITIVA
NUVEM
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
SOCIAL
ÁGIL
58
OBRIGADO
© Copyright 2012 EMC Corporation. Todos os direitos reservados.
59
Download

Big Data