Gestão de Negócios Virtuais
Prof° Ms. Claudio Benossi
Aula 09
Administração de Empresas
Big Data
Dados
• Dados como um conceito abstrato pode ser
explicado como o mais baixo nível de
abstração a partir do qual as informações e,
em seguida, o conhecimento são derivados.
• Informações em forma bruta ou desorganizada
(como letras, números ou símbolos) que se
referem ou representam, condições, ideias ou
objetos. Os Dados são ilimitados e presentes
em todo o universo.
Big Data
Tipos de Dados
• Dados Relacionais (Tabelas / Transação /
Legacy Data)
• Texto de Dados (Web)
• Semi-estruturados de dados (XML)
• Gráfico de Dados de Redes Sociais,
semanticweb (RDF)
• Data Streaming -Você só pode digitalizar os
dados uma vez
Big Data
• Big data é um enorme volume de dados
estruturados e não estruturados.
• O volume é tão grande que é impossível
processar com técnicas de banco de
dados e software tradicionais.
Big Data
• Big data é o termo utilizado para uma
coleção de conjuntos de dados tão
grande e complexo que se torna
impossível
processar
usando
ferramentas de gerenciamento de
banco de dados ou aplicações de
processamento de dados tradicionais.
Big Data
• Big data são dados cuja escala,
diversidade e complexidade exigem
novas arquiteturas, técnicas, algoritmos
e análises para gerenciá-los e extrair
valor e conhecimento oculto deles.
Onde está o Big Data
• Walmart lida com mais de 1 milhão de transações
de clientes a cada hora.
• Facebook processa 40 bilhões de fotos a partir de
sua base de usuários.
• Decodificação do genoma humano originalmente
levou 10 anos para processar; Agora isto pode ser
conseguido em uma semana.
• Google processava 20 PB por dia em 2008
• Facebook tem 2,5 PB de dados de usuários + 15TB /
dia em 2009 eBay tem 6,5 PB de dados do usuário +
50 TB / dia
Big Data
Big Data
VOLUME DE DADOS
• Aumento de 44x entre 2009 e 2020
• De 0,8 zettabytes para 35zb
• O volume de dados está crescendo
exponencialmente
Big Data
Variedade
• Vários formatos, tipos e estruturas
• Texto, imagens, áudio, vídeo, sequências,
séries temporais, dados de mídia social,
matrizes multi-dimensão, numéricos, entre
outros.
• Dados estáticos versus fluxo de dados
• Uma única aplicação pode estar gerando /
coletando muitos tipos de dados
Big Data
Velocidade
• Dados é começar gerado rápido e precisam
ser processadas rapidamente
• Análise de dados online
• Decisões tardias perdem oportunidades
• E-Promoções: Com base na sua localização
atual, o seu histórico de compras, o que
você gosta, enviar promoções agora para
uma loja perto de você.
Big Data
Velocidade
EXEMPLOS
• Monitoramento em Saúde: sensores de
monitoramento de suas atividades
corporais.
• As medições anormais exigem reação
imediata.
Big Data
Evolução do conceito de Big Data
Big Data
+1 V
Big Data
Quem está Gerando Big Data?
• Redes de Mídias Sociais
(Todos nós geramos dados)
Big Data
Quem está Gerando Big Data?
• Instrumentos Científicos
(coletando todos os tipos de dados)
Big Data
Quem está Gerando Big Data?
• Dispositivos Móveis
(Rastrando todos os objetos o tempo
todo)
Big Data
Quem está Gerando Big Data?
• Redes de sensors de tecnologia
(Medindo todos os tipos de dados)
Big Data
Dados Mudam Constantemente
Instrumentalização
Tudo que pode ser medido será medido.
•
Big Data
Dados Mudam Constantemente
Consumerização
Funcionários e clientes esperam mais
interações pessoais, mas não ao custo de
sua privacidade.
•
Big Data
Dados Mudam Constantemente
Experimentação
AS companhias mais inovadoras adotam a
experimentação e agilidade.
•
Big Data
Implantação de Big Data
Tecnologias de DBMS Paralelas
• Proposto no final dos anos oitenta
• Amadurecido ao longo das últimas duas
décadas
• Indústria Multi-bilionária: Motores DBMS
proprietários como solução de Data
Warehousing para grandes empresas
Big Data
Map Reduce
• Google foi o pioneiro
• Yahoo! popularizou (Hadoop)
Big Data
O que é Hadoop?
• É um Sistema distribuído, tolerante a
falhas e altamente escalável para
processamento e armazenamento de
dados
Big Data
O Hadoop possui dois principais
componentes:
• Hadoop Distributed File System (HDFS).
• Auto recuperável, grande capacidade de
armazenamento de dados em clusters.
Resiliente, redundante, otimizado para
tratamento de grandes arquivos.
Big Data
• O Hadoop possui dois principais componentes:
• Map Reduce. Processamento distribuído e
tolerante a falhas. Módulo programável para
processamento de conjuntos de dados.
Mapeia entradas para saídas e reduz a saída
de multiplos Mappers para 1 (uma ou algumas
respostas).
• Opera com dados estruturados ou não
estruturados
• Possui um extenso eco sistema de aplicações.
Big Data
Desafios para o Big Data
A integração do Big Data é multidisciplinar
• Menos de 10% do mundo Big Data é
genuinamente relacional
• Significa que a integração de dados no real,
desarrumado e complexo mundo de Big
• Data, banco de dados e web semantica
usam métodos multi-disciplinares e
multitecnologias.
Big Data
Desafios para o Big Data
Extratificação de dados abertos
• Mapeamento, Classificação, Visualização,
Correspondencia de chaves
• Demonstrar o valor da semantica: deixe a
integração de dados direcionar a correta
tecnologia de DBMS
• Grandes volumes de dados heterogêneos,
como em links de dados
Big Data
Desafios para o Big Data
• A automatização de pesquisas
altera a definição do conhecimento
• Objetividade e precisão das
informações
• Grande volume de dados não
garante dados melhores
Big Data
Desafios para o Big Data
• Nem todos os dados são
equivalentes.
• Só porque o dado é acessível não
significa que seja ético
• O acesso limitado ao Big Data cria
novas divisas digitais
Big Data
Quem está coletando o Big Data
Big Data
Qual a finalidade dos dados coletados?
Companhias de cartões de crédito vão
aprimorar seus produtos e ofertas
baseados no comportamento de consumo
das pessoas.
Big Data
Qual a finalidade dos dados coletados?
Big Data
Por que coletar estes dados?
Mercado Alvo
• Enviar catálogos exatamente com a mercadoria que
você normalmente compra.
• Sugerir
medicamentos
que
correspondem
precisamente seu histórico médico.
• Oferecer os canais de televisão específicos no seu
pacote, em vez de esperar que você solicite.
• Enviar anúncios personalizados de acordo com o
seu perfil nesses canais.
Big Data
Por que coletar estes dados?
Informação Específica
• Saber o que você precise antes de você
baseado em seus hábitos de consumo.
• Notificar você que sua habilitação está
prestes a expirar ou sobre recargas em
cartões ou celulares.
Big Data - Conclusão
• Big Data e Big Data Analytics não são
apenas para grandes empresas
• Big Data não se trata de apenas
construir bancos de dados gigantes
• Mover o processamento para a fonte
dos dados traz muitos ganhos
• Escolha o cenário de Big Data mais
apropriado
Big Data - Conclusão
• Um cenário completo de dados com
conjuntos de dados inteiros podem ser
devidamente tratados e fatorados em
processamento
analítico,
com
tecnologias de processamento de banco
de dados inmemory ou tecnologia de
grid.
Big Data - Conclusão
• Para situações em que o uso conjunto
de dados não é tecnicamente viável ou
acrescenta pouco valor, um cenário de
dados segmentados pode usar analytics
e ferramentas de gerenciamento para
determinar o dado correto a ser
alimentado em modelos analíticos.
Big Data - Conclusão
• Big data não é apenas sobre ajudar uma
organização a ser mais bem sucedida –
Mas para o mercado tornar suas
operações de negócios mais eficazes.
Big Data - Conclusão
• Analytics de alta performance foi
concebido para apoiar iniciativas de Big
Data com bancos de dados in-memory,
e opções de computação em grid.
Big Data - Conclusão
• As organizações podem se beneficiar da
computação em nuvem, onde a análise
de grandes volumes de dados são
entregues como um serviço e recursos
de TI podem ser ajustados rapidamente
para atender às demandas de negócios..
Big Data - Conclusão
• O modelo On Demand prove aos
clientes a opção de impulsionar as
analyses de big data para eliminar ou
reduzir o tempo, o capital investido e
custos com manutenção associados a
infraestruturas on-premises.
Gestão de Negócios Virtuais
• Dúvidas?
Download

Big Data - Prof. Ms. Claudio Benossi