Big Data
Priscila de Paiva Castro
priscila@ibict.br
Big Data é um termo utilizado para descrever grandes volumes de dados, com
enorme velocidade, e que ganha cada vez mais relevância à medida que a sociedade
se depara com um aumento sem precedentes no número de informações geradas a
cada dia. O Big Data é baseado no conceito de 5Vs: Valor, Veracidade, Variedade,
Volume e Velocidade.
As dificuldades em armazenar, analisar e utilizar grandes conjuntos de dados tem
sido um considerável gargalo para as companhias.
A proposta de uma solução de Big Data é a de oferecer uma abordagem ampla no
tratamento do aspecto cada vez mais "caótico" dos dados para tornar as referidas
aplicações e todas as outras mais eficientes e precisas. Para tanto, o conceito
considera não somente grandes quantidades de dados, a velocidade de análise e a
disponibilização destes, como também a relação com e entre os volumes.
Como funciona
Big Data é o conjunto de soluções tecnológicas capaz de lidar com dados digitais em
volume, variedade e velocidade inéditos até hoje. Na prática, a tecnologia permite
analisar qualquer tipo de informação digital em tempo real, sendo fundamental para
a tomada de decisões.E as fontes de dados são as mais diversas possíveis: de textos e
fotos em rede sociais, passando por imagens e vídeos, até jogadas específicas no
esporte e até tratamentos na medicina.
Áreas em que o Big Data é utilizado estrategicamente:

Mapear e entender os consumidores;

Entender e otimizar os processos do negócio;

Qualificação pessoal e otimização de desempenho;

Melhorar a saúde pública;

Melhorar o desempenho de atletas;

Revolução científica;

Melhorar o desempenho de máquinas e dispositivos;

Melhorias na segurança;

Melhorias na infraestrutura de cidades e países;

Mercado financeiro.
Tecnologias sem custo
O Hadoop é uma plataforma Open Source, que roda em cima do servidor Apache em
distribuições Linux. O Hadoop é o nome do núcleo principal de uma plataforma pra trabalhar
com Big Data, este núcleo pode ser executado em um servidor de internet chamado Apache,
que é responsável por executar e controlar o ambiente que o Hadoop está trabalhando.
O Hadoop sozinho não faz muita coisa, ele precisa de APIs (Application Programming
Interface), programas que interagem através de troca de informação com o núcleo principal,
satélites que ajudam nas principais tarefas de uma plataforma. Existem APIs que se
encarregam de fazer o trabalho para movimentar dados entre uma base de dados que você
possui e o Hadoop.
Plataformas Prontas para trabalhar com Big Data
Hoje, grandes provedores de serviços na Internet oferecem plataformas prontas para se
trabalhar com Big Data utilizando seus serviços. A Amazon possui uma plataforma que é
comercializada através do Amazon Web Services; a Microsoft possui sua plataforma que se
chama Windows Azure; e o Google tem o Google Big Query; Com a Oracle Exadata Database
Machine e a Oracle Exalytics Business Intelligence Machine, o Oracle Big Data Appliance,
oferecem a plataforma mais abrangente para atender a todos os requisitos das análises do
Big Data. Cada fornecedor possui suas peculiaridades, e também variam de preço e recursos.
Referencias:
http://exame.abril.com.br/pme/noticias/o-que-e-big-data-e-como-usar-na-sua-pequenaempresa
http://corporate.canaltech.com.br/materia/big-data/Como-o-Big-Data-vem-sendo-utilizadopara-melhorar-nossas-vidas-e-mudar-o-mundo/
http://www.ibm.com/midmarket/br/pt/infografico_bigdata.html
http://www.infoescola.com/informatica/big-data/
http://oglobo.globo.com/infograficos/bigdata/
http://olhardigital.uol.com.br/pro/video/39376/39376
http://www.oracle.com/br/c-central/cio-solutions/information-matters/big-data-bigopportunity/index.html
Download

Big Data