Big Data Priscila de Paiva Castro [email protected] Big Data é um termo utilizado para descrever grandes volumes de dados, com enorme velocidade, e que ganha cada vez mais relevância à medida que a sociedade se depara com um aumento sem precedentes no número de informações geradas a cada dia. O Big Data é baseado no conceito de 5Vs: Valor, Veracidade, Variedade, Volume e Velocidade. As dificuldades em armazenar, analisar e utilizar grandes conjuntos de dados tem sido um considerável gargalo para as companhias. A proposta de uma solução de Big Data é a de oferecer uma abordagem ampla no tratamento do aspecto cada vez mais "caótico" dos dados para tornar as referidas aplicações e todas as outras mais eficientes e precisas. Para tanto, o conceito considera não somente grandes quantidades de dados, a velocidade de análise e a disponibilização destes, como também a relação com e entre os volumes. Como funciona Big Data é o conjunto de soluções tecnológicas capaz de lidar com dados digitais em volume, variedade e velocidade inéditos até hoje. Na prática, a tecnologia permite analisar qualquer tipo de informação digital em tempo real, sendo fundamental para a tomada de decisões.E as fontes de dados são as mais diversas possíveis: de textos e fotos em rede sociais, passando por imagens e vídeos, até jogadas específicas no esporte e até tratamentos na medicina. Áreas em que o Big Data é utilizado estrategicamente: Mapear e entender os consumidores; Entender e otimizar os processos do negócio; Qualificação pessoal e otimização de desempenho; Melhorar a saúde pública; Melhorar o desempenho de atletas; Revolução científica; Melhorar o desempenho de máquinas e dispositivos; Melhorias na segurança; Melhorias na infraestrutura de cidades e países; Mercado financeiro. Tecnologias sem custo O Hadoop é uma plataforma Open Source, que roda em cima do servidor Apache em distribuições Linux. O Hadoop é o nome do núcleo principal de uma plataforma pra trabalhar com Big Data, este núcleo pode ser executado em um servidor de internet chamado Apache, que é responsável por executar e controlar o ambiente que o Hadoop está trabalhando. O Hadoop sozinho não faz muita coisa, ele precisa de APIs (Application Programming Interface), programas que interagem através de troca de informação com o núcleo principal, satélites que ajudam nas principais tarefas de uma plataforma. Existem APIs que se encarregam de fazer o trabalho para movimentar dados entre uma base de dados que você possui e o Hadoop. Plataformas Prontas para trabalhar com Big Data Hoje, grandes provedores de serviços na Internet oferecem plataformas prontas para se trabalhar com Big Data utilizando seus serviços. A Amazon possui uma plataforma que é comercializada através do Amazon Web Services; a Microsoft possui sua plataforma que se chama Windows Azure; e o Google tem o Google Big Query; Com a Oracle Exadata Database Machine e a Oracle Exalytics Business Intelligence Machine, o Oracle Big Data Appliance, oferecem a plataforma mais abrangente para atender a todos os requisitos das análises do Big Data. Cada fornecedor possui suas peculiaridades, e também variam de preço e recursos. Referencias: http://exame.abril.com.br/pme/noticias/o-que-e-big-data-e-como-usar-na-sua-pequenaempresa http://corporate.canaltech.com.br/materia/big-data/Como-o-Big-Data-vem-sendo-utilizadopara-melhorar-nossas-vidas-e-mudar-o-mundo/ http://www.ibm.com/midmarket/br/pt/infografico_bigdata.html http://www.infoescola.com/informatica/big-data/ http://oglobo.globo.com/infograficos/bigdata/ http://olhardigital.uol.com.br/pro/video/39376/39376 http://www.oracle.com/br/c-central/cio-solutions/information-matters/big-data-bigopportunity/index.html