e aprimora as operações de negócios • Reduz os custos de gerenciamento de grandes volumes de dados, ao mesmo tempo que administra o crescimento e a complexidade dos dados • Oferece benefícios relacionados a desempenho e custos, expandindo a adoção do Hadoop em seus projetos • Minimiza riscos por meio de um software de integração de dados comprovado que oculta a complexidade das tecnologias emergentes O acesso seguro a grandes volumes de dados O Informatica® PowerCenter® Big Data Edition é o acesso seguro a grandes volumes de dados que trabalham tanto com as tecnologias emergentes como com as infraestruturas de gerenciamento de dados tradicionais. Com essa solução, a área de TI pode rapidamente criar produtos e serviços, integrando e analisando novos tipos e fontes de dados. Fornece um caminho comprovado de inovação, ao mesmo tempo que reduz os custos do gerenciamento de dados e minimiza riscos. Foco na análise Big Data – não na integração Os especialistas e analistas de dados provavelmente gastam somente 20 por cento de seu tempo em análise de dados. O resto do tempo é gasto em mecanismos de integração de dados – acesso, análise, padronização, integração, preparação, entrega e gerenciamento de dados. Isso é o que o PowerCenter Big Data Edition faz de melhor, e de forma dimensionável. Não é necessária codificação especializada para dimensionar o desempenho em plataformas de computação distribuídas, como o Hadoop. Basta utilizar o mesmo PowerCenter GUI que tem sido utilizado por milhares de desenvolvedores de integração há muitos anos. A produtividade aumenta e os custos diminuem Com o PowerCenter Big Data Edition, você não precisa de um exército de programadores para obter os benefícios dos grandes volumes de dados. A produtividade sobe vertiginosamente quando a equipe de desenvolvimento utiliza o ambiente de desenvolvimento sem códigos, regras de negócios e atalhos, ferramentas de colaboração eficientes e modelos de implantação flexíveis em todos os projetos que a solução propicia. E, como os dados brutos podem ser dimensionados e o processamento ETL pode ser executado em equipamento mais barato, o PowerCenter Big Data Edition aumenta a capacidade dos investimentos em armazenamento de dados existentes. A adoção de novas tecnologias ficou mais segura Com essa edição, sua empresa pode minimizar os riscos associados a novas tecnologias. O PowerCenter Big Data Edition é um software de integração de dados comprovado que trabalha com tecnologias emergentes como o Hadoop e infraestruturas de gerenciamento de dados tradicionais. Portanto, não importa o que acontecerá em termos tecnológicos, você está seguro. D E • Coloca produtos e serviços inovadores no mercado de maneira mais rápida Todos os dias são geradas grandes quantidades de novos tipos de dados, como dados de mídia social, dados da Web, dados de sensores de máquinas e dados não estruturados. Sua empresa está manipulando grandes volumes de dados para desenvolver produtos e serviços inovadores e aprimorar as operações de negócios? À medida que os volumes de dados crescem, consomem rapidamente a capacidade de armazenamento e dos bancos de dados de aplicativos. A área de TI é forçada a fazer atualizações dispendiosas em bancos de dados caros e em dispositivos de hardware de armazenamento de dados? Projetos de Big Data estão sendo adiados devido a limitações de recursos e à percepção de risco associada com as rápidas mudanças e tecnologias emergentes, como o Hadoop? F O L H A BENEFÍCIOS O caminho comprovado para a inovação que reduz os custos do gerenciamento de dados D A D O S Informatica PowerCenter Big Data Edition Recursos principais Acesso universal aos dados Escalabilidade ilimitada A equipe de TI tem acesso a todos os tipos de dados de grandes transações, incluindo RDBMS, OLTP, OLAP, ERP, CRM, mainframe, nuvem e outros. Também fornece acesso a todos os tipos de dados de grandes interações, incluindo dados de mídia social, arquivos de registro, dados de sensores de máquina, sites na Web, blogs, documentos, e-mails e outros dados não estruturados ou com múltiplas estruturas. A área de TI pode processar todos os tipos de dados, em qualquer escala – desde terabytes até petabytes – sem codificação especializada em plataformas de computação distribuídas como o Hadoop. Alta velocidade de inclusão e extração de dados Você pode acessar, carregar, replicar, transformar e extrair grandes volumes de dados entre os sistemas fonte e destino, ou diretamente no Hadoop ou no armazenamento de dados. A conectividade de alto desempenho por meio de APIs nativos aos sistemas fonte e destino com processamento paralelo assegura inclusão e extração de dados em alta velocidade. "A plataforma unificada de grandes volumes de dados da Electronic Arts depende do acesso a dados prontos da empresa, da inclusão, integração, processamento e visualização de dados para alimentar o futuro do desenvolvimento do jogo, do marketing, das vendas e da contabilidade, além da experiência do cliente." – Tom Kornegay, diretor de Análise Internacional de Experiência do Cliente da Electronic Arts Desempenho otimizado pelo menor custo Com base nos volumes e tipos de dados, requisitos de latência e hardware disponível, o PowerCenter Big Data Edition implanta o processamento de grandes volumes de dados nas plataformas de processamento de dados com o mais alto desempenho e de forma mais econômica. Você obtém o máximo do que foi investido e da capacidade atual, independente de onde o processamento de dados foi implantado, como em máquinas SMP, clusters de grade tradicionais, plataformas de computação distribuídas como Hadoop ou ferramentas de armazenamento de dados. ETL no Hadoop Esta solução fornece uma biblioteca extensa de capacidades de transformação preconfiguradas no Hadoop, incluindo conversões de tipo de dados e manipulações de sequências, procura habilitada por cache de alto desempenho, joiners, classificadores, roteadores, agregação e muito mais. A equipe de TI pode desenvolver rapidamente os fluxos de dados no Hadoop usando um ambiente de desenvolvimento gráfico sem código que aumenta a produtividade e promove a reutilização. O PowerCenter Big Data Edition triplica a produtividade da equipe de TI saindo do código manual e indo para um ambiente de desenvolvimento visual sem código, que fornece transformações preconfiguradas e promove a reutilização. Identificação de perfil no Hadoop É possível identificar o perfil dos dados no Hadoop por meio da ferramenta de desenvolvimento da Informatica e de uma ferramenta de análise, baseada em navegador. Dessa forma, é a mais fácil para os desenvolvedores, analistas e especialistas de dados entender os dados, identificar os problemas de qualidade de dados precocemente, colaborar com as especificações de fluxo de dados e validar a transformação de mapeamento e lógica das regras. Um único projeto pode ser implantado em todos os lugares Os desenvolvedores de ETL podem focar nos dados e na lógica da transformação sem ter que se preocupar com o lugar onde o processo ETL é implantado – no Hadoop ou em plataformas de processamento de dados tradicionais. Os desenvolvedores podem fazer um projeto único, sem nenhum conhecimento especializado dos conceitos e idiomas Hadoop, e implantar facilmente os fluxos de dados no Hadoop ou nos sistemas tradicionais. Análise de dados complexos no Hadoop Esta solução faz com que seja mais fácil acessar e analisar dados complexos, com múltiplas estruturas, não estruturados, e no padrão da indústria, como registros da Web, JSON, XML e dados de dispositivo de máquina. Os analisadores preconfigurados para os dados de mercado e padrões da indústria, como FIX, SWIFT, ACORD, HL7, HIPAA e EDI, também estão disponíveis e são licenciados separadamente. Extração de entidade e classificação de dados no Hadoop Usando uma lista de palavras ou frases chave, as entidades relacionadas aos clientes e produtos podem facilmente ser extraídas e classificadas a partir de dados não estruturados, como e-mails, dados de mídia social e documentos. Os dados mestres podem ser aprimorados com o conhecimento do comportamento do cliente ou informações do produto, como preço competitivo. Fluxos de trabalho mistos A equipe de TI pode facilmente coordenar, programar, monitorar e gerenciar todos os processos e fluxos de trabalho inter-relacionados no ambiente tradicional e no Hadoop para simplificar as operações e cumprir os SLAs. Também é possível se aprofundar nas tarefas individuais do Hadoop. Alta disponibilidade Esta solução fornece alta disponibilidade, 24 horas por dia, sete dias por semana, com failover contínuo, recuperação flexível e resiliência de conexão. Quando se considera o tempo para desenvolver novos produtos e serviços usando grandes volumes de dados, é possível ter certeza de que serão dimensionáveis e estarão disponíveis 24 horas por dia, sete dias por semana, para operações essenciais. O PowerCenter Big Data Edition capacita a equipe de TI para coordenar, programar, monitorar e gerenciar facilmente todos os processos de Big Data e fluxos de trabalho inter-relacionados nos ambientes tradicionais e do Hadoop. E também pode se aprofundar nas tarefas individuais do Hadoop. Benefícios principais Colocar produtos e serviços inovadores no mercado de maneira mais rápida Com o PowerCenter Big Data Edition, os especialistas e analistas de dados podem focar em novas percepções sobre os dados – não na integração de dados – que a empresa pode usar para desenvolver produtos e serviços inovadores. Esta solução fornece um ambiente de desenvolvimento de integração de dados no qual os mapeamentos do PowerCenter existentes podem ser importados e através do qual as habilidades de recursos da Informatica podem ser reutilizadas. Propicia um ambiente de desenvolvimento visual fácil de usar e um paradigma de processo de desenvolvimento reutilizável. Estende ainda a integração de dados para os dados de mídia social, registros da Web, dados de dispositivo de sensor, documentos, e-mails e outros dados com múltiplas estruturas ou não estruturados, sem codificação manual. Como resultado, esta solução aumenta drasticamente a produtividade da equipe de TI e acelera os prazos de implantação. Custos mais baixos de projeto de Big Data O PowerCenter Big Data Edition reduz os custos de Big Data. A equipe de TI pode gerenciar um volume de dados duas vezes maior com o ambiente analítico existente. É possível descarregar dados a partir dos sistemas de armazenamento e fonte e processar esse descarregamento para um equipamento de baixo custo. Ao sair da codificação manual, com as comprovadas ferramentas de produtividade de integração de dados, a produtividade é triplicada – sem a necessidade de um exército de programadores. Esta solução fornece administração unificada para todos os projetos de integração de dados. Você pode desenvolver o projeto uma única vez e implantá-lo em todos os lugares, o que mantém os custos baixos, otimizando a utilização do processamento de dados tanto nas plataformas de dados existentes como nas tecnologias emergentes, como o Hadoop. SOBRE A INFORMATICA A Informatica Corporation (NASDAQ: INFA) é a fornecedora independente líder mundial de software de integração de dados. Milhares de organizações ao redor do mundo contam com a Informatica para maximizar o retorno sobre seus dados e impulsionar seus principais imperativos de negócios. Em todo o mundo, mais de 5.000 empresas usam a tecnologia da Informatica para potencializar seus ativos de informação hospedados na empresa, em nuvem e nas redes sociais. Expandir a adoção do Hadoop em toda a empresa O PowerCenter Big Data Edition permite a adoção mais ampla do Hadoop em múltiplos projetos. Não é preciso usar um código no Java MapReduce para obter o desempenho e os benefícios de custos do Hadoop – você pode prontamente empregar mais de 100 mil desenvolvedores treinados pela Informatica em todo o mundo para trabalhar em projetos com grandes volumes de dados. Esta solução é mais fácil de administrar e suporta múltiplos projetos de Big Data. Assegura desempenho de ponta a ponta e implantação em níveis excelentes. A área de TI pode operar no Hadoop ou nos ambientes de computação tradicionais. Minimizar o risco envolvido na adoção de novas tecnologias O PowerCenter Big Data Edition minimiza os riscos associados às mais recentes tecnologias, como o Hadoop. A área de TI pode fazer um investimento que funciona tanto com as tecnologias emergentes quanto com as infraestruturas de dados tradicionais. Esta solução do PowerCenter se baseia no mesmo software de integração de dados comprovado da Informatica usado por milhares de clientes em todo o mundo. Fornece uma abordagem de integração de dados única e consistente para todos os tipos de dados. Ao identificar os perfis de dados desde sua origem para descobrir os problemas de qualidade de dados e validar os grandes volumes de dados, o risco do projeto diminui, ao mesmo tempo que aumenta a confiança na análise dos grandes volumes de dados que a equipe gera. SEDE AMÉRICA LATINA, CENTRO EMPRESARIAL NAÇÕES UNIDAS - TORRE NORTE AV. DAS NAÇÕES UNIDAS, 12.901 - 3º ANDAR 04578-000 - SÃO PAULO, SP – BRASIL SEDE MUNDIAL, 100 CARDINAL WAY, REDWOOD CITY, CA 94063, USA TEL.: 650-385-5000 FAX: 650-385-5500 LIGAÇÃO GRATUITA NOS EUA: 1.800.653.3871 WWW.INFORMATICA.COM CENTRAL DE ATENDIMENTO: [email protected] ARGENTINA > 54 11 5239 1403 BRASIL > 55 11 3013 5446 CHILE > 56 2 570 8670 COLÔMBIA > 57 1 381 9303 MÉXICO > 52 55 1163 8709 PORTO RICO > 1 787 905 7236 REP. DOMINICANA > 1 829 607 2099 VENEZUELA > 58 212 335 7541 Filiais da Informatica no Mundo: Austrália • Bélgica • Canadá • China • França • Alemanha • Japão • Coreia • Holanda • Cingapura • Suíça • Reino Unido • EUA © 2011 Informatica Corporation. Todos os direitos reservados. Impresso nos EUA. Informatica, o logotipo da Informatica e The Data Integration Company são marcas registradas da Informatica Corporation nos Estados Unidos e em jurisdições por todo o mundo. Todos os outros nomes de empresas e produtos podem ser marcas registradas de seus respectivos proprietários. Primeira edição: Agosto de 2011 IN06_1012_02194