e aprimora as operações
de negócios
• Reduz os custos de
gerenciamento de grandes
volumes de dados,
ao mesmo tempo que
administra o crescimento e a
complexidade dos dados
• Oferece benefícios
relacionados a desempenho e
custos, expandindo a adoção
do Hadoop em seus projetos
• Minimiza riscos por meio de
um software de integração
de dados comprovado que
oculta a complexidade das
tecnologias emergentes
O acesso seguro a grandes volumes de dados
O Informatica® PowerCenter® Big Data Edition é o acesso seguro a grandes volumes de
dados que trabalham tanto com as tecnologias emergentes como com as infraestruturas de
gerenciamento de dados tradicionais. Com essa solução, a área de TI pode rapidamente
criar produtos e serviços, integrando e analisando novos tipos e fontes de dados.
Fornece um caminho comprovado de inovação, ao mesmo tempo que reduz os custos do
gerenciamento de dados e minimiza riscos.
Foco na análise Big Data – não na integração
Os especialistas e analistas de dados provavelmente gastam somente 20 por cento de seu
tempo em análise de dados. O resto do tempo é gasto em mecanismos de integração de
dados – acesso, análise, padronização, integração, preparação, entrega e gerenciamento
de dados.
Isso é o que o PowerCenter Big Data Edition faz de melhor, e de forma dimensionável. Não
é necessária codificação especializada para dimensionar o desempenho em plataformas de
computação distribuídas, como o Hadoop. Basta utilizar o mesmo PowerCenter GUI que tem
sido utilizado por milhares de desenvolvedores de integração há muitos anos.
A produtividade aumenta e os custos diminuem
Com o PowerCenter Big Data Edition, você não precisa de um exército de programadores
para obter os benefícios dos grandes volumes de dados. A produtividade sobe
vertiginosamente quando a equipe de desenvolvimento utiliza o ambiente de
desenvolvimento sem códigos, regras de negócios e atalhos, ferramentas de colaboração
eficientes e modelos de implantação flexíveis em todos os projetos que a solução propicia.
E, como os dados brutos podem ser dimensionados e o processamento ETL pode ser
executado em equipamento mais barato, o PowerCenter Big Data Edition aumenta a
capacidade dos investimentos em armazenamento de dados existentes.
A adoção de novas tecnologias ficou mais segura
Com essa edição, sua empresa pode minimizar os riscos associados a novas tecnologias.
O PowerCenter Big Data Edition é um software de integração de dados comprovado que
trabalha com tecnologias emergentes como o Hadoop e infraestruturas de gerenciamento
de dados tradicionais. Portanto, não importa o que acontecerá em termos tecnológicos,
você está seguro.
D E
• Coloca produtos e serviços
inovadores no mercado
de maneira mais rápida
Todos os dias são geradas grandes quantidades de novos tipos de dados, como dados de
mídia social, dados da Web, dados de sensores de máquinas e dados não estruturados.
Sua empresa está manipulando grandes volumes de dados para desenvolver produtos e
serviços inovadores e aprimorar as operações de negócios?
À medida que os volumes de dados crescem, consomem rapidamente a capacidade de
armazenamento e dos bancos de dados de aplicativos. A área de TI é forçada a fazer
atualizações dispendiosas em bancos de dados caros e em dispositivos de hardware de
armazenamento de dados?
Projetos de Big Data estão sendo adiados devido a limitações de recursos e à percepção
de risco associada com as rápidas mudanças e tecnologias emergentes, como o Hadoop?
F O L H A
BENEFÍCIOS
O caminho comprovado para a inovação que reduz
os custos do gerenciamento de dados
D A D O S
Informatica PowerCenter Big Data
Edition
Recursos principais
Acesso universal aos dados
Escalabilidade ilimitada
A equipe de TI tem acesso a todos os tipos de dados
de grandes transações, incluindo RDBMS, OLTP, OLAP,
ERP, CRM, mainframe, nuvem e outros. Também fornece
acesso a todos os tipos de dados de grandes interações,
incluindo dados de mídia social, arquivos de registro,
dados de sensores de máquina, sites na Web, blogs,
documentos, e-mails e outros dados não estruturados ou
com múltiplas estruturas.
A área de TI pode processar todos os tipos de dados,
em qualquer escala – desde terabytes até petabytes
– sem codificação especializada em plataformas de
computação distribuídas como o Hadoop.
Alta velocidade de inclusão e extração
de dados
Você pode acessar, carregar, replicar, transformar e
extrair grandes volumes de dados entre os sistemas
fonte e destino, ou diretamente no Hadoop ou no
armazenamento de dados. A conectividade de alto
desempenho por meio de APIs nativos aos sistemas
fonte e destino com processamento paralelo assegura
inclusão e extração de dados em alta velocidade.
"A plataforma unificada de grandes volumes de dados
da Electronic Arts depende do acesso a dados prontos
da empresa, da inclusão, integração, processamento
e visualização de dados para alimentar o futuro do
desenvolvimento do jogo, do marketing, das vendas e da
contabilidade, além da experiência do cliente."
– Tom Kornegay, diretor de Análise Internacional de Experiência do
Cliente da Electronic Arts
Desempenho otimizado pelo menor custo
Com base nos volumes e tipos de dados, requisitos
de latência e hardware disponível, o PowerCenter Big
Data Edition implanta o processamento de grandes
volumes de dados nas plataformas de processamento
de dados com o mais alto desempenho e de forma
mais econômica. Você obtém o máximo do que foi
investido e da capacidade atual, independente de
onde o processamento de dados foi implantado, como
em máquinas SMP, clusters de grade tradicionais,
plataformas de computação distribuídas como Hadoop
ou ferramentas de armazenamento de dados.
ETL no Hadoop
Esta solução fornece uma biblioteca extensa de
capacidades de transformação preconfiguradas no
Hadoop, incluindo conversões de tipo de dados e
manipulações de sequências, procura habilitada por
cache de alto desempenho, joiners, classificadores,
roteadores, agregação e muito mais. A equipe de TI
pode desenvolver rapidamente os fluxos de dados
no Hadoop usando um ambiente de desenvolvimento
gráfico sem código que aumenta a produtividade e
promove a reutilização.
O PowerCenter Big Data Edition triplica a produtividade da equipe de TI saindo do código manual e indo
para um ambiente de desenvolvimento visual sem código, que fornece transformações preconfiguradas e
promove a reutilização.
Identificação de perfil no Hadoop
É possível identificar o perfil dos dados no Hadoop
por meio da ferramenta de desenvolvimento da
Informatica e de uma ferramenta de análise, baseada
em navegador. Dessa forma, é a mais fácil para
os desenvolvedores, analistas e especialistas de
dados entender os dados, identificar os problemas
de qualidade de dados precocemente, colaborar
com as especificações de fluxo de dados e validar a
transformação de mapeamento e lógica das regras.
Um único projeto pode ser implantado em
todos os lugares
Os desenvolvedores de ETL podem focar nos dados e na
lógica da transformação sem ter que se preocupar com o
lugar onde o processo ETL é implantado – no Hadoop ou
em plataformas de processamento de dados tradicionais.
Os desenvolvedores podem fazer um projeto único, sem
nenhum conhecimento especializado dos conceitos e
idiomas Hadoop, e implantar facilmente os fluxos de
dados no Hadoop ou nos sistemas tradicionais.
Análise de dados complexos no Hadoop
Esta solução faz com que seja mais fácil acessar e
analisar dados complexos, com múltiplas estruturas, não
estruturados, e no padrão da indústria, como registros
da Web, JSON, XML e dados de dispositivo de máquina.
Os analisadores preconfigurados para os dados de
mercado e padrões da indústria, como FIX, SWIFT,
ACORD, HL7, HIPAA e EDI, também estão disponíveis e
são licenciados separadamente.
Extração de entidade e classificação de
dados no Hadoop
Usando uma lista de palavras ou frases chave, as
entidades relacionadas aos clientes e produtos podem
facilmente ser extraídas e classificadas a partir de dados
não estruturados, como e-mails, dados de mídia social e
documentos. Os dados mestres podem ser aprimorados
com o conhecimento do comportamento do cliente ou
informações do produto, como preço competitivo.
Fluxos de trabalho mistos
A equipe de TI pode facilmente coordenar, programar,
monitorar e gerenciar todos os processos e fluxos de
trabalho inter-relacionados no ambiente tradicional e no
Hadoop para simplificar as operações e cumprir os SLAs.
Também é possível se aprofundar nas tarefas individuais
do Hadoop.
Alta disponibilidade
Esta solução fornece alta disponibilidade, 24 horas
por dia, sete dias por semana, com failover contínuo,
recuperação flexível e resiliência de conexão. Quando
se considera o tempo para desenvolver novos produtos
e serviços usando grandes volumes de dados, é possível
ter certeza de que serão dimensionáveis e estarão
disponíveis 24 horas por dia, sete dias por semana, para
operações essenciais.
O PowerCenter Big Data Edition capacita a equipe de TI para coordenar, programar, monitorar e gerenciar
facilmente todos os processos de Big Data e fluxos de trabalho inter-relacionados nos ambientes tradicionais
e do Hadoop. E também pode se aprofundar nas tarefas individuais do Hadoop.
Benefícios principais
Colocar produtos e serviços inovadores no mercado de maneira mais rápida
Com o PowerCenter Big Data Edition, os especialistas e analistas de dados podem focar
em novas percepções sobre os dados – não na integração de dados – que a empresa
pode usar para desenvolver produtos e serviços inovadores. Esta solução fornece um
ambiente de desenvolvimento de integração de dados no qual os mapeamentos do
PowerCenter existentes podem ser importados e através do qual as habilidades de
recursos da Informatica podem ser reutilizadas. Propicia um ambiente de desenvolvimento
visual fácil de usar e um paradigma de processo de desenvolvimento reutilizável. Estende
ainda a integração de dados para os dados de mídia social, registros da Web, dados de
dispositivo de sensor, documentos, e-mails e outros dados com múltiplas estruturas ou não
estruturados, sem codificação manual. Como resultado, esta solução aumenta drasticamente
a produtividade da equipe de TI e acelera os prazos de implantação.
Custos mais baixos de projeto de Big Data
O PowerCenter Big Data Edition reduz os custos de Big Data. A equipe de TI pode gerenciar
um volume de dados duas vezes maior com o ambiente analítico existente. É possível
descarregar dados a partir dos sistemas de armazenamento e fonte e processar esse
descarregamento para um equipamento de baixo custo. Ao sair da codificação manual, com
as comprovadas ferramentas de produtividade de integração de dados, a produtividade
é triplicada – sem a necessidade de um exército de programadores. Esta solução fornece
administração unificada para todos os projetos de integração de dados. Você pode
desenvolver o projeto uma única vez e implantá-lo em todos os lugares, o que mantém os
custos baixos, otimizando a utilização do processamento de dados tanto nas plataformas de
dados existentes como nas tecnologias emergentes, como o Hadoop.
SOBRE A INFORMATICA
A Informatica Corporation
(NASDAQ: INFA) é a fornecedora
independente líder mundial de
software de integração de dados.
Milhares de organizações ao
redor do mundo contam com
a Informatica para maximizar
o retorno sobre seus dados
e impulsionar seus principais
imperativos de negócios. Em
todo o mundo, mais de 5.000
empresas usam a tecnologia da
Informatica para potencializar
seus ativos de informação
hospedados na empresa, em
nuvem e nas redes sociais.
Expandir a adoção do Hadoop em toda a empresa
O PowerCenter Big Data Edition permite a adoção mais ampla do Hadoop em múltiplos
projetos. Não é preciso usar um código no Java MapReduce para obter o desempenho e
os benefícios de custos do Hadoop – você pode prontamente empregar mais de 100 mil
desenvolvedores treinados pela Informatica em todo o mundo para trabalhar em projetos
com grandes volumes de dados. Esta solução é mais fácil de administrar e suporta
múltiplos projetos de Big Data. Assegura desempenho de ponta a ponta e implantação
em níveis excelentes. A área de TI pode operar no Hadoop ou nos ambientes de
computação tradicionais.
Minimizar o risco envolvido na adoção de novas tecnologias
O PowerCenter Big Data Edition minimiza os riscos associados às mais recentes tecnologias,
como o Hadoop. A área de TI pode fazer um investimento que funciona tanto com as
tecnologias emergentes quanto com as infraestruturas de dados tradicionais. Esta solução
do PowerCenter se baseia no mesmo software de integração de dados comprovado da
Informatica usado por milhares de clientes em todo o mundo. Fornece uma abordagem de
integração de dados única e consistente para todos os tipos de dados. Ao identificar os
perfis de dados desde sua origem para descobrir os problemas de qualidade de dados
e validar os grandes volumes de dados, o risco do projeto diminui, ao mesmo tempo que
aumenta a confiança na análise dos grandes volumes de dados que a equipe gera.
SEDE AMÉRICA LATINA, CENTRO EMPRESARIAL NAÇÕES UNIDAS - TORRE NORTE
AV. DAS NAÇÕES UNIDAS, 12.901 - 3º ANDAR
04578-000 - SÃO PAULO, SP – BRASIL
SEDE MUNDIAL, 100 CARDINAL WAY, REDWOOD CITY, CA 94063, USA
TEL.: 650-385-5000 FAX: 650-385-5500
LIGAÇÃO GRATUITA NOS EUA: 1.800.653.3871 WWW.INFORMATICA.COM
CENTRAL DE ATENDIMENTO:
[email protected]
ARGENTINA > 54 11 5239 1403
BRASIL > 55 11 3013 5446
CHILE > 56 2 570 8670
COLÔMBIA > 57 1 381 9303
MÉXICO > 52 55 1163 8709
PORTO RICO > 1 787 905 7236
REP. DOMINICANA > 1 829 607 2099
VENEZUELA > 58 212 335 7541
Filiais da Informatica no Mundo: Austrália • Bélgica • Canadá • China • França • Alemanha • Japão • Coreia • Holanda • Cingapura • Suíça • Reino Unido • EUA
© 2011 Informatica Corporation. Todos os direitos reservados. Impresso nos EUA. Informatica, o logotipo da Informatica e The Data Integration Company são marcas registradas da Informatica Corporation nos Estados Unidos
e em jurisdições por todo o mundo. Todos os outros nomes de empresas e produtos podem ser marcas registradas de seus respectivos proprietários. Primeira edição: Agosto de 2011
IN06_1012_02194
Download

Informatica PowerCenter Big Data Edition