edições do big data management da informatica...edados de dispositivos de máquina. os...
TRANSCRIPT
Edições do Big Data Management da Informatica
Benefícios• Lance produtos e serviços
inovadores no mercado com mais rapidez e melhore suas operações
• Reduza os custos de gerenciamento de Big Data enquanto lida com os volumes e a complexidade crescentes dos dados
• Viabilize os benefícios relacionados a desempenho e custos, expandindo a adoção do Hadoop entre os projetos
• Minimize os riscos, investindo em um software de integração de ados comprovado, que oculte a complexidade de tecnologias emergentes e proteja os dados confidenciais
Transforme petabytes em lucrosÀ medida que o ritmo dos negócios aumenta e as organizações enfrentam uma pressão massacrante
da concorrência para transformar seus negócios, surge uma oportunidade de modernizar e otimizar
as arquiteturas de dados para permitir que os dados se transformem em um ativo estratégico
no processo decisório das empresas.
As organizações usam os dados para se destacar e crescer com insights exclusivos, que podem
levar ao aumento dos lucros, acelerar a inovação de seus produtos e serviços e oferecer experiências
incríveis aos clientes. Ao mesmo tempo, os dados também podem aumentar as eficiências
operacionais enquanto mitigam os riscos de fraudes, crimes, inatividade do sistema ou violações
de segurança.
O Big Data Management da Informatica é a primeira e mais completa solução de gerenciamento
de dados arquitetada para incluir, processar, limpar, governar e proteger Big Data em escala. A solução
da Informatica reúne a integração, a qualidade e a governança, e a segurança de Big Data em uma
solução integrada e única.
Integração dinâmica e otimizada de Big Data
O gerenciamento de Big Data da Informatica fornece inclusão de dados de alto rendimento
e processamento de dados em larga escala para que analistas de negócios possam tomar decisões
melhores com a ajuda de ferramentas de análises de última geração. Centenas de conectores
de alto desempenho, transformações de integração de dados e analisadores predefinidos permitem
que praticamente quaisquer tipos de dados sejam rapidamente incluídos e processados
em plataformas de Big Data, como Hadoop, NoSQL e appliances MPP. Mapeamentos dinâmicos
e parametrização permitem a automação programática de processos de integração de dados.
A produtividade e a facilidade de manutenção são dramaticamente aprimoradas ao se gerar
automaticamente classes inteiras de fluxos de dados com base em padrões de projeto, utilizando
apenas alguns poucos modelos. O suporte de esquemas dinâmicos permitem o processamento
de formatos de dados flexíveis. Mecanismos otimizados asseguram desempenho máximo
e utilização de recursos para uma integração de dados em escala. A Informatica otimiza, por
exemplo, cargas de trabalho de Big Data usando uma combinação do MapReduce e um novo
mecanismo do Informatica Blaze, através do YARN.
1
Resumo executivo
Governança e qualidade de Big Data de ponta a ponta
Governança e qualidade de Big Data de ponta a ponta significam que usuários de negócios
e de TI podem ter confiança nos dados que estão usando. O Big Data Management da Informatica
fornece uma experiência de usuário intuitiva e não técnica para permitir uma colaboração
mais eficiente entre as áreas de negócios e especialistas e analistas de dados. A identificação
e a descoberta do perfil de dados, incluindo a identificação de perfis de regras de negócios,
destacam as questões e anomalias referentes à qualidade dos dados, enquanto pode-se facilmente
criar regras e alertas de monitoramento para rastrear e detectar problemas de qualidade.
As regras de qualidade de dados e a validação de endereços podem ser implantadas no Hadoop
para limpar e preparar dados em escala, a fim de adequá-las aos devidos fins. O Live Data Map,
um catálogo universal de metadados e um gráfico de conhecimento, permite pesquisar, descobrir
e entender os dados corporativos, utilizando o Spark para uma criação de conhecimento em escala
gráfica e rápida. A linhagem de dados de ponta a ponta além do Hadoop inclui suporte para
conformidade e permite uma análise de causa raiz eficaz da qualidade de dados e análises de impacto.
Segurança de Big Data centrada em riscos
A segurança de Big Data centrada em riscos analisa todos os dados para detectar e agir rapidamente
caso sejam identificados riscos e vulnerabilidades em pontos críticos. Isso exige uma visão de
360 graus dos dados confidenciais que tenha o suporte de análises de riscos e proteção proporcionada
por políticas de segurança. A segurança de Big Data atua então no sentido de remover a identificação
das informações controladas por políticas corporativas e regulamentações da indústria. O Big Data
Management da Informatica oferece mascaramento de dados persistente e não intrusivo como
uma operação para proteger dados confidenciais em ambientes de desenvolvimento e produção
do Hadoop, ajudando a minimizar o risco de uma violação de segurança.
"O foco no cliente está no cerne de tudo o que fazemos e a Western Union
tem uma oportunidade única de maximizar todo o poder da análise
de dados para identificar tendências que podem ajudar nossos negócios
e aprimorar as experiências dos nossos clientes, nos levando rumo
ao sucesso. Gostaríamos de reforçar nossa parceria com a Informatica,
já que sua contribuição tem sido fundamental para revelar o verdadeiro
potencial da escala global de nossa empresa e da nossa base de clientes."
— Sanjay Saraf, vice-presidente sênior e CTO, Western Union
Edições do Big Data Management da Informatica 2
Principais recursosIntegração de dados (ETL) no Hadoop
Esta solução fornece uma extensa biblioteca de recursos de transformação de integração de dados
predefinidos que são executados de forma nativa, para que você possa processar todos os tipos
de dados em qualquer escala – desde terabytes até petabytes. Sua equipe de TI pode desenvolver
rapidamente fluxos de dados no Hadoop usando um ambiente de desenvolvimento visual que
aumenta a produtividade em relação à codificação manual em até cinco vezes.
Esquemas dinâmicos e modelosde mapeamento
O Big Data Management da Informatica permite gerenciar centenas de fluxos de dados nos tempos
de execução, com base em poucos projetos que utilizam modelos de mapeamento. Esses
mapeamentos podem ser facilmente parametrizados para lidar com esquemas dinâmicos, como
arquivos de log da Web e de máquinas, muito comuns em projetos de Big Data. Isto significa que,
para esquemas que sofrem constantes mudanças, você pode criar facilmente fluxos de dados que
são simples de manter e maleáveis.
Identificação de perfil de dados no Hadoop
É possível identificar o perfil dos dados no Hadoop por meio da ferramenta de desenvolvedor
da Informatica e de uma ferramenta de analista baseada no navegador. Por conta disso,
desenvolvedores, analistas e especialistas em dados conseguem facilmente entender os dados,
identificar rapidamente os problemas de qualidade de dados, colaborar com as especificações
de fluxo de dados e validar a transformação de mapeamento e a lógica das regras.
O Big Data Management da Informatica pode aumentar em até cinco vezes a produtividade em relação à codificação manual, usando um ambiente de desenvolvimento visual que fornece transformações predefinidas e promove a reutilização.
Edições do Big Data Management da Informatica 3
Qualidade de dados no Hadoop
Limpe, combine e padronize qualquer tipo e volume de dados de forma nativa no Hadoop para
fornecer dados oficiais e confiáveis. Use um extenso conjunto de regras de qualidade dedados
predefinidas ou crie o seu próprio usando o ambiente de desenvolvimento visual. Execute avalidação
de endereço para analisar, limpar, padronizar e aprimorar dados de endereço globais.
Análise de dados complexos no Hadoop
O Big Data Management da Informatica facilita o acesso e a análise de dados complexos,
multiestruturados, não estruturados e padrões da indústria, como logs da Web, JSON, XML
edados de dispositivos de máquina. Os analisadores predefinidos para os dados de mercado
epadrões da indústria, como SWIFT, ACORD, HL7, HIPAA e EDI, também estão disponíveis.
Catálogo de metadados universal
Especialistas e analistas de dados agora têm uma visão de 360 graus dos seus dados com o Live
Data Map, um catálogo de metadados universal e um gráfico de conhecimento para pesquisar,
descobrir e entender dados corporativos. O Live Data Map utiliza o Spark para a criação em escala
e rápida de gráficos de conhecimento.
Linhagem de dados de ponta a ponta
Para garantir a confiabilidade e a adequação a regulamentações, analistas de dados e usuários
de negócios podem visualizar a linhagem completa dos dados de ponta a ponta. Essa linhagem
de dados visual inclui um histórico detalhado de todo o movimento e as transformações dedados
(no Hadoop e em sistemas tradicionais), desde aplicativos de destino até os sistemas de origem
nativos. A colaboração e a pesquisa das áreas de negócios e TI são aprimoradas com um glossário
de termos de negócios comuns, que relacionam objetos de dados e a linhagem dedados
correspondente.
Mascaramento de dados persistente no Hadoop
A opção de mascaramento de dados persistente aumenta a segurança e a privacidade dos dados
graças à remoção da identidade e da sensibilidade dos dados confidenciais. Os dados obscuros
mantêm o contexto e sua integridade referencial permanece uniforme, para que os dados
mascarados possam ser usados em ambientes de testes, análise ou suporte.
Acesso de dados universal
A equipe de TI tem acesso a todos os tipos de transações de Big Data, incluindo RDBMS, OLTP,
OLAP, ERP, CRM, mainframe, nuvem e outros. Você também pode acessar dados de mídias sociais,
arquivos de registro, dados de sensor de máquinas, Hadoop, formatos NoSQL, documentos, e-mails
e outros tipos de dados ou armazenamentos de dados não estruturados ou multiestruturados.
Edições do Big Data Management da Informatica 4
Inclusão e extração de dados em alta velocidade
Você pode acessar, carregar, transformar e extrair Big Data entre sistemas de origem e de destino
ou diretamente no Hadoop, nos armazenamentos de dados NoSQL ou no seu data warehouse.
Aconectividade de alto desempenho através de APIs nativas para os sistemas de origem e destino
com processamento paralelo assegura a inclusão e a extração de dados em alta velocidade.
Descoberta de dados no Hadoop
Automatize a descoberta de domínios e relacionamentos de dados no Hadoop. Descubra, por
exemplo, conjuntos de dados ou dados confidenciais relacionados a clientes ou produtos, como
números da previdência social e de cartões de crédito, para que você possa mascarar os dados
para fins de conformidade.
Processamento de linguagem natural no Hadoop
Use uma lista de palavras-chave ou frases para extrair e classificar facilmente entidades
relacionadas aos seus clientes e produtos a partir de dados não estruturados, como e-mails,
dados de mídias sociais, sinistros de seguro, registros de serviços e documentos, usando análise
de texto e reconhecimento de entidade nomeada. Os dados mestres podem ser aprimorados
com dados úteis sobre o comportamento do cliente ou informações do produto, como preços
competitivos.
Projete uma única vez e implante com mais rapidez
O ecossistema do Hadoop está se modificando rapidamente com inovações que continuam
surgindo nas comunidades de código aberto. O gerenciamento de Big Data evolui na estrutura
de código aberto do Hadoop e preserva toda a lógica de transformação em seus pipelines de
dados. Isto significa que os desenvolvedores podem projetar uma única vez, sem o conhecimento
especializado de conceitos e linguagens do Hadoop, e implantar facilmente pipelines de dados
sem precisar recriar cada vez que o Hadoop for modificado. Consequentemente, as inovações
do Hadoop são implementadas rapidamente, com menos impactos e riscos para os sistemas
de produção.
Edições do Big Data Management da Informatica 5
Compare estas edições do Informatica Big Data Management para escolher a melhor opção para você.
Enterprise Advanced
Conectividade para bancos de dados, Hadoop, mídias sociais e aplicativos
● ●
Inclusão de dados em alta velocidade ● ●
Integração de dados no Hadoop ● ●
Otimização de redução de banco de dados ● ●
Identificação de perfil de dados e descoberta de domínio no Hadoop
● ●
Análise de dados complexa ● ●
Análise de texto - Reconhecedor de entidade nomeada (NER, Named Entity Recognizer)
● ●
Esquemas dinâmicos e modelos de mapeamento ● ●
Catálogo universal de metadados ● ●
Linhagem de dados de ponta a ponta ● ●
Qualidade de dados no Hadoop ●
Validação de endereços no Hadoop ●
Glossário de negóciosLimitado
ao ambiente de Big Data
100 usuários nomeados analistas de dados da Informatica
● ●
Suporte (incluso apenas com licença de assinatura)8 horas por dia,
cinco dias por semana
24 horas por dia, sete dias
por semana
Edições do Big Data Management da Informatica 6
IN06_1012_02194Sede mundial, 2100 Seaport Blvd., Redwood City, CA 94063, EUA Telefone: 650.385.5000 Ligação gratuita nos EUA: 1.800.653.3871www.informatica.com/br www.informatica.com linkedin.com/company/informatica twitter.com/Informatica
© Copyright Informatica LLC 2018. Todos os direitos reservados. Informatica® e Put potential to work™ são marcas comerciais ou marcas comerciais registradas da Informatica Corporation nos Estados Unidos e em diferentes jurisdições por todo o mundo. Todos os outros nomes de empresas e produtos podem ser nomes comerciais ou marcas comerciais.
Sobre a Informatica
A Informatica é uma fornecedora líder e independente de software, focada em inovações transformadoras para o futuro, em todos os assuntos relacionados a dados. Empresas do mundo todo contam com a Informatica para maximizar o seu potencial de informações e impulsionar seus principais imperativos de negócios. Mais de 5.800 companhias dependem da Informatica para potencializar seus ativos de informação hospedados on-premise, na nuvem e na internet, inclusive em redes sociais.
Principais benefíciosLance produtos e serviços inovadores ao mercado com muito mais rapidez
Com o gerenciamento de Big Data da Informatica, seus cientistas e analistas de dados podem
se concentrar em novos insights de dados, não na integração de dados, que a sua empresa pode
usar para desenvolver produtos e serviços inovadores. Isso inclui um ambiente de desenvolvimento
de integração de dados no qual os mapeamentos do PowerCenter® existentes podem ser importados
e através do qual as capacidades dos recursos da Informatica podem ser reutilizadas. E mais:
inclui também um ambiente de desenvolvimento visual fácil de usar e um paradigma de processo
de desenvolvimento repetível. Além disso, estende a integração de dados para os dados de mídia
social, logs da Web, dados de dispositivo de sensor, documentos, e-mail e outros dados
multiestruturados ou sem estruturas, sem codificação manual. Como resultado, esta solução
aumenta drasticamente a produtividade da equipe de TI e acelera o prazo de implantação.
Reduza os custos de projetos de Big Data
O Big Data Management da Informatica reduz os custos de Big Data. É possível descarregar
os dados a partir dos sistemas de armazenamento e origem e processar o descarregamento para
hardware de baixo custo. Ao sair da codificação manual para ferramentas de integração de dados
de produtividade comprovada, você aumenta sua produtividade em até cinco vezes. Você
pode fazer o projeto uma vez e implantá-lo em qualquer lugar, o que mantém os custos baixos,
otimizando a utilização do processamento de dados, tanto em plataformas de dados existentes
como em tecnologias emergentes, como o Hadoop.
Expanda a adoção do Hadoop pela empresa
O gerenciamento de Big Data da Informatica permite uma adoção mais ampla do Hadoop em vários
projetos. Não é preciso usar um código no Java MapReduce para concretizar o desempenho
e os benefícios de custos do Hadoop – você pode prontamente empregar mais de 100 mil
desenvolvedores treinados pela Informatica em todo o mundo para trabalhar em projetos
de Big Data. Esta solução é mais fácil de administrar e aceita vários projetos de Big Data.
Ela assegura o melhor desempenho de ponta a ponta, garante confiança na linhagem de dados
de ponta a ponta, segurança para minimizar os riscos e acelera a implantação.
Minimize os riscos de adotar novas tecnologias
O gerenciamento de Big Data da Informatica minimiza os riscos associados com as tecnologias
mais recentes, como o Hadoop. Sua organização de TI pode fazer um investimento que funciona
tanto com as tecnologias emergentes quanto com as infraestruturas de dados tradicionais.
Esta solução minimiza o impacto de esquemas dinâmicos e os riscos associados à habilidade
de proteger dados confidenciais. Fornece uma abordagem de integração de dados única e consistente
para todos os tipos de dados. Enquanto tecnologias mais recentes como o Hadoop continuam
evoluindo, o Big Data Management da Informatica garante a adoção tranquila de inovações sem
que seja necessário recriar seus mapeamentos e fluxos de dados.