Produtos IBM®
IBM® InfoSphere® DataStage®
A integração e a consolidação de dados e informações são importantes ferramentas estratégicas para as organizações que queiram se diferenciar no mercado. IBM® InfoSphere® DataStage® possui interface nativa para acesso a diversos bancos de dados relacionais, WebServices, Messages Queues e para aplicativos ERP, possui acesso baseado em padrões de indústria (ODBC, Flat files, FTP, XML), além de possuir bibliotecas internas com mais de 600 transformações para datas, strings, pesos, medidas e interface própria para construção de rotinas de transformações simples e complexas.
Apesar de ser direcionado primeiramente para os ambientes de data warehousing, o software também pode ser utilizado em qualquer projeto de manipulação e migração de dados ou de reengenharia de informação. Sem dúvidas, esse é o mais poderoso suporte de transformação e entrega que você pode conhecer.
-DataStage Administrator: Cria projetos de ETL e define políticas de utilização;
-DataStage Designer: Desenvolve e mantém processos de ETL;
-DataStage Director: Executa, agenda e monitora processos de ETL criados pelo DataStage Designer;
-DataStage Manager: Manipula o repositório de metadados, cria e mantém rotinas de transformação de dados;
-DataStage Server: Engine ETL, mantém o repositório de metadados, armazena os parâmetros de processos ETL, estabelece conexões com fontes e alvos de dados e realiza efetivamente a execução dos processos de extração, transformação e carga dos dados.
Principais características e vantagens do produto.
- Gerenciamento de múltiplas fontes de dados:
O IBM® InfoSphere® DataStage® suporta um número virtualmente ilimitado de destinos e fontes de dados heterogênios em uma só tarefa, comparando e combinando linhas advindas de fontes distintas de dados. Elas podem ser arquivos Flat cujos valores são comparados para isolar dados alterados ou tabelas heterogêneas para propósito de consulta de valores e carga efetivamente
- Gerenciamento de múltiplos alvos de dados:
O desenho do processo de carga do DataStage® suporta o conteúdo de múltiplas tabelas ou arquivos alvo. Estas tabelas podem ser um conjunto de dados provenientes de várias fontes, com múltiplos destinos (de acordo com o alcance da estrutura de rede do cliente) e receber objetos através de inúmeras estratégias de carga: bulk loader, SQL nativo etc.
- Orientação e Agregação:
O DataStage® provê o aumento de desempenho e reduz operações de I/O através de sua capacidade de realizar agregações e ordenações de maneira interna, enquanto outras ferramentas utilizam sentenças SQL e tabelas intermediárias.
- Transformações:
A plataforma da IBM executa mapeamento e operações de transformação em memória. Seu estágio garante ao usuário ordenação gráfica, coluna por coluna, para aplicação de regras de alterações internas, disponibilizadas pela ferramenta ou desenvolvidas no seu ambiente.
- Tabelas Hash em memória:
O Componente Server da ferramenta DataStage® tem o recurso de criação e carga de tabelas Hash dinâmicas, que aumentam significativamente a performance de consulta para validação de dados. Como isso é possível? O armazenamento dos registros utiliza um algoritmo que mapeia as chaves das informações fazendo com que a consulta seja agilizada. Desenvolvedores podem escolher a opção "Pré-load to Memory" para busca, um recurso que retira o processo de validação de integridade estrutural do ambiente RDBMS, responsável pela lentidão das tarefas.
- Paralelismo
O Server tem a capacidade de explorar ambientes de múltiplas CPU's distribuindo automaticamente fluxos de jobs independentes através de vários processos. Isso significa segurança no uso de todos os recursos disponíveis no ambiente e aceleração dos tempos de interpretação e execução dos objetos.
Copyright 2009 - Todos os diretos reservados a MD2 Consultoria e Negócios