IBM® InfoSphere® DataStage® Enterprise Edition é uma ferramenta que permite a extração, transformação e carga de dados utilizando processamento paralelo. O objetivo é solucionar os problemas das empresas que possuem janelas sobrecarregadas por grandes volumes de dados manipulados, capazes de acarretar atrasos na liberação dos conteúdos aos usuários finais.
Com o DataStage® as informações críticas e volumosas são extraídas, transformadas e carregadas em ambientes de BI utilizando toda a força e as vantagens do processamento paralelo.A melhoria da performance é explicada pela combinação de duas formas de paralelismo:
- Pipeline: cada estágio é executado em um processador diferente
- Particionado: pode ser feito em vários processadores, onde cada um manuseia parte dos dados processados.
O Paralelismo Particionado é o principal responsável pelo ganho significativo na performance dos jobs. Uma das grandes forças do software é que, ao desenhar seus jobs, você não precisa se preocupar com a estrutura latente do sistema.
O DataStage® resgata informações sobre o tamanho e formato do sistema e organiza os recursos necessários de acordo com o que é definido no arquivo de configuração. Quando o sistema sofre alterações, o arquivo de configuração é alterado e não os jobs.