MapReduce es un concepto en el que una acción conocida como un “map” es aplicada a cada elemento (item) de una lista. La salida que produce cada “map” puede ser acumulada o modificada en un proceso conocido como “reduce”. Este modelo ayuda a las empresas a gestionar eficazmente la abundancia de datos que existe en las organizaciones, facilitando el cálculo y procesamiento distribuido de grandes conjuntos de datos.
iWay Software, a través de Parallel Services Manager, añade la funcionalidad MapReduce a su solución de integración de datos. Con esta plataforma, las funciones “map” y “reduce” se ejecutan en un flujo de proceso y los elementos (ítems) proceden de una lista de un documento de entrada. El flujo de proceso es entonces ejecutado por cada elemento (item) de la lista en paralelo, permitiendo que los resultados se vayan reuniendo en un único documento.
Por ejemplo, en el caso de un usuario que esté consultando multiples almacenes de datos simultáneamente, la funcionalidad Parallel Control Agent puede ejecutar simultáneamente flujos de proceso configurados con la información de conexión de una lista de conexiones de un documento de entrada. La salida de cada consulta (query) puede ser añadida al documento final de resultados.
El concepto MapReduce es también utilizado en almacenes de documentos como iWay Archive. En iWay Archive un usuario puede escribir un cambio, actualización o consulta y ejecutarlo contra cada documento de una colección de la base de datos. La función “Reduce” también puede ser utilizada para calcular un resultado simple o un conjunto de resultados, los cuales son entonces escritos en otra colección del almacén de documentos. En el caso de una configuración cluster, la ejecución de un MapReduce es realiza a través del cluster, ofreciendo una procesamiento muy eficiente.