IBM ha publicado un Redbook sobre el posicionamiento, funciones, capacidades y técnicas avanzadas de programación de IBM InfoSphere Sterams, el nuevo paradigma y componente clave de la plataforma de Big Data de la compañía. Según IBM, InfoSphere Streams tiene un enfoque distinto del análisis de datos y, además, se diferencia por su plataforma distribuida de tiempo de ejecución, su modelo de programación y las herramientas para desarrollar y depurar errores en aplicaciones analíticas que tienen un alto volumen y variedad de tipos de datos.
Precisamente, el volumen, la variedad y la velocidad son atributos clave de Big Data. Los flujos de datos que IBM InfoSphere gestiona pueden ser originados por sensores, camaras, feeds de noticias o cintas de cotizaciones de bolsa, entre otras fuentes, incluídas bases de datos tradicionales. El sistema, pues, ofrece una plataforma de ejecución de servicios para aplicaciones que recoge, filtra, analiza y correlaciona volúmenes masivos de flujos continuos de datos.