Lantares presenta un concepto nuevo de base de datos orientada 100% a las necesidades de análisis en la organización para que las empresas puedan dar respuesta a las necesidades de información de manera ágil y flexible: IBM Netezza.
Según informa Lantares en Nota de Prensa es bastante habitual que en las empresas se escuchen estos comentarios:
En departamentos de Negocio:
– “Estos informes no me dan la información que necesito”
– “Cada vez que lanzo el informe de ventas mensual me puedo ir a tomar un café y volver”
– “Cuando encuentro una desviación en un informe y quiero hacer un análisis más detallado para saber la razón de un problema concreto no puedo hacerlo, o necesito hablar con el equipo de IT para que me dé otra información”
– “Las consultas adhoc al Data Warehouse son demasiado lentas”
En el departamento de IT:
– “El aumento de usuarios del Data Warehouse hace que cada vez tengamos más problemas de rendimiento”
– “El aumento constante de los datos almacenados en el Data Warehouse hace que requiramos más hardware de soporte a la base de datos”
– “Cada día tenemos más trabajo de administración de la base de datos del Data Warehouse, ya que con tantos datos nuevos, y con tantos nuevos caminos de búsqueda de información, tenemos que ajustar mucho las tablas, los índices, etc”
Diferencias con las BBDD Relacionales
Las bases de datos relacionales tradicionales cuentan con una gran capacidad de dar soporte a aplicaciones transaccionales OLTP (OnLine Transaction Processing). En ellas, se prima su capacidad de mantener altas, modificaciones y bajas (A/M/B) de datos, permitiendo multitud de conexiones en paralelo, pero siempre orientadas a la transacción, así el volumen de datos que manejan en cada una de estas operaciones de A/M/B es bajo.
En el caso de los entornos analíticos los datos son estáticos de manera general, y el acceso de análisis sólo se realiza en modo lectura. El problema es que cada conexión realiza un gran movimiento de datos interno, es decir, aunque la salida del informe sea unas pocas líneas, el cálculo de esas pocas líneas puede requerir la lectura de millones de registros. Esto cambia completamente el paradigma, y las bases de datos tradicionales no están orientadas a gestionar de manera masiva datos en modo lectura. Algunas de ellas han añadido algunas herramientas que aceleran las consultas, pero desde luego su corazón es una base de datos tradicional.
Es por esta razón que han aparecido bases de datos especializadas en proporcionar:
– Gran velocidad de responder a consultas masivas
– Gran velocidad en cargar millones de registros
– Escalabilidad desde TB (Terabytes) hasta PB (Petabytes)
– Escalabilidad en número de usuarios/consultas concurrentes
– Minimizar la administración de la base de datos
Técnicamente estas bases de datos son completamente distintas al resto. Se basan en “appliances” que descargan, a nivel hardware, gran parte del trabajo de búsqueda de los datos. Usan técnicas de stripping de datos a través de múltiples discos, aceleradores de consultas en hardware y, sobre todo, técnicas de MapReduce para minimizar la cantidad de datos que necesitan moverse entre los diferentes discos para conseguir el cálculo requerido por el informe.
Según Lantares: «IBM Netezza es una solución de altas prestaciones y gran escalabilidad que permite el crecimiento exponencial tanto en el volumen de datos como en la cantidad de usuarios que requieren información de toda la organización. Netezza TwinFinTM es un Appliance de base de datos que permitirá adaptarse al crecimiento de la compañía y dará respuesta a cualquier necesidad actual o futura»