Icono del sitio BI-Spain.com

Cloudera integra el acelerador RAPIDS para Apache Spark 3.0. de Nvidia

Cloudera la empresa de la Enterprise Data Cloud, anunció hoy que Cloudera Data Platform (CDP) integrará el acelerador RAPIDS para Apache Spark 3.0., instalado en plataformas informáticas NVIDIA. El software permite a las empresas acelerar las canalizaciones de datos y ampliar los límites de rendimiento de los flujos de trabajo de datos y aprendizaje automático (ML) para impulsar una adopción de Inteligencia Artificial (IA) más rápida y ofrecer mejores resultados comerciales, sin cambiar ningún código.

Con el lanzamiento a principios de este año de Applied ML Prototypes (AMP) en CDP y el poder de la computación NVIDIA, clientes como el Servicio de Impuestos Internos y la Oficina de Estadísticas Nacionales del Reino Unido no solo pueden impulsar casos de uso de ML completamente empaquetados, sino también acelerar el procesamiento de datos y capacitar los modelos a un coste menor en cualquier implementación local, de nube pública o de nube híbrida.

Los ingenieros de datos empresariales están utilizando conjuntos de datos en una magnitud y escala nunca antes vistas, como la transformación de los modelos de la cadena de suministro, la respuesta al aumento de los niveles de fraude o el desarrollo de nuevas líneas de productos.

Para los científicos de datos, los cuellos de botella creados por cantidades masivas de datos impactan directamente en el coste y la velocidad a la que las empresas pueden entrenar y operar modelos en toda la organización. Se espera que la integración de Cloudera y NVIDIA genere a las empresas la capacidad de responder rápidamente a los desafíos comerciales emergentes en curso y crear análisis detallados.

“Necesitamos poder tomar decisiones con precisión a gran velocidad utilizando ingentes cantidades de datos. Este desafío está en constante evolución a medida que los volúmenes de datos y las velocidades continúan aumentando”, aseguró Joe Ansaldi, Research Applied Analytics & Statistics Division (RAAS) y Technical Brand Chief del Servicio de Impuestos Internos (IRS) de los Estados Unidos. 

Para cada empresa que tiene que hacer frente a conjuntos de datos masivos, una canalización acelerada por una GPU de código abierto significa la diferencia entre poder entrenar modelos o no poder hacerlo nunca. Tal canalización puede potenciar directamente la capacidad de una organización para transformarse utilizando Inteligencia Artificial. Apache Spark 3 acelerado por GPU se ejecuta sin problemas en Cloudera Data Platform, lo que permite a las organizaciones respaldar las necesidades de HPC, IA y ciencia de datos, desde la investigación hasta la producción, con una plataforma segura, escalable y abierta para el aprendizaje automático.

“En un momento en el que la velocidad lo es todo, las empresas confían en el poder de los datos más que nunca. Nuestra colaboración con NVIDIA brindará a los clientes el espacio que necesitan para comprender mejor sus datos y darse cuenta del verdadero potencial de transformación de la IA ”, apuntó Arun Murthy, director de producto de Cloudera. 

“Apache Spark es la piedra angular de los procesos de análisis de datos y aprendizaje automático en los que las empresas confían para seguir siendo competitivas”, afirmó Scott McClellan, director senior del grupo de productos de ciencia de datos de NVIDIA. 

El acelerador RAPIDS para Apache Spark estará disponible en CDP Private Cloud este verano. NVIDIA y Cloudera lanzarán ofertas adicionales aceleradas en CDP a lo largo del tiempo, comenzando con Accelerated Deep Learning y Machine Learning en CDP Public Cloud en mayo. 

Salir de la versión móvil