Cloudera ha anunciado Cloudera Data Science Workbench, una nueva herramienta de autoservicio para la gestión de data science en Cloudera Enterprise, que actualmente se encuentra en fase beta. Fruto de la adquisición el año pasado de la startup especializada en data science Sense.io, Data Science Workbench permite a los especialistas en big data utilizar sus lenguajes de código abierto favoritos (incluyendo R, Python y Scala) y acceder a sus bibliotecas en una plataforma empresarial segura sobre la base de Apache Spark nativo y la integración de Apache Hadoop, para acelerar los proyectos de análisis desde la exploración a la producción.
«Cloudera está determinada a mejorar la experiencia de los usuarios de data science y los equipos de ingeniería, en particular la de aquellos que quieren escalar sus análisis utilizando Spark para el procesamiento datos y el machine learning«, comenta Charles Zedlewski, senior vice president, products en Cloudera. «La adquisición de Sense.io y su equipo nos proporcionó una sólida base sobre la que trabajar y ahora, gracias a Data Science Workbench, podemos poner ahora el autoservicio de data science escalable al alcance de nuestros clientes«.
Los beneficios de Data Science Workbench incluyen:
Para los científicos de datos:
• Posibilidad de utilizar R, Python o Scala con sus bibliotecas y frameworks favoritos directamente desde el navegador web.
• Acceso directo a datos en clusters seguros de Hadoop con Spark e Impala.
• Compartir ideas con todo su equipo para una investigación reproducible y colaborativa.
Para los profesionales de TI:
• Dar libertad al equipo de data science para trabajar como quieran y cuando quieran.
• Cumplir con el soporte “out-of-the-box” de seguridad completa en Hadoop, especialmente en Kerberos.
• Permitir el trabajo on-premise o en la nube, de modo que el usuario pueda decidir en función de dónde gestione sus datos.
A medida que el data science abierto se expande más allá de los extensos ecosistemas Python y R, para incluir marcos de aprendizaje profundo como Tensorflow, Microsoft Cognitive Toolkit, MXnet o BigDL, los equipos de data science siguen buscando nuevas formas de trasladar estas herramientas a sus datos almacenados en los entornos Hadoop. Cloudera Data Science Workbench ofrece un entorno seguro para combinar las últimas innovaciones en código abierto con la plataforma unificada en la que confían los clientes de Cloudera.
“Al proporcionar fácil acceso a los datos, Cloudera Data Science Workbench reduce el tiempo necesario para poner en valor aplicaciones IA desarolladas con la plataforma automatizada de machine learning de DataRobot”, explica Jeremy Achin, CEO y cofundador de DataRobot. “DataRobot está completamente integrado y ayuda a los usuarios de Cloudera a aumentar y aprovechar el valor de negocio de las mejores técnicas en algoritmos y data science gracias a su sencilla interfaz«.
«Los equipos de TI de nuestros clientes a menudo tienen que lidiar con dificultades para que los científicos de datos se unan a entornos compartidos, ya que sus necesidades son muy diversas, especialmente cuando están involucradas herramientas de código abierto. Como resultado se producen duplicaciones, silos analíticos y limitaciones de la seguridad y el control. Mientras tanto, los científicos de datos están constantemente buscando expandir su trabajo a conjuntos de datos más grandes y plataformas de computación más potentes«, explica Zedlewski. «Con Data Science Workbench, Cloudera ayuda a los departamentos de TI y a los científicos de datos a trabajar juntos, atrayendo a más usuarios a entornos compartidos en la nube de una forma correcta y flexible«.