EMC Corporation (www.emc.com) ha anunciado la disponibilidad del código abierto de EMC Greenplum Chorus, como muestra de su interés por que las organizaciones de todo el mundo puedan conseguir un mayor entendimiento y extraer valor económico de Big Data, gracias al anuncio con Kaggle, una plataforma de competición para científicos de datos. Más abajo fragmentos del comunicado de prensa.
Según el estudio ‘Big Data: The next frontier for innovation, competition, and productivity’, publicado en mayo de 2011 por McKinsey Global Institute, existe una notable escasez de talento necesario para convertir Big Data en una ventaja competitiva para las organizaciones. Esta situación se convierte en el mayor obstáculo para la adopción generalizada de Big Data en la industria. EMC y Kaggle han anunciado la unión de sus fuerzas para mitigar esta carencia de data scientists, gracias a la integración de la plataforma social colaborativa Greenplum Chorus con la comunidad de científicos de datos de Kaggle, que supera los 55.000 miembros, especializados en disciplinas como las matemáticas, la estadística o la alta tecnología.
En los procesos analíticos, los científicos de datos se enfrentan a desafíos en el acceso y compartición de la información. Greenplum Chorus les ayudará a crear un ecosistema completo de data science con la mejor de las aplicaciones analíticas para cada necesidad concreta. Como plataforma social colaborativa en el tratamiento de los datos, los usuarios de Greenplum Chorus podrán aumentar su productividad al tiempo que reducen la carga administrativa de las infraestructuras TI, logrando una mejor visibilidad y un acceso más rápido a los datos utilizando una única herramienta.
Todos aquellos miembros de la comunidad de Kaggle podrán optar a conseguir oportunidades de trabajo a través de Chorus. Por medio de su interfaz, los usuarios que deseen captar a profesionales de este campo podrán buscar e indagar en los perfiles de los componentes de la comunidad Kaggle e invitar a los que estén interesados a colaborar en sus proyectos. En virtud de una integración segura entre las APIs de Chorus y Kaggle, quienes lo deseen podrán exponer información relevante desde el espacio de trabajo de la plataforma de Greenplum y enviar mensajes seguros. Así, Kaggle –que identifica a Chorus como fuente de estos mensajes- los hace llegar a los destinatarios adecuados. Una vez que la comunidad de miembros de Kaggle revise el material, responderán directamente al usuario concreto de Chorus con objeto de acordar los detalles oportunos e iniciar un proyecto conjunto.
“La colaboración entre individuos, organizaciones y comunidades es esencial para alcanzar el éxito con el análisis de Big Data. El Proyecto OpenChorus es parte de una ola de tecnologías de Big Data, estrategias y herramientas anunciadas por EMC Greenplum, todo ello con una misión común: expandir las oportunidades de Big Data y que ésta pueda contribuir a ayudar a los clientes a extraer un beneficio económico y un valor añadido para su información, como nunca antes lo habían imaginado. Este éxito depende las plataformas colaborativas, llamadas a resolver el problema número uno de la era del Big Data: atender la demanda de científicos de datos. A partir de ahora, con Kaggle y su comunidad de 55.000 profesionales con este perfil, creemos que vamos a cambiar para siempre el camino de hacer y entender data science”.
Anthony Goldbloom, CEO, Kaggle: “Trabajar con EMC Greenplum abre un nuevo mundo de oportunidades presentes y futuras a los miembros de la comunidad Kaggle. La alianza también ayudará a resolver la preocupante escasez de científicos de datos de alto nivel, un perfil que contribuirá a que las compañías saquen el máximo partido de su información”.
El código abierto de Greenplum Chorus está disponible a través de la página del Proyecto OpenChorus. La integración de Chorus y Kaggle se espera que sea efectiva a partir del próximo mes de noviembre de 2012.