EMC y Kaggle colaborarán para ofrecer servicios bajo demanda a los científicos de datos. La integración entre la plataforma de EMC y Kaggle será efectiva en noviembre de 2012.
Nota de prensa:
EMC llega a un acuerdo con Kaggle para ofrecer servicios profesionales de científicos de datos bajo demanda
La plataforma Greenplum Chorus de EMC, que aúna el análisis social y el de Big Data, estará disponible como licencia de código abierto para los 55.000 científicos de datos (data scientists) de la comunidad de Kaggle
- EMC Corporation, a través de su división Greenplum, ha sellado una alianza con Kaggle para unir sus fuerzas y hacer frente a la creciente demanda de científicos de datos. El acuerdo supone la integración entre la comunidad de data scientists de Kaggle y la plataforma EMC Greenplum Chorus, que ofrece análisis de Big Data.
- Los usuarios de Chorus que deseen formar parte de la comunidad de Kaggle podrán buscar e indagar entre los perfiles de los miembros de Kaggle para averiguar quién está interesado en colaborar con ellos. Del mismo modo, la comunidad de 55.000 científicos de datos de Kaggle tiene abiertas las puertas para participar en proyectos de consultoría que surjan a través de la plataforma Greenplum Chorus. Este acuerdo modifica la manera en que los usuarios de Greenplum Chorus obtienen asistencia sobre sus problemas con Big Data. La integración también permite a la elite de científicos de datos de Kaggle aumentar la demanda de sus cada vez más codiciadas habilidades.
- EMC publica el código abierto de su plataforma Greenplum Chorus bajo una licencia de software libre de Apache, a través de OpenChorus. Este proyecto acelerará la innovación y la adopción de prácticas colaborativas en materia de data science, ayudando a las organizaciones a conseguir unos mayores beneficios económicos y un mejor rendimiento de su negocio a partir del Big Data.
EMC Corporation (NYSE: EMC) anunció la disponibilidad del código abierto de EMC® Greenplum Chorus, como muestra de su interés por que las organizaciones de todo el mundo puedan conseguir un mayor entendimiento y extraer valor económico de Big Data, gracias al anuncio con Kaggle, una plataforma de competición para científicos de datos.
Según el estudio ‘Big Data: The next frontier for innovation, competition, and productivity’, publicado en mayo de 2011 por McKinsey Global Institute, existe una notable escasez de talento necesario para convertir Big Data en una ventaja competitiva para las organizaciones. Esta situación se convierte en el mayor obstáculo para la adopción generalizada de Big Data en la industria. EMC y Kaggle han anunciado la unión de sus fuerzas para mitigar esta carencia de data scientists, gracias a la integración de la plataforma social colaborativa Greenplum Chorus con la comunidad de científicos de datos de Kaggle, que supera los 55.000 miembros, especializados en disciplinas como las matemáticas, la estadística o la alta tecnología. Este anuncio supondrá un cambio radical en la manera en que las organizaciones afrontan sus problemas de datos, gracias a la posibilidad de contactar con científicos de datos muy cualificados que les ayudarán a resolverlos.
En los procesos analíticos, los científicos de datos se enfrentan a desafíos en el acceso y compartición de la información. Greenplum Chorus les ayudará a crear un ecosistema completo de data science con la mejor de las aplicaciones analíticas para cada necesidad concreta. Como plataforma social colaborativa en el tratamiento de los datos, los usuarios de Greenplum Chorus podrán aumentar su productividad al tiempo que reducen la carga administrativa de las infraestructuras TI, logrando una mejor visibilidad y un acceso más rápido a los datos utilizando una única herramienta.
Todos aquellos miembros de la comunidad de Kaggle podrán optar a conseguir oportunidades de trabajo a través de Chorus. Por medio de su interfaz, los usuarios que deseen captar a profesionales de este campo podrán buscar e indagar en los perfiles de los componentes de la comunidad Kaggle e invitar a los que estén interesados a colaborar en sus proyectos. En virtud de una integración segura entre las APIs de Chorus y Kaggle, quienes lo deseen podrán exponer información relevante desde el espacio de trabajo de la plataforma de Greenplum y enviar mensajes seguros. Así, Kaggle –que identifica a Chorus como fuente de estos mensajes- los hace llegar a los destinatarios adecuados. Una vez que la comunidad de miembros de Kaggle revise el material, responderán directamente al usuario concreto de Chorus con objeto de acordar los detalles oportunos e iniciar un proyecto conjunto.
Scott Yara, Senior Vice President of Products, Greenplum, a division of EMC: “La colaboración entre individuos, organizaciones y comunidades es esencial para alcanzar el éxito con el análisis de Big Data. El Proyecto OpenChorus es parte de una ola de tecnologías de Big Data, estrategias y herramientas anunciadas por EMC Greenplum, todo ello con una misión común: expandir las oportunidades de Big Data y que ésta pueda contribuir a ayudar a los clientes a extraer un beneficio económico y un valor añadido para su información, como nunca antes lo habían imaginado. Este éxito depende las plataformas colaborativas, llamadas a resolver el problema número uno de la era del Big Data: atender la demanda de científicos de datos. A partir de ahora, con Kaggle y su comunidad de 55.000 profesionales con este perfil, creemos que vamos a cambiar para siempre el camino de hacer y entender data science”.
Anthony Goldbloom, CEO, Kaggle: “Trabajar con EMC Greenplum abre un nuevo mundo de oportunidades presentes y futuras a los miembros de la comunidad Kaggle. La alianza también ayudará a resolver la preocupante escasez de científicos de datos de alto nivel, un perfil que contribuirá a que las compañías saquen el máximo partido de su información”.
Disponibilidad
El código abierto de Greenplum Chorus está disponible a través de la página del Proyecto OpenChorus. La integración de Chorus y Kaggle se espera que sea efectiva a partir del próximo mes de noviembre de 2012.
A través del Proyecto OpenChorus, Greenplum establece un marco para el fomento de una comunidad colaborativa en términos de data science, que incluye a desarrolladores particulares, partners, proveedores de fuentes de datos, científicos de datos y los usuarios de la comunidad Chorus. Greenplum Chorus integra un entorno de desarrollo orientado a ampliar el conocimiento con el simple acceso a los datos de terceros y a las herramientas analíticas para promover la agilidad de Big Data y el trabajo en común entre equipos de científicos de datos. De esta manera, se reduce así la dependencia de un proveedor de TI con la flexibilidad que supone el fomento de un ecosistema y una comunidad especializada. Los desarrolladores y partners que lo deseen pueden unirse si visitan www.openchorus.org.