Con este webinar, realizado el 23 de Julio de 2014 y presentado por Sourygna Luangsay, fundador, de la compañía FormHadoop, se pretende dar una introducción a unos de los componentes principales de Hadoop, aplicados al mundo de social media.
Entre otras cosas, se habló de:
– El papel de Flume dentro de un proceso ETL en Hadoop.
– Posibilidades de configuración de Flume y cómo conectarlo a la API de Twitter
– Algunas empresas especializadas en fuentes de Social Media y que permiten superar el límite
de la API pública de Twitter.
– Las ventajas de Hive, para explotar la información en Hadoop usando queries similares a SQL
– Por qué Hive es el complemento Big Data a los DataWarehouse tradicionales.
– Cómo Hive es capaz de trabajar con información semi-estructurada. En el caso de Twitter: un formato JSON.