Autonomy, empresa británica con oficinas en Madrid, acaba de poner en el Mercado un nuevo módulo de su suite de software para la gestión y manejo de la información.
El módulo se llama Autonomy Eduction, y tiene como labor la de analizar texto desestructurado y extraer la pertinente información con el objetivo de producir metadata. El metadata es la información que describe el tipo de documento y el contenido, y se utiliza para mejorar el acceso y búsqueda de información, la navegación, el almacenaje y la transferencia de la misma dentro de la empresa.
Este módulo se incluye en la tecnología base de Autonomy, el denominado Intelligent Data Operating Layer (IDOL), y gracias a él se puede ahorrar bastante trabajo manual de procesado y creación de complejo metadata, y además en tiempo real.
«La información es el cimiento sobre el que descansa el negocio de las empresas hoy en día», comenta Sue Feldman, Vicepresidente de Investigación del programa de software Content Management y Búsqueda de IDC. «El añadir metadata automáticamente a los documentos mejora las posibilidades de búsqueda y también permite la creación de herramientas de navegación como los directorios que los usuarios pueden explorar cuando quieren encontrar cierta información. A medida que la cantidad de información desestructurada se multiplica, el añadir metatags manuales basados en Key Words ya no es una solución escalable y práctica. La nueva generación de aplicaciones empresariales deben incorporar tecnologías automáticas de contenido así como tecnologías de bases de datos que entiendan el contenido con el fin de hacer que la montaña de información sea fácilmente accesible», añade Sue Feldman.
Un pasado de bases de datos rígidas
En el pasado, los rígidos sistemas de gestión de bases de datos limitaban la extracción de metainformación manual a campos estrechos, y restringían las posibilidades de las empresas a la hora de crear metadata complejo. Autonomy ofrece la posibilidad de extraer de forma inteligente información de datos desestructurados, gracias a sus posibilidades en el entendimiento conceptual de las piezas, y a que no sólo se basa en la «palabra clave».
Con la tecnología Autonomy una empresa puede reconducir todo tipo de información como números de teléfono, URLs, tipos de interés y números de serie, contenidos en formatos desestructurados, hacia bases de datos estructurados acorde con el tipo de información que sea. Por ejemplo, Autonomy Eduction reconoce que secuencias de caracteres como johnshaw@email.com pertenecen a la dirección de un email y la asocia con el nombre John Shaw, permitiendo a las empresas agrupar y ordenar datos de forma más efectiva. Normalmente esta operación, por ejemplo, había de hacerse a mano.
La tecnología Autonomy extrae información contenida en repositorios, incluyendo el metadata almacenado en las fichas de una base de datos, o en páginas web de internet. Una vez que esta información es capturada y procesada a través de Intelligent Data Operating Layer de Autonomy, todas las aplicaciones construídas sobre esta plataforma pueden beneficiarse del metadata y de las reglas de negocio que ellos engloban.
«Las empresas se enfrentan a cantidades ingentes de información, tanto nueva como vieja, y su manejo se torna imposible. Por ello son tan importantes este tipo de herramientas automáticas para ordenar la información desestructurada», comenta Mike Lynch, CEO y confundador de Autonomy.
El nuevo módulo de Autonomy incluye:
– Entrenamiento en el tagging (marcado) a partir de ejemplos
– Marcado conceptual y sencillo
– Entrenamiento negativo
– Frases de marcado por defecto definidas por el usuario
– Frases de marcado sensibles a mayusculas/minúsculas
– Anchura de los «marcados» configurable
– Posibilidad de configurar el formato de las direcciones (selección del la calle, el código postal,número de la calle?)