Enmarcado dentro de la política de innovación en los servicios en Internet para el usuario en general, incluyendo aquellos que no son especialistas en bibliotecas y documentación, que desarrolla la Biblioteca Nacional de España (BNE), Colbenson ha sido seleccionado para la implementación de un nuevo sistema de recuperación avanzada de documentos digitalizados en la Biblioteca Digital Hispánica (BDH).
Entre los distintos materiales digitalizados que se ponen a disposición para consulta on-line se encuentran:
- Libros antiguos e incunables
- Libros modernos con derechos de autor, dentro del marco del proyecto Enclave.
- Grabados, dibujos y fotografías
- Manuscritos
- Música impresa
- Mapas
- Registros sonoros
Colbenson está desarrollando para la Biblioteca Digital Hispánica las siguientes funcionalidades:
• Búsqueda conceptual a texto completo en el OCR de los libros y en los campos la descripción bibliográfica: el usuario puede buscar por palabras o frases que se encuentren en cualquier punto de los documentos y de sus registros y recuperar los resultados en función del contexto de la consulta.
• Presentación del resumen contextual generado automáticamente: presenta la zona más relevante del documento resaltando las palabras encontradas para facilitar al usuario la localización del documento más pertinente a sus intereses.
• Auto-rellenado predictivo: el sistema propone al usuario las búsquedas más populares a partir del cuarto carácter que introduce en la caja de búsqueda.
• Clasificación de los resultados de búsqueda por Tipo de documento y por Colecciones permitiendo al usuario el filtrado progresivo de los documentos encontrados mediante la navegación (e-Discovery)
• Expansiones de consultas: ofrece al usuario la posibilidad de acotar los resultados que ha obtenido a través de agrupaciones por los términos relacionados con la consulta, permitiendo la navegación por los términos de la expansión para recuperar los documentos.
• Snippets de visualización: las vistas de pre-visualización de contenidos (completa, parcial, restringida, etc..) permitirán mostrar los distinta información del documento datos según las necesidades: descripción bibliográfica libro (Titulo, autor, ISBN, materia, fecha, etc..), Índice del libro, Vista completa o parcial de libro sujeto a derechos de autor, Sugerencias de libros relacionados, Nube de términos, búsqueda a texto libre dentro del libro, otros libros de este autor.
• Detección de entidades: en tiempo de indexación se realizará la detección de ciertas entidades previamente definidas, mediante whitelist, blacklist y gramática basada en expresiones regulares, para etiquetar o catalogar automáticamente los documentos.
• Analítica de búsqueda: conociendo el uso que los usuarios hacen del sistema es posible definir estrategias para adaptar y personalizar los resultados. El sistema de analítica genera informes estadísticos entre otros:
o Términos más buscados.
o Distribución de uso del buscador por franjas horarias.
o Documentos más populares.
o Segmentación por tipo de documento.