Entre los distintos materiales digitalizados que se ponen a disposición para consulta on-line se encuentran:
- Libros antiguos e incunables
- Libros modernos con derechos de autor, dentro del marco del proyecto Enclave.
- Grabados, dibujos y fotografías
- Manuscritos
- Música impresa
- Mapas
- Registros sonoros
Colbenson está desarrollando para la Biblioteca Digital Hispánica las siguientes funcionalidades:
• Búsqueda conceptual a texto completo en el OCR de los libros y en los campos la descripción bibliográfica: el usuario puede buscar por palabras o frases que se encuentren en cualquier punto de los documentos y de sus registros y recuperar los resultados en función del contexto de la consulta.
• Presentación del resumen contextual generado automáticamente: presenta la zona más relevante del documento resaltando las palabras encontradas para facilitar al usuario la localización del documento más pertinente a sus intereses.
• Auto-rellenado predictivo: el sistema propone al usuario las búsquedas más populares a partir del cuarto carácter que introduce en la caja de búsqueda.
• Clasificación de los resultados de búsqueda por Tipo de documento y por Colecciones permitiendo al usuario el filtrado progresivo de los documentos encontrados mediante la navegación (e-Discovery)
• Expansiones de consultas: ofrece al usuario la posibilidad de acotar los resultados que ha obtenido a través de agrupaciones por los términos relacionados con la consulta, permitiendo la navegación por los términos de la expansión para recuperar los documentos.
• Snippets de visualización: las vistas de pre-visualización de contenidos (completa, parcial, restringida, etc..) permitirán mostrar los distinta información del documento datos según las necesidades: descripción bibliográfica libro (Titulo, autor, ISBN, materia, fecha, etc..), Índice del libro, Vista completa o parcial de libro sujeto a derechos de autor, Sugerencias de libros relacionados, Nube de términos, búsqueda a texto libre dentro del libro, otros libros de este autor.
• Detección de entidades: en tiempo de indexación se realizará la detección de ciertas entidades previamente definidas, mediante whitelist, blacklist y gramática basada en expresiones regulares, para etiquetar o catalogar automáticamente los documentos.
• Analítica de búsqueda: conociendo el uso que los usuarios hacen del sistema es posible definir estrategias para adaptar y personalizar los resultados. El sistema de analítica genera informes estadísticos entre otros:
o Términos más buscados.
o Distribución de uso del buscador por franjas horarias.
o Documentos más populares.
o Segmentación por tipo de documento.