Algunos de los factores destacados de la solución son el procesamiento automático de información en cosas tan tediosas como «metadatar documentos» (colocar etiquetas que indican sobre qué tratan determinados documentos, como contratos, facturas y otros tipos de documentos financieros).
Cajasol también está interesada en implantar módulos de OCR (reconocimiento de caracteres en imágenes) y de Firma Digital, particularmente usando Viafirma.
Habitualmente en el mercado el procesamiento automático de documentos con facturas se realiza con herramientas de escaneado zonal (OCR zonal), de forma que se extrae la información de la factura teniendo en cuenta su posición y no realizando una comprensión semántica del contenido.
La principal desventaja de esta solución de escaneado zonal es que fuerza a tener N plantillas por cada una de las N facturas distintas que nos emitan nuestros proveedores. Mediante la tecnología semántica, sin embargo, serán capaces de extraer contenidos una vez que se “enseña” al sistema sobre un tipo concreto (factura, contrato, nómina) de documento, y no sobre cada una de las posibles plantillas de cada tipo de documento.