Hay sistemas ya para editar nuevo contenido y guardarlo bien estructurado en xml. Pero ¿qué pasa con los miles de documentos ‘desestructurados’, emails, pdfs, word, html, fax… que hay en las empresas y que queremos pasar a formato XML pero útil? Porque no vale para nada ‘Guardar Como’ en XML, se pierde en la gran mayoría de casos toda la metainformación que es la esencia de la estandarización XML.
Incluímos dos documentos en inglés, en html. En uno de los documentos que presentamos se nos explica perfectamente la diferencia entre el contenido «estucturado» que se está guardado en bases de datos relacionales, y el contenido desestructurado. Se calcula que en las empresas el 80% de los documentos son desestructurados.
Entre los documentos desestructurados encontramos los emails, los pdf, los word, contenido publicado en html?. Imaginemos por ejemplo los miles de Currículums que llegan a las empresas, ya sea vía email o por carta o por fax? ¿Cómo pueden convertirse a un formato XML adecuado, por ejemplo cumpliendo con esquemas especializados como HRXML?
Normalmente existe la posibilidad de «Guardar Como» pero al hacerlo, por ejemplo en un word, perderíamos mucha metainformación y con toda seguridad sería casi imposible hacer que esa metainformación cumpla con los esquemas necesarios. En uno de los documentos se nos explica cuales son las formas actuales de hacer estas conversiones. Se nos explica que una de las formas más utilizadas es la manual, es decir que son las personas las que uno a uno leerán todos esos CV, por ejemplo, y lo transformarán en documentos XML útiles. Obviamente ésta es una opción un poco lenta y sumamente laboriosa.
El redactor del documento es uno de los fundadores de una de una empresa norteamericana fabricante de software para la transformación automática de documentos e información legada en XML útil.
Nos explica cómo es el software que ellos van a lanzar en breve, y que es la punta de lanza de un sistema integral de gestión de los contenidos totalmente basado en XML.
En el otro documento se nos explica por qué es necesario y fundamental tener toda la documentación, información y contenidos de las empresas en formato XML, cuales son las ventajas y cuales son las cosas que se podrá hacer ahora que antes no se podía.