|
|
| Home >> Working Papers Series >> Jornadas de Bibliotecas Digitales >> El proyecto METAe (Meta-data Engine Project): concepto, implementación e integración en bibliotecas digitales |
Jornadas de Bibliotecas Digitales / . Abstract: La necesidad de digitalizar documentos impresos requiere la creación de herramientas y estándares que ayuden en esta tarea. El consorcio internacional del proyecto METAe del V programa marco de la Unión Europea ha desarrollado la herramienta Metadata Engine que aporta una solución integrada de digitalización, OCR, y etiquetado XML de textos. Mediante una sencilla interfaz, el usuario gestiona la digitalización, la extracción del formato y el preprocesado del documento impreso, la ejecución del OCR y la extracción del contenido semántico. Todo ello con una mínima supervisión del usuario. La definición de los estándares METS (Metadata Encoding & Transmission Standard) y ALTO (Analyzed Layout and Text Object) para el XML aportan un esquema de etiquetado flexible capaz de generar facsímiles con los que reconstruir el aspecto original a partir de la información almacenada. En este artículo explicamos el funcionamiento de esta herramienta, los estándares utilizados en los documentos XML generados, y por último la integración de la herramienta en una biblioteca digital.
(go top) |
Last
updated: 2008-05-13 04:02:22 DoIS team
Italian DoIS