Este artículo necesita citas adicionales para su verificación . ( julio de 2023 ) |
ALTO ( Analysisd Layout and Text Object ) es un esquema XML abierto desarrollado por el proyecto financiado por la UE denominado METAe. [1]
El estándar fue desarrollado inicialmente para la descripción de textos OCR y la información de diseño de páginas para material digitalizado. El objetivo era describir el diseño y el texto de una forma que permitiera reconstruir la apariencia original en función de la información digitalizada, de forma similar al enfoque de una operación de guardado de imágenes sin pérdida.
ALTO se utiliza a menudo en combinación con el Estándar de codificación y transmisión de metadatos (METS) para la descripción de todo el objeto digitalizado y la creación de referencias entre los archivos ALTO, por ejemplo, la descripción de la secuencia de lectura.
El estándar está alojado en la Biblioteca del Congreso desde 2010 y mantenido por el Consejo Editorial inicializado al mismo tiempo.
Desde la versión final del estándar ALTO en junio de 2004 (versión 1.0), ALTO fue mantenido por CCS CCS Content Conversion Specialists GmbH, Hamburgo hasta la versión 1.4.
Un archivo ALTO consta de tres secciones principales como elementos secundarios del <alto>
elemento raíz: [2]
<Description>
La sección contiene metadatos sobre el archivo ALTO en sí e información de procesamiento sobre cómo se creó el archivo.<Styles>
La sección contiene los estilos de texto y párrafo con sus descripciones individuales:<TextStyle>
Tiene descripciones de fuentes<ParagraphStyle>
Tiene descripciones de párrafos, por ejemplo, información de alineación.<Layout>
La sección contiene la información del contenido. Se subdivide en <Page>
elementos.<?xml version="1.0"?> <alto> <Descripción> <UnidadDeMedición/> <InformaciónDeImagenOrigen/> <Procesamiento/> </Descripción> <Estilos> < EstiloDeTexto/> <EstiloDePárrafo/> </Estilos> < Diseño> <Página> <MargenSuperior/ > <MargenIzquierdo/> <MargenDeDerecho/> <MargenInferior/> <EspacioDeImpresión/> </Página> < /Diseño > </alto>