Diseño y objeto de texto analizados

Estándar para texto y diseño de imágenes digitalizadas

ALTO ( Analysisd Layout and Text Object ) es un esquema XML abierto desarrollado por el proyecto financiado por la UE denominado METAe. [1]

El estándar fue desarrollado inicialmente para la descripción de textos OCR y la información de diseño de páginas para material digitalizado. El objetivo era describir el diseño y el texto de una forma que permitiera reconstruir la apariencia original en función de la información digitalizada, de forma similar al enfoque de una operación de guardado de imágenes sin pérdida.

ALTO se utiliza a menudo en combinación con el Estándar de codificación y transmisión de metadatos (METS) para la descripción de todo el objeto digitalizado y la creación de referencias entre los archivos ALTO, por ejemplo, la descripción de la secuencia de lectura.

El estándar está alojado en la Biblioteca del Congreso desde 2010 y mantenido por el Consejo Editorial inicializado al mismo tiempo.

Desde la versión final del estándar ALTO en junio de 2004 (versión 1.0), ALTO fue mantenido por CCS CCS Content Conversion Specialists GmbH, Hamburgo hasta la versión 1.4.

Estructura

Un archivo ALTO consta de tres secciones principales como elementos secundarios del <alto>elemento raíz: [2]

  • <Description>La sección contiene metadatos sobre el archivo ALTO en sí e información de procesamiento sobre cómo se creó el archivo.
  • <Styles>La sección contiene los estilos de texto y párrafo con sus descripciones individuales:
    • <TextStyle>Tiene descripciones de fuentes
    • <ParagraphStyle>Tiene descripciones de párrafos, por ejemplo, información de alineación.
  • <Layout>La sección contiene la información del contenido. Se subdivide en <Page>elementos.
<?xml version="1.0"?> <alto> <Descripción> <UnidadDeMedición/> <InformaciónDeImagenOrigen/> <Procesamiento/> </Descripción> <Estilos> < EstiloDeTexto/> <EstiloDePárrafo/> </Estilos> < Diseño> <Página> <MargenSuperior/ > <MargenIzquierdo/> <MargenDeDerecho/> <MargenInferior/> <EspacioDeImpresión/> </Página> < /Diseño > </alto>                  

Soporte de software

Véase también

Referencias

  1. ^ Stehno, Birgit; Egger, Alexander; Retti, Gregor (abril de 2003). «METAe: codificación automatizada de textos digitalizados». Literary and Linguistic Computing . 18 (1): 77–88. doi :10.1093/llc/18.1.77.
  2. ^ Estructura de los archivos ALTO
  • Normas ALTO (Analyzed Layout and Text Object) en el sitio web de la Biblioteca del Congreso
  • https://altoxml.github.io/ o https://github.com/altoxml ALTOxml en GitHub
  • Más información sobre METS/ALTO de CCS GmbH
  • Introducción a METS ALTO por CCS GmbH Archivado el 4 de septiembre de 2014 en Wayback Machine.
  • Transformaciones XSLT desde y hacia ALTO
Obtenido de "https://es.wikipedia.org/w/index.php?title=Objeto_de_texto_y_diseño_analizado&oldid=1214319383"