El Protocolo de Iniciativa de Archivos Abiertos para la Recolección de Metadatos ( OAI-PMH ) es un protocolo desarrollado para recolectar descripciones de metadatos de registros en un archivo, de modo que se puedan crear servicios utilizando metadatos de muchos archivos. Una implementación de OAI-PMH debe admitir la representación de metadatos en Dublin Core , pero también puede admitir representaciones adicionales. [1] [2]
El protocolo generalmente se conoce simplemente como Protocolo OAI.
OAI-PMH utiliza XML sobre HTTP . La versión 2.0 del protocolo se publicó en 2002; el documento se actualizó por última vez en 2015. Tiene licencia Creative Commons BY-SA.
A finales de los años 1990, Herbert Van de Sompel ( Universidad de Ghent ) estaba trabajando con investigadores y bibliotecarios del Laboratorio Nacional de Los Álamos (EE. UU.) y convocó una reunión para abordar las dificultades relacionadas con los problemas de interoperabilidad de los servidores de impresión electrónica y los repositorios digitales . La reunión se celebró en Santa Fe, Nuevo México , en octubre de 1999. [3] Un desarrollo clave de la reunión fue la definición de una interfaz que permitiera a los servidores de impresión electrónica exponer metadatos de los artículos que guardaban de forma estructurada para que otros repositorios pudieran identificar y copiar artículos de interés entre sí. Esta interfaz/protocolo se denominó "Convención de Santa Fe". [1] [2] [4]
En 2000 se celebraron varios talleres en la conferencia de bibliotecas digitales de la ACM [5] , en la primera conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales [6] [7] y en otros lugares para compartir las ideas de la Convención de Santa Fe [8] . En los talleres se descubrió que los problemas a los que se enfrentaba la comunidad de impresión electrónica también los compartían las bibliotecas, los museos, las editoriales de revistas y otros que necesitaban compartir recursos distribuidos. Para abordar estas necesidades, la Coalición para la Información en Red [9] y la Federación de Bibliotecas Digitales [10] proporcionaron financiación para establecer una secretaría de la Iniciativa de Archivos Abiertos (OAI) gestionada por Herbert Van de Sompel y Carl Lagoze. La OAI celebró una reunión en la Universidad de Cornell ( Ithaca, Nueva York ) en septiembre de 2000 con el objetivo de mejorar la interfaz desarrollada en la Convención de Santa Fe [11] . Las especificaciones se refinaron por correo electrónico.
La versión 1.0 de OAI-PMH se presentó al público en enero de 2001 en un taller en Washington DC [ 12] y otro en febrero en Berlín, Alemania [13] . Las modificaciones posteriores al estándar XML por parte del W3C requirieron realizar modificaciones menores a OAI-PMH, lo que dio como resultado la versión 1.1. La versión actual, 2.0, se lanzó en junio de 2002. Contenía varios cambios y mejoras técnicas y no es compatible con versiones anteriores [14] .
Desde 2001 , el CERN , y posteriormente en colaboración con la Universidad de Ginebra , ha organizado talleres OAI bianuales, [15] que con el tiempo han evolucionado para cubrir la mayoría de los aspectos de la ciencia abierta . Desde 2021, la serie de talleres se denomina Taller de Ginebra sobre Innovaciones en Comunicación Académica, y el apodo OAI refleja su origen. [16]
Algunos motores de búsqueda comerciales utilizan OAI-PMH para adquirir más recursos. Google inicialmente incluyó soporte para OAI-PMH cuando lanzó mapas de sitio, sin embargo decidió admitir solo el formato estándar XML Sitemaps en mayo de 2008. [17] En 2004, Yahoo! adquirió contenido de OAIster ( Universidad de Michigan ) que se obtuvo a través de la recolección de metadatos con OAI-PMH. Wikimedia utiliza un repositorio OAI-PMH para proporcionar feeds de Wikipedia y actualizaciones de sitios relacionados para motores de búsqueda y otros esfuerzos de análisis/republicación en masa. [18] Especialmente cuando se trata de miles de archivos que se recolectan todos los días, OAI-PMH puede ayudar a reducir el tráfico de red y el uso de otros recursos al realizar una recolección incremental. [19] El sistema de búsqueda de metadatos Mercury de la NASA utiliza OAI-PMH para indexar miles de registros de metadatos del Directorio Maestro de Cambio Global (GCMD) todos los días. [20]
El proyecto mod_oai utiliza OAI-PMH para exponer a los rastreadores web contenido al que se puede acceder desde servidores web Apache .
Posteriormente, OAI-PMH se aplicó al intercambio de datos científicos. [21]
OAI-PMH se basa en una arquitectura cliente-servidor , en la que los "recolectores" solicitan información sobre registros actualizados a los "repositorios". Las solicitudes de datos pueden basarse en un rango de fechas y pueden restringirse a conjuntos con nombre definidos por el proveedor. Los proveedores de datos deben proporcionar metadatos XML en formato Dublin Core y también pueden proporcionarlos en otros formatos XML.
Varios sistemas de software soportan el OAI-PMH, incluyendo Fedora , EThOS de la Biblioteca Británica , GNU EPrints de la Universidad de Southampton , Open Journal Systems del Public Knowledge Project , Desire2Learn , DSpace del MIT , HyperJournal de la Universidad de Pisa , Digibib de Digibis, MyCoRe , Koha , Primo, DigiTool, Rosetta y MetaLib de Ex Libris , ArchivalWare de PTFS, DOOR [22] del eLab [23] en Lugano, Suiza, panFMP de la biblioteca de datos PANGAEA , [24] SimpleDL de Roaring Development y jOAI del Centro Nacional de Investigación Atmosférica . [25]
Varios archivos de gran tamaño admiten el protocolo, incluidos arXiv y el servidor de documentos del CERN .
{{cite journal}}
: Mantenimiento CS1: fecha y año ( enlace ){{cite book}}
: Mantenimiento CS1: fecha y año ( enlace ){{cite book}}
: Mantenimiento CS1: fecha y año ( enlace )