Protocolo de la Iniciativa de Archivos Abiertos para la Recolección de Metadatos

Protocolo para recolectar metadatos

El Protocolo de Iniciativa de Archivos Abiertos para la Recolección de Metadatos ( OAI-PMH ) es un protocolo desarrollado para recolectar descripciones de metadatos de registros en un archivo, de modo que se puedan crear servicios utilizando metadatos de muchos archivos. Una implementación de OAI-PMH debe admitir la representación de metadatos en Dublin Core , pero también puede admitir representaciones adicionales. [1] [2]

El protocolo generalmente se conoce simplemente como Protocolo OAI.

OAI-PMH utiliza XML sobre HTTP . La versión 2.0 del protocolo se publicó en 2002; el documento se actualizó por última vez en 2015. Tiene licencia Creative Commons BY-SA.

Historia

A finales de los años 1990, Herbert Van de Sompel ( Universidad de Ghent ) estaba trabajando con investigadores y bibliotecarios del Laboratorio Nacional de Los Álamos (EE. UU.) y convocó una reunión para abordar las dificultades relacionadas con los problemas de interoperabilidad de los servidores de impresión electrónica y los repositorios digitales . La reunión se celebró en Santa Fe, Nuevo México , en octubre de 1999. [3] Un desarrollo clave de la reunión fue la definición de una interfaz que permitiera a los servidores de impresión electrónica exponer metadatos de los artículos que guardaban de forma estructurada para que otros repositorios pudieran identificar y copiar artículos de interés entre sí. Esta interfaz/protocolo se denominó "Convención de Santa Fe". [1] [2] [4]

En 2000 se celebraron varios talleres en la conferencia de bibliotecas digitales de la ACM [5] , en la primera conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales [6] [7] y en otros lugares para compartir las ideas de la Convención de Santa Fe [8] . En los talleres se descubrió que los problemas a los que se enfrentaba la comunidad de impresión electrónica también los compartían las bibliotecas, los museos, las editoriales de revistas y otros que necesitaban compartir recursos distribuidos. Para abordar estas necesidades, la Coalición para la Información en Red [9] y la Federación de Bibliotecas Digitales [10] proporcionaron financiación para establecer una secretaría de la Iniciativa de Archivos Abiertos (OAI) gestionada por Herbert Van de Sompel y Carl Lagoze. La OAI celebró una reunión en la Universidad de Cornell ( Ithaca, Nueva York ) en septiembre de 2000 con el objetivo de mejorar la interfaz desarrollada en la Convención de Santa Fe [11] . Las especificaciones se refinaron por correo electrónico.

La versión 1.0 de OAI-PMH se presentó al público en enero de 2001 en un taller en Washington DC [ 12] y otro en febrero en Berlín, Alemania [13] . Las modificaciones posteriores al estándar XML por parte del W3C requirieron realizar modificaciones menores a OAI-PMH, lo que dio como resultado la versión 1.1. La versión actual, 2.0, se lanzó en junio de 2002. Contenía varios cambios y mejoras técnicas y no es compatible con versiones anteriores [14] .

Talleres de la OAI

Desde 2001 , el CERN , y posteriormente en colaboración con la Universidad de Ginebra , ha organizado talleres OAI bianuales, [15] que con el tiempo han evolucionado para cubrir la mayoría de los aspectos de la ciencia abierta . Desde 2021, la serie de talleres se denomina Taller de Ginebra sobre Innovaciones en Comunicación Académica, y el apodo OAI refleja su origen. [16]

Usos

Algunos motores de búsqueda comerciales utilizan OAI-PMH para adquirir más recursos. Google inicialmente incluyó soporte para OAI-PMH cuando lanzó mapas de sitio, sin embargo decidió admitir solo el formato estándar XML Sitemaps en mayo de 2008. [17] En 2004, Yahoo! adquirió contenido de OAIster ( Universidad de Michigan ) que se obtuvo a través de la recolección de metadatos con OAI-PMH. Wikimedia utiliza un repositorio OAI-PMH para proporcionar feeds de Wikipedia y actualizaciones de sitios relacionados para motores de búsqueda y otros esfuerzos de análisis/republicación en masa. [18] Especialmente cuando se trata de miles de archivos que se recolectan todos los días, OAI-PMH puede ayudar a reducir el tráfico de red y el uso de otros recursos al realizar una recolección incremental. [19] El sistema de búsqueda de metadatos Mercury de la NASA utiliza OAI-PMH para indexar miles de registros de metadatos del Directorio Maestro de Cambio Global (GCMD) todos los días. [20]

El proyecto mod_oai utiliza OAI-PMH para exponer a los rastreadores web contenido al que se puede acceder desde servidores web Apache .

Posteriormente, OAI-PMH se aplicó al intercambio de datos científicos. [21]

Software

OAI-PMH se basa en una arquitectura cliente-servidor , en la que los "recolectores" solicitan información sobre registros actualizados a los "repositorios". Las solicitudes de datos pueden basarse en un rango de fechas y pueden restringirse a conjuntos con nombre definidos por el proveedor. Los proveedores de datos deben proporcionar metadatos XML en formato Dublin Core y también pueden proporcionarlos en otros formatos XML.

Varios sistemas de software soportan el OAI-PMH, incluyendo Fedora , EThOS de la Biblioteca Británica , GNU EPrints de la Universidad de Southampton , Open Journal Systems del Public Knowledge Project , Desire2Learn , DSpace del MIT , HyperJournal de la Universidad de Pisa , Digibib de Digibis, MyCoRe , Koha , Primo, DigiTool, Rosetta y MetaLib de Ex Libris , ArchivalWare de PTFS, DOOR [22] del eLab [23] en Lugano, Suiza, panFMP de la biblioteca de datos PANGAEA , [24] SimpleDL de Roaring Development y jOAI del Centro Nacional de Investigación Atmosférica . [25]

Archivo

Varios archivos de gran tamaño admiten el protocolo, incluidos arXiv y el servidor de documentos del CERN .

Véase también

Referencias

  1. ^ ab Lynch, Clifford A. (agosto de 2001). "Recolección de metadatos y la Iniciativa de Archivos Abiertos". ARL: A Bimonthly Report (217). Archivado desde el original (PDF) el 25 de mayo de 2012.{{cite journal}}: Mantenimiento CS1: fecha y año ( enlace )
  2. ^ ab Marshall Breeding (septiembre de 2002). "Entendiendo el protocolo para la recolección de metadatos de la Iniciativa de Archivos Abiertos". Computadoras en bibliotecas . 22 (8): 24–29 . Consultado el 8 de febrero de 2021 .
  3. ^ Marshall, E. (1999). "Los investigadores planean un archivo gratuito de preimpresiones a nivel mundial". Science . 286 (5441): 887a–887. doi :10.1126/science.286.5441.887a. PMID  10577235. S2CID  178990556.
  4. ^ "La Convención de Santa Fe por la Iniciativa de Archivos Abiertos". Iniciativa de Archivos Abiertos . 15 de febrero de 2000 . Consultado el 29 de mayo de 2022 .
  5. ^ "La Convención de Santa Fe de la Iniciativa de Archivos Abiertos". dspace.library.uu.nl . Consultado el 10 de febrero de 2021 .
  6. ^ Edward A. Fox; Christine L. Borgman, eds. (2001). Actas de la 1.ª conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales . Roanoke, Virginia, Estados Unidos: ACM Press. doi :10.1145/379437. ISBN 978-1-58113-345-5.{{cite book}}: Mantenimiento CS1: fecha y año ( enlace )
  7. ^ Lagoze, Carl; Van de Sompel, Herbert (2001). "La iniciativa de archivos abiertos". Actas de la 1.ª conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales . Roanoke, Virginia, Estados Unidos: ACM Press. pp. 54–62. CiteSeerX 10.1.1.161.6800 . doi :10.1145/379437.379449. ISBN .  978-1-58113-345-5. Número de identificación del sujeto  1315824.{{cite book}}: Mantenimiento CS1: fecha y año ( enlace )
  8. ^ Van de Sompel, Herbert; Lagoze, Carl (2000). "La Convención de Santa Fe de la Iniciativa de Archivos Abiertos". Revista D-Lib . 6 (2). doi : 10.1045/febrero2000-vandesompel-oai . ISSN  1082-9873.
  9. ^ "Página de inicio". Coalición para la Información en Red . Consultado el 29 de mayo de 2022 .
  10. ^ "Página de inicio". Federación de Bibliotecas Digitales . Consultado el 29 de mayo de 2022 .
  11. ^ "Reunión OAi-tech, Universidad de Cornell, 7 y 8 de septiembre de 2000". www.openarchives.org . Consultado el 10 de febrero de 2021 .
  12. ^ "La Iniciativa de Archivos Abiertos: Reunión abierta en el Renaissance Hotel, Washington DC, 23 de enero de 2001". www.openarchives.org . Consultado el 10 de febrero de 2021 .
  13. ^ "La Iniciativa de Archivos Abiertos: Reunión abierta en la Staatsbibliothek de Berlín, Alemania, 26 de febrero de 2001". www.openarchives.org . Consultado el 10 de febrero de 2021 .
  14. ^ Van de Sompel, Herbert; Young, Jeffrey A.; Hickey, Thomas B. (2003). "Usando el OAI-PMH... de manera diferente". Revista D-Lib . 9 (7/8). doi : 10.1045/julio2003-young . ISSN  1082-9873.
  15. ^ "Talleres anteriores de la OAI – OAI". Taller de Ginebra sobre innovaciones en la comunicación académica . Consultado el 13 de enero de 2023 .
  16. ^ Azwa, Adnan Siti Norfateha. "Library Guide: Open Access Guide: The Latest on OA" (Guía de la biblioteca: Guía de acceso abierto: lo último en acceso abierto). umlibguides.um.edu.my . Consultado el 13 de enero de 2023 .
  17. ^ "Retirada del soporte para OAI-PMH en mapas de sitios". Blog de Google Search Central . 23 de abril de 2008. Consultado el 29 de mayo de 2022 .
  18. ^ «Servicio de actualización de Wikimedia». Wikimedia Meta-Wiki . Consultado el 14 de julio de 2013 .
  19. ^ "Sistema de recolección de OAI". DLXS . Consultado el 29 de mayo de 2022 .
  20. ^ R. Devarakonda; G. Palanisamy; J. Green; B. Wilson (2010). "Uso compartido y recuperación de datos mediante OAI-PMH". Informática de las Ciencias de la Tierra . 4 (1). Springer Berlin / Heidelberg: 1–5. doi :10.1007/s12145-010-0073-0. S2CID  46330319.
  21. ^ Devarakonda, Ranjeet; Palanisamy, Giri; Verde, James M.; Wilson, Bruce E. (2011). "Intercambio y recuperación de datos mediante OAI-PMH". Informática de las Ciencias de la Tierra . 4 (1): 1–5. doi :10.1007/s12145-010-0073-0. ISSN  1865-0473. S2CID  46330319.
  22. ^ "Descripción general". PUERTA . Consultado el 29 de mayo de 2022 .
  23. ^ "eLaboratorio". Università della Svizzera italiana (en italiano) . Consultado el 29 de mayo de 2022 .
  24. ^ "Marco PANGAEA® para portales de metadatos". panfmp.org .
  25. ^ "Proyecto NCAR/joai". Github.com . 31 de mayo de 2022.


  • Cosechadora de Archivos Abiertos de la Universidad Suleyman Demirel
  • Especificación del protocolo
  • Biblioteca Nacional del Congreso, Colecciones y programas digitales
  • Biblioteca del Congreso, Programa Nacional de Preservación e Infraestructura de Información Digital
  • Biblioteca del Congreso, captura web
Obtenido de "https://es.wikipedia.org/w/index.php?title=Protocolo_de_la_Iniciativa_de_Archivos_Abiertos_para_la_recopilación_de_metadatos&oldid=1220690143"