Wikipedia:OABOT

Herramienta/bot de Wikimedia para vincular publicaciones de acceso abierto en citas

OAbot es una herramienta para editar fácilmente artículos para hacer que las citas académicas enlacen publicaciones de acceso abierto (ver lista de ediciones realizadas).

Wikipedia contiene enlaces a cientos de miles de fuentes de pago. Nuestra comunidad no prohíbe ni desalienta citar fuentes de pago, pero al mismo tiempo no hay ninguna prohibición de incluir versiones de acceso abierto (OA) junto a esas citas, siempre que el enlace no infrinja ningún derecho de autor . De hecho, una buena cita tendrá la mayor cantidad de información posible para que el lector pueda encontrarla (y usarla) de la forma que le resulte más sencilla.

Bot

Flujo de trabajo

El bot busca plantillas de citas CS1 y, para cada una de ellas:

  • analiza la cita usando wikiciteparser
  • Consulta la API de Dissemin y Unsub con los metadatos que ha extraído
  • traduce el pdf_urlvuelve a un parámetro de la cita ( |arxiv=, |pmc=, |doi=o |url=como respaldo)
  • Si no existe dicho parámetro en la plantilla, y si ningún enlace ya está libre para leer, lo agrega a la plantilla.

Ejemplos

  • Añadiendo lectura gratuita |url=:
    • Antes: Groussard, M.; Rauchs, G.; Landeau, B.; Viader, F.; Desgranges, B.; Eustache, F.; Platel, H. (2010). "Los sustratos neuronales de la memoria musical revelados por fMRI y dos tareas semánticas". NeuroImagen . 53 (4): 1301-1309. doi : 10.1016/j.neuroimage.2010.07.013. PMID  20627131. S2CID  8955075.
    • Después: Groussard, M.; Rauchs, G.; Landeau, B.; Viader, F.; Desgranges, B.; Eustache, F.; Platel, H. (2010). "Los sustratos neuronales de la memoria musical revelados por fMRI y dos tareas semánticas" (PDF) . NeuroImagen . 53 (4): 1301-1309. doi : 10.1016/j.neuroimage.2010.07.013. PMID  20627131. S2CID  8955075.
  • Añadiendo un |citeseerx=:
    • Antes: Selinger, Peter (2011). "Un estudio de lenguajes gráficos para categorías monoidales". Nuevas estructuras para la física . Apuntes de clases de física. Vol. 813. Springer. págs. 289–233.
    • Después: Selinger, Peter (2011). "Un estudio de lenguajes gráficos para categorías monoidales". Nuevas estructuras para la física . Apuntes de clases de física. Vol. 813. Springer. págs. 289–233. CiteSeerX 10.1.1.216.4918 . 
  • Señalización de apertura de un DOI existente con |doi-access=free:
    • Antes: Lambek, Joachim (1972). "Biconmutadores de inyectivas agradables". Journal of Algebra . 21 : 60–73. doi :10.1016/0021-8693(72)90034-8. ISSN  0021-8693. MR  0301052.
    • Después: Lambek, Joachim (1972). "Biconmutadores de inyectivas agradables". Journal of Algebra . 21 : 60–73. doi : 10.1016/0021-8693(72)90034-8 . ISSN  0021-8693. MR  0301052.

Código

  • https://github.com/dissemin/oabot

Te invitamos a contribuir con el código (por ejemplo, mediante solicitudes de incorporación de cambios en GitHub) y a unirte al equipo de desarrollo en wmflabs. Puedes solicitar acceso al proyecto Tools.

Si desea hacer sugerencias o informar errores, agregue una tarea al proyecto Phabricator.

Preguntas

¿Cómo funciona el bot?

OABOT extrae las citas de un artículo y busca en varios índices, API y repositorios versiones de artículos que no sean de acceso abierto y que se puedan leer de forma gratuita. OABOT puede utilizar el backend de Dissemin para encontrar estas versiones en fuentes como CrossRef , BASE , DOAI y SHERPA/RoMEO . Cuando encuentra una versión alternativa, comprueba si ya está en la cita. Si no está, añade un enlace de lectura gratuita a la cita. Esto ayuda a los lectores a acceder al texto completo.

El bot agrega un enlace con uno de los siguientes parámetros:

|arxiv=
|hdl=
|doi=
|pmc=
|citeseerx=
|url=

El bot solo utiliza |url=si no se conoce o no es aplicable ninguno de los otros parámetros más específicos. El bot solo agrega un parámetro si no contiene nada antes (por lo tanto, el bot no borra ninguna información de las plantillas).

  • El bot no agregará un enlace a una versión que no esté en CrossRef, BASE, DOAI o SHERPA/RoMEO (no es una búsqueda web abierta para ninguna versión o PDF, solo se nutre de fuentes seleccionadas).
  • El bot no agregará un enlace a una versión alternativa de una fuente que ya esté marcada como de lectura gratuita (es decir, siIcono de acceso gratuitoaparece en la fuente renderizada).
  • El bot generalmente no reemplazará uno existente |url=por uno diferente, ni agregará un segundo |url=.
  • El bot ignorará las fuentes en formato libre: solo considera las plantillas de citas.
  • El bot intentará no agregar enlaces redundantes, como enlaces a versiones de editores ya vinculadas a través de un DOI.

¿Qué repositorios consulta y de dónde extrae información el bot?

El bot actualmente consulta:

  • Dissemin se basa en varias fuentes, entre ellas Zenodo , ORCID y BASE . Consulte https://dev.dissem.in/datasources.html
  • Unpaywall (anteriormente OAdoi). Unpaywall rastrea las fuentes que se enumeran en https://api.unpaywall.org/data/sources.csv

En el futuro podríamos agregar Internet Archive Scholar (o cualquier otro, como CORE, SHARE Notify, Handle.net, MLA CORE, CHORUS), una vez que sus índices proporcionen beneficios adicionales y tengan una API funcional.

El bot agrega enlaces a copias gratuitas ofrecidas por repositorios y editoriales bajo una variedad de licencias: algunas no tienen licencia libre o no tienen licencia pública en absoluto, por ejemplo, copias de acceso abierto de bronce de editoriales o algunas copias de archivo. Las editoriales y los repositorios obtienen el derecho a hacerlo de diversas maneras.

Nuestras fuentes (enumeradas arriba) solo enlazan a archivos y repositorios de acceso abierto de buena reputación , generalmente administrados por bibliotecas o instituciones de investigación, que no se sabe que violen la ley de derechos de autor . Por ejemplo, bajo la ley de derechos de autor de la Unión Europea , que es más restrictiva que la ley de derechos de autor de los Estados Unidos , existe un derecho de publicación secundario u otra limitación de derechos de autor en varios países (incluidos Bélgica, Francia, Alemania, los Países Bajos, Eslovenia y Bulgaria), que permite a los repositorios obtener y proporcionar una licencia. Dichas jurisdicciones también tienden a albergar los repositorios más grandes (como HAL ).

Sin embargo, siempre es posible cometer errores. Si sabe o sospecha razonablemente que un editor o repositorio ha proporcionado una obra por error, no la vincule .

Por último, los editores no siempre aprueban las leyes vigentes en todos los países y pueden afirmar que tienen el derecho de impedir tales esfuerzos de archivo. Puede conocer la opinión del editor en las declaraciones de derechos de autor disponibles en la ubicación del DOI y en el resumen de SHERPA/RoMEO de la política de cada revista.

Para obtener información adicional, consulte también:

  • Acceso abierto y derechos de autor
  • Un sitio de redes sociales no es un repositorio de acceso abierto

¿Por qué el bot no agregó este identificador?

OABOT intenta realizar los cambios mínimos necesarios para que una cita sea de acceso abierto.

Es posible que el identificador que tiene en mente no sea conocido por proporcionar una copia de acceso abierto, o puede ser uno de los muchos identificadores que no se admiten actualmente. Alternativamente, existe otro identificador que ya vincula automáticamente el título y garantiza el estado de acceso abierto de la obra (el más común es PubMed Central ).

¿Por qué el bot eliminó un parámetro doi-access?

La obra ahora se considera de acceso cerrado en Unpaywall , por lo que ya no estamos seguros de que el DOI proporcione un PDF con el texto completo. Por lo general, esto sucede con las obras de acceso abierto (gratis, non-libre) de bronce , como las obras que se hicieron accesibles temporalmente en el punto álgido de la pandemia de COVID.

El estatus de las obras con una licencia Creative Commons libre o alojadas en un repositorio de acceso abierto tiende a ser más duradero.

¿Cómo puedo evitar que el bot elimine un enlace?

Como se mencionó anteriormente, el bot intenta evitar tocar citas que claramente ya proporcionan una copia de acceso abierto.

La mejor manera de garantizar que una cita siga vinculando su copia preferida es agregar un enlace directo a un PDF archivado o a un identificador de repositorio de acceso abierto. Por ejemplo, si proporciona un identificador de PubMed Central , {{ cite journal }} seguirá vinculando la copia de PMC, que suele ser una copia proporcionada por el editor de la versión publicada, incluso si cambia el parámetro doi-access.

Una copia proporcionada por el editor se puede vincular de forma más permanente añadiendo la URL de una versión preservada de Internet Archive , que a menudo se puede encontrar a través de una búsqueda en https://fatcat.wiki o una búsqueda de identificadores (o incluso una búsqueda en Google Scholar ): vea el ejemplo de edición . Si no hay una copia archivada disponible, pero el editor proporciona una copia con licencia Creative Commons , puede descargarla manualmente y archivarla en Zenodo (Dissemin se puede utilizar para esto; si carga directamente a Zenodo, no olvide utilizar el DOI del editor, de lo contrario Unpaywall no coincidirá con la copia), y vincular la copia de Zenodo en el parámetro URL.

¿Por qué el bot eliminó una URL?

La URL puede ser redundante con un parámetro identificador (por ejemplo, el DOI) o puede ser necesario eliminarla para proporcionar la copia de acceso abierto más conocida.

Muchas URL existentes deben eliminarse para poder seguir las recomendaciones de enlaces de conveniencia e indicadores de acceso para parámetros de almacenamiento de URL . En cientos de miles de casos, se agregó una URL redundante y de pago a {{ cite journal }} debido a un error en VisualEditor/Citoid (T232771) y no a una elección consciente de la persona que agregó la cita.

En otros casos, la URL puede haber cambiado, por ejemplo, porque un repositorio abierto cambió la estructura de la URL (y no podemos usar identificadores handle.net para él) o porque cambió la ubicación canónica (por ejemplo, una copia preservada por Internet Archive puede ser accesible desde múltiples URL en web.archive.org, archive.org o scholar.archive.org, así como bibliotecas asociadas como biodiversitylibrary.org).

¿Por qué la herramienta oabot realiza ediciones que el bot no realiza?

La herramienta oabot permite a los usuarios realizar ediciones que aún no están permitidas para que User:OAbot las ejecute automáticamente, como eliminar o agregar ciertos enlaces.

Soy editor. ¿Cómo puedo asegurarme de que OAbot reconozca mis textos completos?

Debes asegurarte de que

  • Cumple con las pautas de Google Scholar para exponer sus textos completos. En particular, la página de destino de los artículos que se pueden leer de forma gratuita debe contener la etiqueta meta citation_pdf_urlcon un enlace directo a un archivo PDF.
  • Zotero puede importar metadatos y el texto completo desde cualquier página de destino. Esto debería ser sencillo si cumples con las pautas de Google Scholar. De lo contrario, puedes arreglar el traductor de Zotero tú mismo enviando una solicitud de extracción a Zotero.

Además, también es útil asegurarse de que

  • Todas sus revistas de acceso totalmente abierto están registradas en DOAJ .
  • Los metadatos de CrossRef incluyen la licencia correcta para cada artículo: debería ser sencillo saber si el artículo se puede leer libremente simplemente mirando esta información.

Una vez que cumpla con estas pautas, el bot debería marcar sus DOI como de libre lectura en Wikipedia, con un candado verde:

  • Lambek, Joachim (1972), "Biconmutadores de inyectivas agradables", Journal of Algebra , 21 : 60–73, doi : 10.1016/0021-8693(72)90034-8 , ISSN  0021-8693, MR  0301052
  • Obtenga una interfaz OAI-PMH válida que debe ser recopilada por BASE
  • Cumpla con las pautas de Google Scholar para la exposición de sus textos completos. En particular, la página de destino de los artículos de lectura gratuita debe contener la etiqueta meta citation_pdf_urlcon un enlace directo a un archivo PDF.
  • Zotero debería poder recuperar metadatos y el texto completo de cualquier página de destino. Esto debería ser sencillo si cumples con las pautas de Google Scholar. De lo contrario, puedes arreglar el traductor de Zotero tú mismo enviando una solicitud de extracción a Zotero.

Soy investigador. ¿Cómo puedo asegurarme de que OAbot encuentre los textos completos de mis artículos?

Asegúrese de que todos sus artículos estén depositados en un repositorio maduro (que cumpla con las pautas anteriores), como Zenodo . Puede utilizar http://dissem.in/ para ello. Otros repositorios grandes, como PubMed Central , arXiv o HAL, también funcionarán. El repositorio debe brindar acceso gratuito al texto completo (no solo al resumen). No se consideran los registros con embargos en curso.

Por lo general, no se considerarán los textos completos almacenados en páginas de inicio personales.

El robot solo agrega un enlace, incluso si encuentra múltiples versiones alternativas. Por ejemplo, si OABOT encuentra una preimpresión en ArXiv y una posimpresión en un repositorio universitario, y un PDF en el sitio web del autor, entonces elige solo uno, según un algoritmo de clasificación en Dissemin.

¿Cómo se ve la cita?

Cuando se cambia el parámetro URL, la cita no tiene ningún texto adicional ni elementos gráficos, solo un enlace adicional.

¿Podemos señalar el tipo de versión (preimpresión, postimpresión, versión publicada)?

Por el momento, no. En la mayoría de los repositorios, estos metadatos simplemente no existen o no están bien conservados.

¿Cómo se puede localizar/globalizar el bot para que funcione en cualquier wiki?

El bot puede funcionar en cualquier wiki, pero está limitado por si utilizan o no las plantillas de citas CS1 y de la misma manera.

Casos extremos para el desarrollo futuro

OABot encontrará situaciones en las que ya existe una URL que no está abierta, pero el bot puede encontrar una versión de lectura gratuita. En algunos casos, podemos agregar el enlace secundario como identificador, pero hay casos extremos en los que necesitamos un consenso sobre dónde el comportamiento del bot es indeterminado:

  1. Cuando |url=coincide con un identificador existente:
    Digamos que tenemos |doi=10.1004/1543y |url=http://doi.org/10.1004/1543. ¿Podemos sobrescribirlo |url=para colocar allí un repositorio de lectura libre?
  2. Cuando no podemos hacer coincidir el |url=con un identificador existente pero OABot encuentra una versión del repositorio:
    Por ejemplo, si encontramos |url=http://www.sciencedirect.com/science/article/pii/S1535610816303981, no lo sobrescribiremos |url=automáticamente, pero nos gustaría agregar la URL del repositorio gratuito en otro lugar. Si las URL gratuitas que queremos agregar provienen de algunos repositorios, ¿es apropiado crear plantillas para estos repositorios específicos y agregarlas como ?|id={{my repository|12345}}

Próximos pasos

Recursos

  • Documentación del framework Pywikibot
  • wikiciteparser, un analizador de Python para plantillas de citas basado en mwparserfromhell
  • Wikicite: una forma de registrar y hacer un seguimiento de grupos de artículos relacionados

Ver también:

  • m:Investigación:Caracterización del uso de citas en Wikipedia
  • Estadísticas de esta página

Gente

Obtenido de "https://es.wikipedia.org/w/index.php?title=Wikipedia:OABOT&oldid=1222213442"