Wikipedia:Enlace podrido

Cómo prevenir o reparar enlaces rotos

Al igual que la mayoría de los sitios web grandes , Wikipedia sufre el fenómeno conocido como "link rot" , donde los enlaces externos dejan de estar disponibles a medida que las páginas web vinculadas o sitios web completos desaparecen, cambian su contenido o se mueven sin redirección HTTP. Las URL tienen una vida útil media de aproximadamente 1 año.

La descomposición de enlaces supone un peligro importante para Wikipedia debido a la política de confiabilidad y las directrices de citación de fuentes .

En general, no elimine la información citada únicamente porque la URL de la fuente ya no funciona . Las herramientas, los procedimientos y los procesos están disponibles tal como se describe en este documento.

  • Página de inicio: PLRT

Archivado automático

Los enlaces añadidos por los editores al espacio principal de Wikipedia en inglés se guardan automáticamente en Wayback Machine en unas 24 horas (aunque en la práctica no todos los enlaces se guardan por diversas razones [ especificar ] ). Esto se hace con un programa llamado "NoMore404" que Internet Archive ejecuta y mantiene; se incluyen los sitios wiki de otros idiomas. Monitorea la API EventStreams, extrae nuevas URL externas y agrega una instantánea a Wayback. Este sistema se activó en algún momento después de 2015, aunque también se hicieron esfuerzos previos. Además, en algún momento después de 2012, archive.today (también conocido como archive.is) intentó archivar todos los enlaces externos que existían en Wikipedia en ese momento. Esto fue incompleto, pero se agregó una cantidad significativa de enlaces a archive.today durante este período, lo que lo convirtió en una importante fuente de archivo que llena los vacíos de cobertura. Archive.today todavía está realizando algunos archivos automatizados a partir de 2020, aunque se desconoce el alcance de la cobertura y la frecuencia.

Desde 2015, existe un bot y una herramienta de Wikipedia llamados WP:IABOT que automatizan la reparación de enlaces rotos. Se ejecuta de forma continua, verificando todos los artículos de Wikipedia para ver si un enlace está roto, agregando archivos a Wayback Machine (si aún no está allí) y reemplazando los enlaces rotos en el wikitexto con una versión archivada. Este bot se ejecuta automáticamente, pero también puede ser dirigido por los usuarios finales a través de su interfaz web. Está disponible al ver el historial de cualquier página, ubicado cerca de la parte superior de la página en la línea de "Herramientas externas", con la opción "Reparar enlaces rotos".

A partir de 2015, el bot periódico WP:WAYBACKMEDIC comprueba si hay enlaces dañados en los propios enlaces de los archivos. Las bases de datos de los archivos son dinámicas: los archivos se mueven o desaparecen, se añaden otros nuevos, etc. Este bot mantiene los enlaces de los archivos existentes en la Wikipedia en inglés. También archiva recursos a pedido en WP:URLREQ . Es una herramienta flexible que puede llevar a cabo muchos trabajos personalizados, como migración/movimiento de URL, dominios usurpados , descubrimiento y reparación de errores soft-404.

Archivado manual

Sugerencias sobre cómo mejorar manualmente el archivado:

  • Evite las URL simples . Utilice plantillas de citas como , por ejemplo, para las secciones de citas y enlaces externos.{{cite web}}{{webarchive}}
  • Utilice un servicio de archivo web como Internet Archive o Archive.today . Hay una lista completa disponible en WP:Lista de archivos web en Wikipedia . Dentro de las plantillas de citas, coloque la URL del archivo |archive-url=y agregue un |archive-date=. Si el enlace aún es válido, incluya |url-status=live; de lo contrario, configure |url-status=dead.
  • Para agregar más de una URL de archivo, como medida de seguridad adicional contra interrupciones del proveedor, se aceptan hasta 10 URL de proveedores de archivo. La opción produce una salida apropiada para el seguimiento de una plantilla CS1|2. Por ejemplo, mostrará 4 URL de archivo (una de la web de citas y tres del archivo web).{{webarchive}}|format=addlarchives{{cite web|archive-url=..}}{{webarchive|format=addlarchive|url1=..|url2=..|url3..}}
  • Si el enlace aún está activo pero aún no está archivado, visite el sitio web del servicio de archivo de su elección y solicite que se archive la página.
  • Ejecute WP:IABOT en las páginas a través de su interfaz de usuario.

Métodos alternativos

La mayoría de las plantillas de citas tienen un |quote=parámetro que se puede utilizar para almacenar citas textuales del material fuente. Esto se puede utilizar para almacenar una cantidad limitada de texto de la fuente dentro de la plantilla de citas. Esto es especialmente útil para fuentes que no se pueden archivar con servicios de archivo web. También puede proporcionar un seguro contra fallas del servicio de archivo web elegido. Almacenar el texto completo de la fuente no es apropiado según las políticas de uso justo , por lo que se deben elegir solo las partes más importantes del texto que más respalden las afirmaciones del artículo de Wikipedia. Cuando corresponda, los materiales de dominio público se pueden copiar a Wikisource .

Información de la página de discusión

Para indicar que todos los enlaces externos utilizados en un artículo se han archivado correctamente antes de la fecha de edición, puede agregar la plantilla en la parte superior de la página de discusión del artículo , que se muestra como:{{Archived reflist}}

Cuando un dominio en Internet caduca, cualquiera puede pagar por él y controlarlo. Algunas organizaciones buscan activamente estos dominios y los "usurpan" para crear sitios de spam y estafas. Para reparar un enlace externo a uno de estos sitios desde Wikipedia, elimine el enlace y reemplácelo con una versión archivada del original, como se describe en Wikipedia:Rotura de enlaces/Usurpaciones .

Existe un sistema automatizado para la usurpación de dominios completos. Consulte WP:URLREQ para registrar todos los enlaces de un dominio para su tratamiento por usurpación.

  • WP: ENLACE MUERTO

Existen varias formas de intentar reparar un enlace inactivo, que se detallan a continuación. En general, evite eliminar citas (o material citado) simplemente porque una URL ya no funciona, especialmente si la cita está formateada con otra información (como título, autor, fecha y nombre de la publicación) que podría usarse de manera alternativa para encontrar la fuente.

Búsqueda

Si el enlace muerto incluye suficiente información (título del artículo, nombres, etc.), a menudo es posible usarlo para encontrar la página web en una ubicación diferente, ya sea en el mismo sitio o en otro lugar.

A menudo, las páginas web simplemente se mueven dentro del mismo sitio. Un índice de sitio o una función de búsqueda específica del sitio es un lugar útil para localizar la página movida, buscando el título u otra información. Si estas herramientas no están disponibles, muchos motores de búsqueda de Internet permiten realizar una búsqueda en un sitio específico. Por ejemplo, con Google, agregue site:en.wikipedia.orga la cadena de búsqueda para buscar solo Wikipedia en inglés. En ocasiones, funciona cambiar http://a .https://

En caso contrario, al buscar en la Web el título de la página se pueden encontrar sitios alternativos. Al buscar en la Web los datos que la respaldan se puede encontrar una fuente diferente.

Si encuentra una nueva URL adecuada, puede editar los parámetros dentro de la cita. Si la cita utiliza una de las plantillas de cita comunes (por ejemplo , {{ cite web }} , {{ cite news }} , {{ Citation }} ), puede:

  • Cambie el |url=punto a la nueva URL;
  • Cambiar o agregar |access-date=para hacer referencia a la fecha actual.

Archivos de Internet

Busque versiones archivadas en uno de los muchos servicios de archivos web. Los "tres grandes" servicios de archivos son web.archive.org , webcitation.org y archive.today . Estos representan más del 90% de todos los archivos de Wikipedia, y web.archive.org representa más del 80% de todos los enlaces de archivos. Otros servicios de archivos se enumeran en WP:WEBARCHIVES . Hay complementos (extensiones) disponibles para la mayoría de los navegadores para buscar copias archivadas, con nombres como Resurrect pages .

La interfaz de Mementos permite buscar en varios servicios de archivo con una sola búsqueda. La base de datos de Mementos se almacena en caché, lo que significa que los resultados se obtienen rápidamente, pero la caché también se vuelve obsoleta y no se debe confiar en ella como la última palabra: a menudo informará incorrectamente que no hay archivos disponibles. Es posible que aún deba verificar sitios de archivo individuales, pero Mementos puede ser una primera verificación rápida.

Marcadores para comprobar los sitios de archivo comunes en busca de archivos de la página actual
(todos se abren en una nueva pestaña o ventana)
Sitio de archivoMarcador
Archivo.org
javascript : void ( ventana . open ( 'https://web.archive.org/web/*/' + ubicación . href ))
GWA del Reino Unido
javascript : void ( ventana.open ( ' https://webarchive.nationalarchives.gov.uk/ukgwa/*/ ' + ubicación.href ) )

Si hay varias fechas de archivo disponibles, utilice la que tenga más probabilidades de ser el contenido de la página que vio el editor que ingresó la referencia en el |access-date=. Si no se especifica ese parámetro, se puede realizar una búsqueda en el historial de revisión del artículo para determinar cuándo se agregó el enlace al artículo.

Consulta el archivo para verificar que contiene información válida sobre la página. Por lo general, es más probable que la información sea válida si la fecha es más próxima a la fecha en que se colocó el enlace en la página de Wikipedia o si es anterior.

Si encuentra una URL de archivo adecuada, puede agregarla a la cita. Si la cita utiliza una de las plantillas comunes (por ejemplo , {{ cite web }} , {{ cite news }} , {{ Citation }} ), puede editarla de la siguiente manera:

  • Déjelo |url=sin cambios, apuntando a la URL de origen.
  • Agregue |archive-url=, apuntando a la URL del archivo.
  • Agregue |archive-date=, especificando la fecha en la que se guardó la copia archivada. El formato AAAA-MM-DD suele ser el más fácil, pero se puede utilizar cualquier otro formato.
  • Agregue o cambie |url-status=. Utilícelo |url-status=deadsi la URL anterior no funciona. Utilice |url-status=unfito |url-status=usurpedsi la URL anterior ha sido usurpada con fines de spam, publicidad o no es adecuada por algún otro motivo (consulte WP:USURPURL ). Utilícelo |url-status=livesi |url=aún funciona y aún brinda la información correcta, pero desea agregar un |archive-url=.
  • Deje el archivo |access-date=sin modificar, haciendo referencia a la fecha en la que un editor anterior accedió por última vez al archivo |url=. Algunos editores creen |access-date=que debería eliminarse una vez que |archive-url=se establece un trabajo, ya que el archivo |url=ya no está disponible, ya que mantener un archivo |access-date=es un desorden redundante.
  • Página de inicio: MDLI

En ocasiones, todos los intentos de reparar el enlace serán infructuosos. En ese caso, considere buscar una fuente alternativa para que la pérdida del original no perjudique la verificabilidad del artículo. Las fuentes alternativas sobre temas generales suelen localizarse fácilmente. Una simple consulta en un motor de búsqueda puede localizar una alternativa adecuada, pero tenga mucho cuidado de no citar réplicas y bifurcaciones de la propia Wikipedia, lo que violaría Wikipedia:Verifiability .

En ocasiones, no es posible encontrar una fuente adecuada o se requieren técnicas de investigación más exhaustivas, como una visita a una biblioteca o el uso de una base de datos basada en suscripción. Si ese es el caso, considere consultar con los editores de Wikipedia en Wikipedia:WikiProject Resource Exchange , Wikipedia:Village pump o Wikipedia:Help desk . Además, considere ponerse en contacto con expertos u otros editores interesados ​​en un WikiProject relevante .

A veces, un enlace no funciona porque el sitio web ha cambiado la URL (por ejemplo, de http://example.com a http://example.co.uk). Si descubre un cambio de URL como este, envíe una solicitud a WP:URLREQ para cambiar la URL. Un robot realizará el cambio.

En general, el hecho de que una URL esté rota no significa que una fuente haya dejado de existir por completo, y una URL rota en una cita no significa que deba eliminarse . Consulte la guía en WP:DEADREF para saber cuándo es apropiado eliminar citas con enlaces rotos. Fundamentalmente, los libros, revistas, periódicos y otras fuentes impresas existen fuera de línea y continúan haciéndolo incluso si los sitios web dejan de funcionar o cambian de ubicación; la falta de una URL funcional para un libro no hace nada para disminuir su valor como fuente de contenido de Wikipedia. Los enlaces de conveniencia permanentemente inaccesibles para fuentes impresas se pueden eliminar, pero la referencia debe conservarse. Antes de eliminar una cita con una URL muerta, considere si sería posible rastrear la fuente sin usar la URL en absoluto; si es así, probablemente debería conservarse.

  • WP:KDL

Una URL de una fuente muerta y no archivada puede seguir siendo útil. Un enlace de este tipo indica que la información era (probablemente) verificable en el pasado y que el enlace podría proporcionar a otro usuario mayores recursos o experiencia con suficiente información para encontrar la referencia. También podría volver de la nada. Con un enlace muerto, es posible determinar si se ha citado en otro lugar o ponerse en contacto con la persona originalmente responsable de la fuente. Por ejemplo, uno podría ponerse en contacto con el departamento de Ciencias de la Computación de Yale si http://www.cs.yale.edu/~EliYale/Defense-in-Depth-PhD-thesis.pdf [ enlace muerto ] estuviera muerto.

Coloca {{ dead link |date=October 2024}} después de la cita inactiva, inmediatamente antes de la </ref>etiqueta si corresponde, dejando intacto el enlace original. Marcar enlaces inactivos indica a los editores y a los robots de eliminación de enlaces que este enlace debe reemplazarse con un enlace de archivo. Colocar {{ dead link }} también categoriza automáticamente el artículo en la categoría de proyecto Artículos con enlaces externos inactivos y en la categoría de rango de fechas mensual específico según |date=el parámetro. No elimines una cita solo porque ha estado etiquetada con {{ dead link }} durante mucho tiempo.

  • WP:ROTACIÓN EXTERNA

Los sitios que no pertenecen a Wikimedia también son susceptibles a la pérdida de enlaces. Después de mover o eliminar una página , los enlaces a páginas de Wikipedia desde otros sitios web pueden romperse. En la mayoría de los casos, la redirección permanecerá en la página anterior, lo que no causará ningún problema. Pero si una página se elimina por completo o se usurpa (es decir, se reemplaza con otro contenido), se habrá producido la pérdida de enlaces en cualquier sitio web externo que enlace a ella.

El reemplazo del contenido de una página con una página de desambiguación puede causar la pérdida de enlaces, pero es menos perjudicial porque una página de desambiguación es esencialmente un tipo de redirección suave que llevará al lector al contenido requerido. Si una página es usurpada con contenido de otro tema que comparte su nombre, se puede colocar una nota al principio que dirija a los lectores al contenido original en su nueva página; esto también es un tipo de redirección suave, pero menos obvio. En estos casos, los lectores que llegan desde un enlace externo dañado deberían poder encontrar lo que están buscando, pero es mejor evitar la situación ya que tendrían que llegar allí a través de una página adicional, lo que podría dar una mala impresión tanto de Wikipedia como del sitio web que enlaza.

Como el software de Wikipedia no almacena Refererinformación , será imposible saber cuántas páginas web externas se verán afectadas por un movimiento o eliminación, pero el riesgo de pérdida de enlaces probablemente será mayor en las páginas más antiguas y de mayor perfil. En verdad, no hay mucho que se pueda hacer; el mantenimiento de sitios web que no sean de Wikimedia no está dentro del alcance de ser un Wikimediano, ni en la mayoría de los casos dentro de nuestra capacidad (aunque si se pueden arreglar, sería útil hacerlo). Sin embargo, puede ser una buena práctica pensar en el impacto potencial en otros sitios al eliminar o mover páginas de Wikipedia, especialmente si no quedará ninguna redirección o nota de sombrero. Si se espera que un movimiento o eliminación cause un daño significativo, entonces este podría ser un factor a considerar en las discusiones de WP:RM , WP:AFD y WP:RFD , aunque otros factores pueden tener más peso.

Glosario

Glosario de términos y conceptos.

  • Beyond-404 . Conceptualmente y de manera ideal, cada enlace que esté inactivo devolverá un código de estado 404. En la naturaleza de Internet, muchas páginas que están "inactivas" pueden devolver otros códigos. Este es el reino beyond-404, y a menudo requiere herramientas especiales y conocimiento previo para detectarlo y solucionarlo. Puede representar el 30% o más de todos los enlaces inoperativos. Algunos de los tipos beyond-404 se describen en este glosario. Los enlaces pueden ser una combinación de tipos, por ejemplo, una URL que sea: Soft-redirect --> Soft-404 --> Redirect --> Destination.
  • Bloqueador de bots . Cualquier tipo de mecanismo que impida que las herramientas automatizadas detecten el estado de una página. Los más comunes son CloudFlare, los limitadores de velocidad y los bloqueadores de IP. Los bloqueadores de bots pueden provocar errores 404 falsos.
  • Hard-404 o enlace inactivo . Una página que devuelve el código de estado 404, un enlace inactivo.
  • Soft-404 . Una URL que redirecciona a una página con contenido diferente al original. Por ejemplo, https://example.com/page1.html redirecciona a https://example.com/home.html (redireccionamiento a la página de inicio). Los Soft-404 pueden ser ocupantes de nombres de dominio, páginas en blanco, sitios de spam, bloqueadores de bots, limitadores de velocidad... las posibilidades son infinitas. Este es el tipo más común de enlace inactivo "Beyond 404". Conceptualmente, la página no devuelve 404, pero tampoco devuelve el contenido previsto, en efecto es un 404 y, por lo tanto, "soft". Los métodos de detección de Soft-404 incluyen conocimiento previo, la URL de redireccionamiento, el título de la página y el contenido de la página.
  • Crunchy-404 . Una URL que se encuentra en algún punto intermedio entre Soft-404 y Hard-404. El contenido es diferente al de la página original, pero aún tiene contenido relevante para la original. Según la información que busque el lector, podría considerarse un enlace inactivo o un enlace activo, en relación con el espectador.
  • Redirigir . Una URL que redirecciona automáticamente a otra página.
  • Redireccionamiento suave . Una URL que parece no funcionar (404), pero que existe en la web activa en una URL diferente, es decir, le falta un redireccionamiento. Este es un corolario de un error 404 suave.
  • Soft-200 o Falso 404. Una URL que parece estar inactiva pero en realidad está activa. Esto puede deberse a bloqueadores de bots o a una configuración incorrecta.
  • Redireccionamiento fantasma . Enlace de redireccionamiento dañado. Por ejemplo, se eliminó un encabezado 301 y se convirtió en 404, pero la información anterior sobre el 301 aún se conserva en Wayback Machine. Resulta útil para descubrir información de redireccionamiento que ya no está disponible en la web. Consulte también el repositorio Ghostredir.
  • Movimiento (o migración ) de URL . Cuando se mueve una URL de un esquema a otro, por ejemplo, migrando https://example.com/main.html a https://arthur.com/main.html, el sitio remoto cambió de nombre de dominio. La mayoría de las veces, los sitios dejarán atrás algunas de las URL antiguas y no las migrarán todas, por lo general se convierten en errores 404 y redirecciones suaves. Al realizar un movimiento de URL en Wikipedia, es imperativo verificar que la nueva URL funcione. Cuando no es posible verificarlo (como con un bloqueador de bots), esto se denomina "movimiento de URL a ciegas".
  • Desviación de contenido . Cuando el contenido de una URL estática cambia con el tiempo. Por ejemplo, las clasificaciones de los equipos en https://espn.com/mlb/rangers/standings.html cambian semanalmente. Los datos meteorológicos y financieros son otros ejemplos clásicos. Aunque la URL puede estar activa, funcionalmente está inactiva, la página ya no muestra el contenido deseado, es una variedad de error 404 suave.

Véase también

Ensayos

Herramientas y guías prácticas

Bots

  • InternetArchiveBot (IABot): repara automáticamente los enlaces inactivos siempre que sea posible y los etiqueta cuando no es posible.
  • WaybackMedic : corrige automáticamente los enlaces rotos que son difíciles de determinar y otras correcciones generales.
  • Usuario: Legobot : puede etiquetar enlaces en masa con . Las solicitudes se pueden realizar en User talk: Legoktm .{{dead link}}

  • Complemento oficial de Wayback para Firefox y Chrome [nota 1]
  • Resurrect Pages, una herramienta complementaria de terceros, proporciona enlaces a siete sitios web de caché/archivo cuando encuentra un enlace inactivo. (Firefox)
  • Webcache, complemento para Opera. (descontinuado; hay complementos similares más nuevos disponibles)
  • weblinkchecker.py: script de la colección Python Wikipedia Bot que encuentra enlaces externos rotos.
  • Link-dispenser es una herramienta de Toolforge que identifica enlaces muertos en las citas
  • Backlink Checker, para buscar enlaces potencialmente dañados en sitios que no son de Wikimedia
  • "Algunas URL son inmortales, la mayoría son efímeras", análisis detallado de la vida útil de las URL

Notas

  1. ^ "Guardar páginas en Wayback Machine". Centro de ayuda de Internet Archive . 24 de agosto de 2018.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Wikipedia:Link_rot&oldid=1247327399"