Hola, no soy un editor experimentado, aunque últimamente contribuí significativamente a la página de la tribu Zahran y me gustaría que revisaras la autenticidad de la plantilla que dice "Este artículo necesita citas adicionales para su verificación. Por favor, ayuda a mejorar este artículo agregando citas de fuentes confiables. El material sin fuentes puede ser cuestionado y eliminado". 144.86.34.230 (discusión) 05:03 24 may 2024 (UTC) [ responder ]
Hace diez años, te consideraban valiosa. Eso es lo que eres, siempre. -- Gerda Arendt ( discusión ) 09:37 2 ago 2024 (UTC) [ responder ]
@ Gerda Arendt : ¡Cómo pasa el tiempo! Gracias. -- John of Reading (discusión) 07:25 3 ago 2024 (UTC) [ responder ]
Ediciones de Wikipedia
Buenas noches, quería consultar sobre un problema que tengo. En esta cuenta (MarianoMora23) puedo mover artículos al espacio principal sin problema luego de apenas hacer 10 ediciones. Sin embargo en esta MISMA cuenta (MarianoMora23) pero en la wikipedia en ESPAÑOL tengo más de 20 ediciones y aún no puedo mover de mi sandbox al espacio principal. ¿Alguna idea de por qué? MarianoMora23 ( discusión ) 03:46 27 ago 2024 (UTC) [ responder ]
@MarianoMora23: Cada versión de Wikipedia establece sus propias reglas. En es:Ayuda:Cómo cambiar el nombre de una página, dice que tienes que ser autoconfirmado para mover una página; En es:Wikipedia:Autoconfirmados, dice que tienes que hacer 50 ediciones para ser autoconfirmado, a diferencia de solo 10 en la Wikipedia en inglés. - John of Reading (discusión) 06:45, 27 de agosto de 2024 (UTC) [ respuesta ]
¡Hola, Juan!
¿Te gusta corregir errores tipográficos? Tengo decenas de miles de errores tipográficos y no puedo corregirlos todos solo. ¿Quizás podamos combinar nuestras fuerzas? Usuario:Polygnotus/typos . Polygnotus ( discusión ) 16:21 8 sep 2024 (UTC) [ responder ]
@ Polygnotus : Interesante. Estoy encontrando errores tipográficos al ejecutar expresiones regulares en un volcado de base de datos. ¿Cómo estás creando tu lista de trabajo? ¿Cuál es tu tasa de falsos positivos?
Confieso que estoy tan acostumbrado a trabajar con AWB y mis más de 4000 expresiones regulares que es poco probable que cambie a un método radicalmente diferente. -- John of Reading (discusión) 16:47 8 sep 2024 (UTC) [ responder ]
Tomo una lista de las palabras más utilizadas, busco errores tipográficos con una distancia de Levenshtein de 1 y compruebo cuáles aparecen en el volcado. Luego hago una serie de filtros y compruebo cuáles existen en la versión en vivo de Wikipedia.
¿Con qué lenguajes de programación, si hay alguno, estás familiarizado?
Podríamos usar un módulo AWB personalizado en C# o quizás simplemente usar alguna herramienta personalizada basada en Selenium (que sería bastante similar, no radicalmente diferente). O quizás una interfaz similar a JWB en la wiki. Todavía no he decidido cómo abordar eso.
Nunca me molesté en crear estadísticas de la cantidad de saltos frente a la cantidad de correcciones, pero es una buena idea tenerla.
Utilizo muchas expresiones regulares para evitar errores tipográficos que no deberían corregirse, consulte Usuario:Polygnotus/typo.js .
Todavía tengo al menos 60.000 errores tipográficos potenciales por corregir, por lo que probablemente valga la pena crear una herramienta decente para eso.
@ Polygnotus : ¿Idiomas? Ensamblador, BCPL, C, C++; todos sin usar desde hace una década, me temo. Pero he usado expresiones regulares en una copia de User:Polygnotus/typos para extraer los más de 3000 nombres de artículos y los supuestos errores tipográficos, y he comenzado una ejecución de AWB para detectar esas palabras en esos artículos. Hasta ahora he guardado 23 ediciones y he omitido otros 25 artículos; no es una mala tasa de éxito, según mis estándares, así que seguiré con esto en los próximos días. "Gettig" es un apellido; "protectin" es un tipo de proteína; Supremme de Luxe es un nombre artístico; y así sucesivamente. -- John of Reading (discusión) 18:08, 8 de septiembre de 2024 (UTC) [ responder ]
Sí, son 3489 errores tipográficos y luego tenemos 2800 aquí, 9300 allá y 1200 aquí. Cuando mi Raspberry Pi esté lista, tendré otros ~60.000. Los errores tipográficos ya tienen expresiones regulares muy similares ejecutadas en ellos, como viste en typo.js, por lo que gran parte del material de WONTFIX ya se ha filtrado. Polygnotus ( discusión ) 18:15 8 sep 2024 (UTC) [ responder ]
En un mundo ideal, AWB aceptaría listas en este formato ( christmas|chirstmas|My Christmas ) como fuente de generación de listas. Y AWB contendría código (muy similar a typo.js ) para no corregir errores tipográficos en ciertas situaciones. ¿Sabes cómo podemos acercarnos a ese objetivo? WP:AWB enumera algunos desarrolladores en el cuadro de información. Polygnotus ( discusión ) 18:44 8 sep 2024 (UTC) [ responder ]
AWB tiene dos casillas de verificación en la parte superior izquierda de la configuración de "Buscar y reemplazar", que tienen como objetivo cubrir las "determinadas situaciones". Sin embargo, las desactivo para corregir errores en citas, referencias, texto en idioma extranjero, etc., con el debido cuidado y control. -- John of Reading (discusión) 18:50, 8 de septiembre de 2024 (UTC) [ responder ]
En algún momento creé con valentía el acceso directo WP:QUOTETYPO y aún no se ha revertido. Realmente no tiene sentido reproducir fielmente errores simples cometidos por otros cuando son irrelevantes y solo distraen, en mi opinión. Sin embargo, tu enfoque afecta la tasa de éxito. ¿Hay otras personas a las que debería contactar? Supongo que los 16789 errores tipográficos anteriores te mantendrán ocupado por un tiempo, pero sabes dónde encontrarme cuando quieras más. ¿Quizás debería pegar las listas en una subpágina de WP:TYPO ? Me sumergiré en el código AWB, gracias. Polygnotus ( discusión ) 19:40, 8 de septiembre de 2024 (UTC) [ responder ]
Si publicas tus enlaces en Wikipedia:Typo Team, es posible que atraigas a más ayudantes. Ah, ¿y conoces el proyecto Wikipedia:Typo Team/moss ? Es otro intento de verificación coordinada mediante técnicas de análisis de datos. -- John of Reading (discusión) 20:14 8 sep 2024 (UTC) [ responder ]
Gracias, se mejoró el objetivo de redireccionamiento. Combiné typolist, typolist2 y typolist3 anteriores (pero no User:Polygnotus/typos , que importó en AWB) en User:Polygnotus/Data/Typolist . Si desea alguno, elimínelo de la lista para que quede claro que se han manejado.
Agregué Moss y las casillas de verificación (código detrás de) AWB a mi lista de tareas pendientes, ¡gracias nuevamente! Polygnotus ( discusión ) 04:30 9 sep 2024 (UTC) [ responder ]
@ Polygnotus : He reiniciado la lista después de decirle a AWB que no ordene las páginas alfabéticamente, por lo que ahora las estoy procesando en el mismo orden en que estaban enumeradas en User:Polygnotus/typos . Esto lo hace más fácil para mí, ya que las correcciones para la misma palabra de destino aparecen juntas, y quizás para ti, ya que puedes comparar mi lista de contribuciones con la lista con la que estoy trabajando.
Dos de sus pruebas de "no arreglar" no funcionan correctamente:
En muchos casos, el error tipográfico está incrustado en una URL: ejemplo mmilleren Merle Miller
En algunos casos, el error tipográfico está incluido en el nombre de un archivo (por ejemplo, distribuionen Lesser blue-eared starling ). Los excluyo buscando un sufijo de imagen conocido ( (?![ \(\)\.\,\;\-\'\"\+\&\%\w\d]*\.(?i:(?:gif|jpe?g|ogg|ogv|pdf|png|svg|tiff?|webm))\b)sé que esta expresión regular no es perfecta).
-- John of Reading (discusión) 07:26 9 sep 2024 (UTC) [ responder ]
Hago las listas con Java y luego uso Javascript para hacer las modificaciones. Cuando mejoré la expresión regular de la URL en Javascript, olvidé agregarla también al código Java. Tenía un montón de ideas para mejorar mi flujo de trabajo, así que estoy preparando un nuevo lote para ti. Puede que lleve un tiempo, incluso en una PC moderna. Polygnotus ( discusión ) 03:33, 10 de septiembre de 2024 (UTC) [ responder ]
Originalmente lo usé ((http|https)://)(www.)?[-a-z0-9@:%._\+~#?&//=]{2,256}\.[-a-z]{2,26}\b([-a-z0-9@:%._\+~#?&//=]*)para URL, pero muchas de ellas escaparon a la ira de las expresiones regulares.
¿Las expresiones regulares de URL se ejecutan con la opción "ignorar mayúsculas y minúsculas" activada? Si no es así, la primera expresión regular de URL no coincide con toda la URL en el ejemplo de Merle Miller porque algunas partes de ella están en mayúsculas.
El nombre de archivo en el estornino orejiazul chico no tiene File:prefijo porque se está utilizando como parámetro de cuadro de información. Para excluirlos, tendrás que buscar hacia atrás range_map =o algo similar, o hacia adelante .pngo algo similar. -- John of Reading (discusión) 07:01 10 sep 2024 (UTC) [ responder ]
Uso Pattern.CASE_INSENSITIVEy Pattern.UNICODE_CASE. He añadido range_map a la lista de parámetros no permitidos. Actualmente estoy intentando averiguar si Ollama puede ayudar a identificar errores tipográficos mejor que lanzar una moneda al aire. Polygnotus ( discusión ) 07:47 10 sep 2024 (UTC) [ responder ]