ISO 639-3

Norma internacional para códigos de tres letras que identifican idiomas

La norma ISO 639-3:2007 , Códigos para la representación de nombres de idiomas – Parte 3: Código alfa-3 para una cobertura completa de idiomas , es una norma internacional para códigos de idiomas de la serie ISO 639. Define códigos de tres letras para identificar idiomas. La norma fue publicada por la Organización Internacional de Normalización (ISO) el 1 de febrero de 2007. [1]

La norma ISO 639-3 amplía los códigos alfa-3 de la norma ISO 639-2 con el objetivo de cubrir todos los idiomas naturales conocidos . La cobertura extendida de los idiomas se basó principalmente en los códigos de idiomas utilizados en el Ethnologue (volúmenes 10-14) publicado por SIL International , que ahora es la autoridad de registro de la norma ISO 639-3. [2] Proporciona una enumeración de idiomas lo más completa posible, incluyendo los idiomas vivos y extintos, antiguos y construidos, mayores y menores, escritos y no escritos. [1] Sin embargo, no incluye idiomas reconstruidos como el protoindoeuropeo . [3]

La norma ISO 639-3 está destinada a utilizarse como código de metadatos en una amplia gama de aplicaciones. Se utiliza ampliamente en sistemas informáticos y de información, como Internet, en los que es necesario admitir muchos idiomas. En archivos y otros sistemas de almacenamiento de información, se utiliza en sistemas de catalogación, indicando en qué idioma se encuentra o trata un recurso. Los códigos también se utilizan con frecuencia en la literatura lingüística y en otros ámbitos para compensar el hecho de que los nombres de los idiomas pueden ser confusos o ambiguos.

Encuentra un idioma
Introduzca un código ISO 639-3 para encontrar el artículo del idioma correspondiente.

Códigos de idioma

La norma ISO 639-3 incluye todos los idiomas de la norma ISO 639-1 y todos los idiomas individuales de la norma ISO 639-2 . La norma ISO 639-1 y la norma ISO 639-2 se centran en los idiomas principales, los más representados en el conjunto de la literatura mundial. Dado que la norma ISO 639-2 también incluye colecciones de idiomas y la Parte 3 no, la norma ISO 639-3 no es un superconjunto de la norma ISO 639-2. Cuando existen códigos B y T en la norma ISO 639-2, la norma ISO 639-3 utiliza los códigos T.

Ejemplos de códigos de idioma ISO
Idioma639-1639-2 (T/B)Tipo 639-3Código 639-3
Inglésesesindividuales
Francésdelibre/fraindividualde
AlemánDelawarealemán/alemánindividualDios
árabeArkansasaramacroara
Árabe estándarindividualarbitraje
Masriindividualarzobispo
ShamiindividualAPC (Aparato de protección personal)
Gilit árabeindividualACM-ACM-ACM
Chinoeschi/zho [4] [5]macroZho
mandarínindividualcmn
Cantonésindividualay
Minuto Surindividualyaya
Tailandia centralElEsoindividualEso
Tailandia del Surindividualalma
Tailandia del norteindividualasentir
AzulindividualKHB-1
Laosiano / IsánloLaosianoindividuallao/t
Phu tailandésindividualfoto

Al 23 de enero de 2023 [actualizar], el estándar contiene 7916 entradas. [6] El inventario de idiomas se basa en varias fuentes, incluidas: los idiomas individuales contenidos en 639-2, idiomas modernos del Ethnologue , variedades históricas, idiomas antiguos y idiomas artificiales de la Linguist List , [7] así como los idiomas recomendados dentro del período anual de comentarios públicos.

La autoridad de registro proporciona archivos de datos legibles por máquina . [6] Se pueden realizar asignaciones de ISO 639-1 o ISO 639-2 a ISO 639-3 utilizando estos archivos de datos.

La norma ISO 639-3 pretende suponer distinciones basadas en criterios que no son completamente objetivos. [8] No pretende documentar ni proporcionar identificadores para dialectos u otras variaciones de subidiomas. [9] Sin embargo, los juicios sobre distinciones entre idiomas pueden ser subjetivos, en particular en el caso de variedades lingüísticas sin tradiciones literarias establecidas, uso en la educación o los medios de comunicación u otros factores que contribuyen a la convencionalización lingüística. Por lo tanto, la norma no debe considerarse como una declaración autorizada de qué idiomas distintos existen en el mundo (sobre lo cual puede haber un desacuerdo sustancial en algunos casos), sino simplemente como una forma útil de identificar diferentes variedades lingüísticas con precisión.

Espacio de código

Dado que el código es un alfabeto de tres letras, un límite superior para la cantidad de idiomas que se pueden representar es 26 × 26 × 26 = 17 576. Dado que la norma ISO 639-2 define códigos especiales (4), un rango reservado (520) y códigos exclusivos de B (22), no se pueden utilizar códigos 546 en la parte 3. Por lo tanto, un límite superior más estricto es 17 576 − 546 = 17 030.

El límite superior se vuelve aún más estricto si se restan las colecciones de idiomas definidas en 639-2 y las que aún deben definirse en ISO 639-5 .

Macrolenguajes

Hay 58 idiomas en la norma ISO 639-2 que se consideran, para los fines de la norma, como "macroidiomas" en la norma ISO 639-3. [10]

Algunos de estos macrolenguajes no tenían un idioma individual según lo definido por la norma ISO 639-3 en el conjunto de códigos de la norma ISO 639-2, por ejemplo, "ara" (árabe genérico). Otros, como "nor" (noruego), tenían sus dos partes individuales ("nno" ( nynorsk ), "nob" ( bokmål )) ya en la norma ISO 639-2.

Esto significa que algunos idiomas (por ejemplo, 'arb', árabe estándar) que la norma ISO 639-2 consideraba dialectos de un idioma ('ara') ahora la norma ISO 639-3 los considera, en ciertos contextos, idiomas individuales en sí mismos.

Se trata de un intento de abordar variedades que pueden ser lingüísticamente distintas entre sí, pero que son tratadas por sus hablantes como dos formas de la misma lengua, por ejemplo en los casos de diglosia .

Por ejemplo:

  • ara | ISO 639-3 (árabe genérico, 639-2)
  • arb | ISO 639-3 (Norma árabe, 639-3)

Una lista completa está disponible en el sitio web del registrador ISO 639-3. [11]

Lenguas colectivas

"Un elemento de código de idioma colectivo es un identificador que representa un grupo de idiomas individuales que no se consideran un solo idioma en ningún contexto de uso". [12] Estos códigos no representan con precisión un idioma o macroidioma en particular.

Si bien la norma ISO 639-2 incluye identificadores de tres letras para idiomas colectivos, estos códigos están excluidos de la norma ISO 639-3. Por lo tanto, la norma ISO 639-3 no es un superconjunto de la norma ISO 639-2.

La norma ISO 639-5 define códigos colectivos de tres letras para familias y grupos de idiomas, incluidos los códigos colectivos de idiomas de la norma ISO 639-2.

Códigos especiales

En las normas ISO 639-2 e ISO 639-3 se reservan cuatro códigos para los casos en los que ninguno de los códigos específicos es adecuado. Estos están destinados principalmente a aplicaciones como bases de datos en las que se requiere un código ISO independientemente de si existe o no.

  • mis(idiomas no codificados, originalmente una abreviatura de 'misceláneos') está destinado a idiomas que (aún) no han sido incluidos en el estándar ISO.
  • mul(varios idiomas) está pensado para casos donde los datos incluyen más de un idioma y (por ejemplo) la base de datos requiere un único código ISO.
  • und(indeterminado) está pensado para casos en los que no se ha identificado el idioma de los datos, como cuando está mal etiquetado o nunca se lo ha etiquetado. No está pensado para casos como el de Trojan , en el que se le ha dado un nombre a un idioma no certificado.
  • zxx(sin contenido lingüístico / no aplicable) está destinado a datos que no son un lenguaje en absoluto, como por ejemplo llamadas de animales. [13]

Además, 520 códigos en el rango qaaqtzestán 'reservados para uso local'. Por ejemplo, Rebecca Bettencourt asigna un código a las lenguas construidas y se realizan nuevas asignaciones a pedido. [14] Linguist List los usa para las lenguas extintas . Linguist List le ha asignado a uno de ellos un valor genérico: qnp, protolengua sin nombre. Esto se usa para los nodos intermedios propuestos en un árbol genealógico que no tienen nombre.

Procesos de mantenimiento

La tabla de códigos de la norma ISO 639-3 está abierta a modificaciones. Para proteger la estabilidad del uso actual, los cambios permitidos se limitan a: [15]

  • modificaciones a la información de referencia de una entrada (incluidos nombres o categorizaciones por tipo y alcance),
  • adición de nuevas entradas,
  • Desestimación de entradas duplicadas o espurias,
  • fusionar una o más entradas en otra entrada, y
  • dividir una entrada de idioma existente en varias entradas de idioma nuevas.

El código asignado a un idioma no cambia a menos que haya también un cambio en la denotación. [16]

Los cambios se realizan anualmente. Cada solicitud tiene un período mínimo de tres meses para su revisión pública.

El sitio web de la norma ISO 639-3 tiene páginas que describen los "alcances de denotación" [17] (tipos de lenguajes) y los tipos de lenguajes [18] , que explican qué conceptos están dentro del alcance de la codificación y determinados criterios que deben cumplirse. Por ejemplo, los lenguajes construidos pueden codificarse, pero sólo si están diseñados para la comunicación humana y cuentan con un cuerpo de literatura, lo que evita las solicitudes de invenciones idiosincrásicas.

La autoridad de registro documenta en su sitio web las instrucciones realizadas en el texto de la norma ISO 639-3 respecto de cómo deben mantenerse las tablas de códigos. [19] También documenta los procesos utilizados para recibir y procesar las solicitudes de cambio. [20]

Se proporciona un formulario de solicitud de cambio y hay un segundo formulario para recopilar información sobre las adiciones propuestas. Cualquier parte puede presentar solicitudes de cambio. Una vez presentadas, las solicitudes son revisadas inicialmente por la autoridad de registro para verificar que estén completas.

Cuando se recibe una solicitud completamente documentada, se agrega a un índice de solicitudes de cambio publicado. Además, se envían anuncios a la lista de discusión general de LINGUIST en Linguist List y a otras listas que la autoridad de registro puede considerar relevantes, invitando al público a revisar y aportar comentarios sobre el cambio solicitado. Cualquier propietario de una lista o individuo puede solicitar notificaciones de solicitudes de cambio para regiones o familias lingüísticas específicas. Los comentarios que se reciben se publican para que otras partes los revisen. Según el consenso en los comentarios recibidos, una solicitud de cambio puede retirarse o promoverse a "estado de candidato".

Tres meses antes de que finalice el ciclo de revisión anual (normalmente en septiembre), se envía un anuncio a la lista de discusión de LINGUIST y a otras listas sobre las solicitudes de cambio de estado de los candidatos. Todas las solicitudes permanecen abiertas para su revisión y comentarios hasta el final del ciclo de revisión anual.

Las decisiones se anuncian al final del ciclo de revisión anual (normalmente en enero). En ese momento, las solicitudes pueden ser adoptadas en su totalidad o en parte, modificadas y trasladadas al siguiente ciclo de revisión, o rechazadas. Los rechazos suelen incluir sugerencias sobre cómo modificar las propuestas para volver a presentarlas. Se mantiene un archivo público de cada solicitud de cambio junto con las decisiones adoptadas y la justificación de las mismas. [21]

Crítica

Los lingüistas Morey, Post y Friedman plantean diversas críticas a la norma ISO 639, y en particular a la ISO 639-3: [16]

  • Los códigos de tres letras son problemáticos, porque, si bien oficialmente son etiquetas técnicas arbitrarias, a menudo se derivan de abreviaturas mnemotécnicas de nombres de idiomas, algunos de los cuales son peyorativos. Por ejemplo, a Yemsa se le asignó el código jnj, del peyorativo "Janejero". Por lo tanto, estos códigos pueden ser considerados ofensivos por los hablantes nativos. Sin embargo, los códigos se pueden cambiar mediante una solicitud en el sitio web de SIL.
  • La administración de la norma es problemática porque SIL es una organización misionera con una transparencia y una rendición de cuentas inadecuadas. Las decisiones sobre qué merece ser codificado como idioma se toman internamente. Si bien las aportaciones externas pueden ser bien recibidas o no, las decisiones en sí mismas son opacas y muchos lingüistas han desistido de intentar mejorar la norma.
  • La identificación permanente de una lengua es incompatible con el cambio de lengua.
  • A menudo no es posible distinguir con rigor las lenguas y los dialectos, y los continuos dialectales pueden subdividirse de muchas maneras, mientras que el estándar privilegia una opción. Esas distinciones suelen basarse en factores sociales y políticos.
  • La norma ISO 639-3 puede ser malinterpretada y mal utilizada por las autoridades que toman decisiones sobre la identidad y la lengua de las personas, eliminando así el derecho de los hablantes a identificarse con su variedad de habla. Aunque SIL es sensible a estas cuestiones, este problema es inherente a la naturaleza de una norma establecida, que puede utilizarse (o mal utilizada) de maneras que la ISO y SIL no pretenden.

Martin Haspelmath está de acuerdo con cuatro de estos puntos, pero no con el punto sobre el cambio de idioma. [22] No está de acuerdo porque cualquier descripción de un idioma requiere identificarlo, y podemos identificar fácilmente diferentes etapas de un idioma. Sugiere que los lingüistas pueden preferir usar una codificación que se realiza a nivel lingüístico ya que "rara vez les importa a los lingüistas si de lo que están hablando es un idioma, un dialecto o una familia de idiomas muy unida". También cuestiona si una norma ISO para la identificación de idiomas es apropiada ya que la ISO es una organización industrial, mientras que él ve la documentación y nomenclatura de idiomas como un esfuerzo científico. Cita la necesidad original de identificadores de idiomas estandarizados como "la importancia económica de la traducción y la localización de software ", para cuyos fines se establecieron las normas ISO 639-1 y 639-2. Pero plantea dudas sobre la necesidad de la industria de una cobertura tan amplia como la que ofrece la norma ISO 639-3, ya que incluye "lenguas poco conocidas de pequeñas comunidades que nunca o casi nunca se usan por escrito y que a menudo están en peligro de extinción".

Uso

  • Etnólogo
  • Lista de lingüistas
  • OLAC : la comunidad de archivos de idiomas abiertos [23]
  • Microsoft Windows 8 : [24] Admite todos los códigos en ISO 639-3 en el momento del lanzamiento.
  • Fundación Wikimedia: Los nuevos proyectos basados ​​en idiomas (por ejemplo, Wikipedias en nuevos idiomas) deben tener un identificador de ISO 639-1, -2 o -3. [25]
  • Otras normas que se basan en la ISO 639-3:
    • Etiquetas de idioma según lo define el Grupo de trabajo de ingeniería de Internet (IETF), como se documenta en:
      • BCP 47: Mejores prácticas actuales 47 , [26] que incluye RFC 5646
      • RFC 5646, que reemplazó a RFC 4646, que reemplazó a RFC 3066. (Por lo tanto, todos los estándares que dependen de cualquiera de estos 3 estándares IETF ahora utilizan ISO 639-3).
    • El estándar ePub 3.0 para metadatos de idiomas [27] utiliza elementos de metadatos Dublin Core. Estos elementos de metadatos de idiomas en los ePubs deben contener códigos RFC 5646 válidos para idiomas. [27] El RFC 5646 apunta a ISO 639-3 para idiomas sin códigos IANA más cortos.
    • Iniciativa de metadatos Dublin Core : término de metadatos DCMI [28] para lenguaje, a través del RFC 4646 de IETF (ahora reemplazado por el RFC 5646).
    • Autoridad de Números Asignados en Internet (IANA) El esfuerzo de internacionalización del W3C recomienda el uso del Registro de Subetiquetas de Idioma de la IANA para seleccionar códigos para idiomas. [29] El Registro de Subetiquetas de Idioma de la IANA [30] depende de los códigos ISO 639-3 para idiomas que anteriormente no tenían códigos en otras partes del estándar ISO 639.
    • HTML5: [31] a través del BCP 47 de IETF.
    • XML: [32] a través del BCP 47 de IETF.
    • SVG: [33] a través del BCP 47 de IETF.
    • Códigos de biblioteca MODS : [34] Incorpora el RFC 3066 de IETF (ahora reemplazado por el RFC 5646).
    • Iniciativa de codificación de texto (TEI): [35] a través del BCP 47 del IETF.
    • Marco de marcado léxico : especificación ISO para la representación de diccionarios legibles por máquina.
    • Repositorio de datos de configuración regional común de Unicode : utiliza varios cientos de códigos de ISO 639-3 no incluidos en ISO 639-2.

Referencias

  1. ^ ab «Estado y resumen de la norma ISO 639-3». Organización Internacional de Normalización. 20 de julio de 2010. Archivado desde el original el 14 de enero de 2012. Consultado el 14 de junio de 2012 .
  2. ^ "Agencias de mantenimiento y autoridades de registro". ISO. Archivado desde el original el 8 de octubre de 2012. Consultado el 12 de enero de 2014 .
  3. ^ "Tipos de lenguas individuales – Lenguas antiguas". SIL International . Archivado desde el original el 12 de junio de 2018. Consultado el 11 de junio de 2018 .
  4. ^ "Informe de Ethnologue sobre el código ISO 639: zho". Ethnologue . Archivado desde el original el 12 de septiembre de 2014.
  5. ^ "ISO 639-3". SIL International . Archivado desde el original el 24 de febrero de 2013. Consultado el 12 de septiembre de 2014 .
  6. ^ ab «Conjunto de códigos ISO 639-3». SIL International . 18 de febrero de 2021. Archivado desde el original el 1 de abril de 2018 . Consultado el 7 de abril de 2021 .
  7. ^ "ISO 639-3". SIL International . Archivado desde el original el 15 de mayo de 2014. Consultado el 18 de mayo de 2014 .
  8. ^ "Alcance de la denotación: idiomas individuales". SIL International . Archivado desde el original el 20 de octubre de 2014. Consultado el 18 de mayo de 2014 .
  9. ^ "Alcance de la denotación: dialectos". SIL International . Archivado desde el original el 20 de octubre de 2014. Consultado el 18 de mayo de 2014 .
  10. ^ "Ámbito de la denotación: Macrolenguajes". SIL International . Archivado desde el original el 8 de febrero de 2013. Consultado el 14 de junio de 2012 .
  11. ^ "Mapeos de macrolenguajes". SIL International . Archivado desde el original el 11 de octubre de 2020. Consultado el 2 de noviembre de 2021 .
  12. ^ "Ámbito de la denotación: Lenguas colectivas". SIL Internacional . Archivado desde el original el 8 de febrero de 2013. Consultado el 14 de junio de 2012 .
  13. ^ "Grabaciones de campo de llamadas de monos vervet". Consorcio de Datos Lingüísticos . Archivado desde el original el 15 de enero de 2023. Consultado el 15 de enero de 2023 .
  14. ^ Bettencourt, Rebecca. «Registro de código ConLang». KreativeKorp . Archivado desde el original el 8 de octubre de 2023. Consultado el 12 de marzo de 2021 .
  15. ^ "Presentación de solicitudes de cambio según la norma ISO 639-3: tipos de cambios". SIL International . Archivado desde el original el 2 de febrero de 2016. Consultado el 21 de mayo de 2014 .
  16. ^ ab Morey, Stephen; Post, Mark W.; Friedman, Victor A. (2013). Los códigos de lenguaje de la norma ISO 639: una estandarización prematura, en última instancia inalcanzable y posiblemente dañina. Conferencia RRR de PARADISEC. Archivado desde el original el 23 de febrero de 2016. Consultado el 3 de noviembre de 2015 .
  17. ^ "Alcance de la denotación para los identificadores de lenguaje". SIL International . Archivado desde el original el 20 de octubre de 2014. Consultado el 18 de mayo de 2014 .
  18. ^ "Tipos de lenguajes". SIL International . Archivado desde el original el 23 de febrero de 2016. Consultado el 21 de mayo de 2014 .
  19. ^ "Gestión del cambio según la norma ISO 639-3". SIL International . Archivado desde el original el 14 de mayo de 2016. Consultado el 18 de mayo de 2014 .
  20. ^ "Envío de solicitudes de cambio de la norma ISO 639-3". SIL International . Archivado desde el original el 2 de febrero de 2016. Consultado el 21 de mayo de 2014 .
  21. ^ "Índice de solicitud de cambio ISO 639-3". SIL International . Archivado desde el original el 29 de enero de 2016. Consultado el 20 de mayo de 2014 .
  22. ^ Haspelmath, Martin (4 de diciembre de 2013). "¿Se puede estandarizar la identidad lingüística? Sobre la crítica de Morey et al. a la norma ISO 639-3". Comentario sobre lingüística de la diversidad . doi :10.58079/nsst. Archivado desde el original el 19 de abril de 2014. Consultado el 18 de abril de 2014 .
  23. ^ "OLAC Language Extension". language-archives.org . Archivado desde el original el 16 de mayo de 2015 . Consultado el 3 de agosto de 2015 .
  24. ^ "Más de 7000 idiomas, solo un Windows". Microsoft. 5 de febrero de 2014. Archivado desde el original el 3 de marzo de 2024. Consultado el 3 de marzo de 2024 .
  25. ^ "Política de propuestas lingüísticas". wikimedia.org . Archivado desde el original el 13 de julio de 2015. Consultado el 3 de agosto de 2015 .
  26. ^ "BCP 47 – Etiquetas para identificar idiomas". ietf.org . Archivado desde el original el 9 de marzo de 2018 . Consultado el 3 de agosto de 2015 .
  27. ^ ab «EPUB Publications 3.0». idpf.org . Archivado desde el original el 2 de agosto de 2015. Consultado el 3 de agosto de 2015 .
  28. ^ "Términos de metadatos de DCMI". purl.org . Archivado desde el original el 7 de diciembre de 2023 . Consultado el 3 de agosto de 2015 .
  29. ^ "Códigos de idioma ISO de dos o tres letras". W3C . Archivado desde el original el 8 de agosto de 2015 . Consultado el 3 de agosto de 2015 .
  30. ^ "Registro de idiomas". Autoridad de Números Asignados en Internet. Archivado desde el original el 12 de noviembre de 2017. Consultado el 12 de agosto de 2015 .
  31. ^ "Semántica, estructura y API de documentos HTML — HTML5". W3C . Archivado desde el original el 6 de junio de 2015 . Consultado el 3 de agosto de 2015 .
  32. ^ "Lenguaje de marcado extensible (XML) 1.0 (quinta edición)". W3C . Archivado desde el original el 25 de diciembre de 2021 . Consultado el 3 de septiembre de 2022 .
  33. ^ "Gráficos vectoriales escalables (SVG) 2". W3C . Consultado el 3 de septiembre de 2022 .
  34. ^ "Elementos – Pautas para el usuario de MODS: Esquema de descripción de objetos de metadatos: MODS". Biblioteca del Congreso . Archivado desde el original el 22 de agosto de 2015. Consultado el 3 de agosto de 2015 .
  35. ^ "Lenguaje de elementos TEI". Iniciativa de codificación de texto . Archivado desde el original el 14 de septiembre de 2015. Consultado el 3 de agosto de 2015 .

Lectura adicional

  • Aristar, Anthony (2006). "Códigos lingüísticos estandarizados ISO y Ethnologue" (PDF) . Boletín SSILA . 247 . Archivado desde el original (PDF) el 20 de mayo de 2014.
  • Dobrin, Lise M.; Good, Jeff (2009). "Desarrollo práctico del lenguaje: ¿de quién es la misión?" (PDF) . Lenguaje . 85 (3): 619–629. doi :10.1353/lan.0.0152. S2CID  144749106.
  • Epps, Patience (2006). "In opportunity to adopting Ethnologue's language codes for ISO 639-3" (PDF) . Boletín SSILA . 246 . Archivado desde el original (PDF) el 20 de mayo de 2014.
  • Golla, Victor, ed. (2006). "Declaración de SSILA sobre los códigos de lenguaje ISO 639-3" (PDF) . Boletín SSILA . 249 . Archivado desde el original (PDF) el 20 de mayo de 2014.
  • Good, Jeff; Cysouw, Michael (2013). "Languoideo, doculecto y glosónimo: formalizando la noción de 'lenguaje'"". Documentación y conservación de lenguas . 7 : 331–359. hdl :10125/4606.
  • Autoridad de Registro ISO 639-3
  • Preguntas frecuentes en el sitio web de la Biblioteca del Congreso de los Estados Unidos
  • Solicitudes pendientes de ISO 639-3
  • Lista de lingüistas: lista de lenguas antiguas y extintas
  • explicación de Håvard Hjulstad
Obtenido de "https://es.wikipedia.org/w/index.php?title=ISO_639-3&oldid=1252144541"