ISO 11940

Norma ISO para la transliteración de caracteres tailandeses

ISO 11940 es una norma ISO para la transliteración de caracteres tailandeses , publicada en 1998 y actualizada en septiembre de 2003 y confirmada en 2008. Una extensión de esta norma denominada ISO 11940-2 define una transcripción simplificada basada en ella.

Consonantes

tailandés§§AYoá
YO ASIak̄hḳ̄hYok̛hhendoc̄hcsc̣hYo
 
tailandés 
YO ASIdṭ̄hElElnortedaElElElnorte
 
tailandés 
YO ASIbpagp̄hFEl phFp̣hmetro
 
tailandésA.A.A.A.AAYo
YO ASIyaenyooelsssincógnitao

La transliteración de las consonantes puras se deriva de su pronunciación habitual como consonante inicial. Se utiliza una h sin marcar para formar dígrafos que denotan consonantes aspiradas . Los pares de consonantes altas y bajas se diferencian sistemáticamente aplicando un macrón a la consonante de clase alta. Se obtiene una mayor diferenciación de consonantes con función fonética idéntica dejando la más frecuente sin marcar, marcando la segunda más común con un punto debajo, marcando la tercera más común con un cuerno y marcando la cuarta más común con subrayado. El uso de un punto debajo tiene un efecto similar a la práctica indológica de distinguir las consonantes retroflejas con un punto debajo, pero hay diferencias sutiles: son las transliteraciones de ธtho thong y ศso sala las que se puntúan debajo, no las de las consonantes retroflejas correspondientes . Las transliteraciones de consonantes deben ingresarse en el orden letra base, macrón si lo hay, y luego punto debajo, cuerno o "macrón debajo". Sólo tres consonantes tienen el cuerno en su transliteración, ฅkho khon , ฒtho phuthao y ษso ruesi , y sólo una consonante tiene un subrayado, ฑtho nang montho .

Vocales

tailandés–ั ำ–ิ–ี–ึ–ื–ุ–ูA.YaA.Yo
YO ASIaaaaiiụ̄ūmiaoiienoEnyelincógnita

La letra å es el único carácter precompuesto especificado en la salida de la transliteración.

El lakkhangyao (ๅ) se ha representado únicamente en combinación con las letras vocálicas ฤ y ฦ. El estándar simplemente enumera ฤ y ฦ con las consonantes y el lakkhangyao con las vocales. Un lakkhangyao aislado también se transliteraría con una letra "i" minúscula con trazo ( ɨ ), pero esto no debería ocurrir en tailandés, pali o sánscrito.

Las transliteraciones de วwo waen y อo ang se han incluido aquí debido a su uso como símbolos vocálicos completos, pero su transliteración no depende de cómo se utilicen y el estándar simplemente las enumera con las consonantes.

Los símbolos vocálicos compuestos se transliteran de acuerdo con sus constituyentes.

Otras marcas combinables

tailandés–่–้–๊–๋–็–์–๎–ํ–ฺ
YO ASI~–̊–̥

Tenga en cuenta que yamakkan (–๎) se representa mediante una tilde espaciadora, no una tilde superíndice.

Puntuación y dígitos

tailandésA
YO ASI«ǂ§ǀǁ»0123456789

La norma ISO 11940:1998 distingue el símbolo de abreviatura paiyannoi (ฯ) del terminador de oración angkhandiao (ฯ), aunque ni la norma nacional de caracteres TIS 620-2533 ni la versión Unicode 5.0 los distinguen. Paiyannoi se translitera como ǂ y angkhandiao se translitera como ǀ . Nótese que paiyannoi , angkhandiao y angkhankhu (๚) se transliteran con las letras utilizadas para las consonantes de clic , no con doble daga, barras verticales o dandas .

Secuenciación de caracteres

En general, los caracteres se transliteran de izquierda a derecha y, cuando los caracteres tienen la misma posición horizontal, de arriba a abajo. De hecho, la secuencia vertical se especifica simplemente como marcas de tono y thanthakhat (–์) precediendo a cualquier otra marca por encima o por debajo de la consonante. La norma niega al final de la Sección 4.2 que pueda darse la combinación de sara u (◌ุ, ◌ู) y nikkhahit (◌ํ) y luego da un ejemplo de ello al especificar la transliteración de nikkhahit , pero no muestra la transliteración de la combinación. El efecto de estas reglas es que, a excepción de nikkhahit , todas las marcas no vocálicas adjuntas a una consonante en tailandés se adjuntan a la consonante en la transliteración romana.

La norma admite que intentar transponer vocales y consonantes prepuestas puede ser reconfortante para quienes están acostumbrados al alfabeto romano , pero recomienda que no se transpongan las vocales prepuestas.

Por ejemplo, ภาษาไทย ( RTGSPhasa Thai ) debe transliterarse a p̣hās̛̄āịthy y เชียงใหม่ ( RTGSChiang Mai ) a echīyngıh̄m̀ .

Variaciones

Causas

El estándar especifica el orden en el que se deben escribir los acentos, pero no todos los sistemas de entrada registran los acentos en el orden en el que se escriben. Unicode especifica dos formas normalizadas para letras con múltiples acentos, y es muy probable que el texto transliterado se almacene en una de estas formas. Esto complica la retrotransliteración automática. Como los procesos compatibles con Unicode deben manejar estas variaciones correctamente, las transliteraciones de esta página se han elegido para facilitar su visualización; los sistemas de representación actuales pueden mostrar formas equivalentes de forma diferente.

Muchas fuentes muestran mal las combinaciones novedosas de consonantes y acentos. Por ejemplo, el Instituto de la Lengua Estonia publica en la web una explicación de la aplicación de la norma al tailandés y, con una excepción, parece cumplir con la norma. La excepción es que, a excepción del macrón, los acentos sobre consonantes están desplazados hacia la derecha, lo que da la impresión de que se han introducido como los caracteres no combinables correspondientes. La norma especifica las transliteraciones en puntos de código, pero alguien que trabaje a partir de esta explicación libre podría deducir fácilmente que se deben utilizar las formas de espaciado de los acentos tonales.

UCI (CLDR 1.4.1)

La implementación de la UCI , registrada en la versión 1.4.1 del Repositorio de datos de configuración regional común patrocinado por Unicode , [1] utiliza una prima en lugar de un cuerno en la transliteración de consonantes. Esto afecta la transliteración de ฅkho khon , ฒtho phuthao y ษso bo ruesi . ฏto patak también se translitera de manera diferente, como en lugar de .

Esta implementación translitera ำ como  en lugar de å para evitar ambigüedad con la secuencia hipotética de escritura tailandesa ะํ ( sara a , nikkhahit ). La implementación de la UCI translitera ฺphinthu como ˌ en lugar de para evitar problemas con la normalización Unicode . Esto tiene el efecto secundario de mejorar la legibilidad cuando se aplica a una consonante con punto inferior.

La implementación de la UCI translitera ฯpaiyannoi como (doble daga) y angkhankhu como || (dos barras verticales ASCII). Como la implementación de la UCI utiliza Unicode, no puede distinguir de manera confiable angkhandiao de paiyannoi sin un análisis semántico y no hace tal intento.

La secuencia de caracteres de la implementación de ICU es diferente. Transpone las vocales prepuestas con la consonante siguiente y procesa las marcas de una consonante en el orden en que están almacenadas en la memoria. (La mayoría de los métodos de entrada tailandeses garantizan que las marcas se almacenen en orden de abajo a arriba). No transpone las vocales prepuestas con grupos de consonantes completos; los grupos de consonantes no se pueden identificar con total precisión y la transposición de vocales con grupos requeriría un símbolo adicional para permitir una conversión confiable de nuevo al alfabeto tailandés.

Por ejemplo, bajo esta implementación, ภาษาไทย se translitera a p̣hās̄ʹāthịy y เชียงใหม่ a cheīyngh̄ım̀ .

Finalmente, esta implementación genera transliteraciones en formato Unicode Normalization Form C (NFC).

Véase también

Referencias

  1. ^ Archivos http://unicode.org/Public/cldr/1.4.1/core.zip transforms/ThaiLogical-Latin.xml y transforms/Thai-ThaiLogical.xml (utilizados por los transliteradores de la UCI "Thai-Latin" y "Latin-Thai")
  • Sitio oficial de la ISO
  • Reglas de transliteración en Unicode.org [ enlace muerto permanente ‍ ]
  • Romanización de los topónimos tailandeses en la base de datos KNAB del Instituto de la Lengua Estonia
Obtenido de "https://es.wikipedia.org/w/index.php?title=ISO_11940&oldid=1237250562"