Este artículo necesita ser editado para cumplir con el Manual de estilo de Wikipedia . ( Junio de 2024 ) |
Arabic alphabet |
---|
Arabic script |
La escritura árabe tiene numerosos signos diacríticos , que incluyen el signo de consonante conocido como iʻjām ( إِعْجَام ) y signos diacríticos suplementarios conocidos como tashkīl ( تَشْكِيل ). Estos últimos incluyen las marcas vocales denominadas ḥarakāt ( حَرَكَات ; sg. حَرَكَة , ḥarakah ).
La escritura árabe es una abjad modificada , donde todas las letras son consonantes, dejando al lector la tarea de completar los sonidos vocálicos. Las consonantes cortas y las vocales largas se representan con letras, pero las vocales cortas y la longitud de las consonantes no suelen indicarse por escrito. El tashkīl es opcional para representar las vocales faltantes y la longitud de las consonantes. El árabe moderno siempre se escribe con el i'jām (señalización de las consonantes), pero solo los textos religiosos, los libros infantiles y las obras para estudiantes se escriben con el tashkīl completo (guías de vocales y longitud de consonantes). Sin embargo, no es raro que los autores añadan diacríticos a una palabra o letra cuando el caso gramatical o el significado se consideran ambiguos. Además, las obras clásicas y los documentos históricos presentados al público en general a menudo se presentan con el tashkīl completo , para compensar la brecha en la comprensión resultante de los cambios estilísticos a lo largo de los siglos.
El significado literal de تَشْكِيل tashkīl es 'variación'. Como el texto árabe normal no proporciona suficiente información sobre la pronunciación correcta, el objetivo principal de tashkīl (y ḥarakāt ) es proporcionar una guía fonética o una ayuda fonética; es decir, mostrar la pronunciación correcta para los niños que están aprendiendo a leer o para los estudiantes extranjeros.
La mayor parte de la escritura árabe se escribe sin ḥarakāt (o vocales cortas). Sin embargo, se utilizan comúnmente en textos que exigen un estricto cumplimiento de la pronunciación exacta. Esto es cierto, principalmente, en el Corán ⟨ ٱلْقُرْآن ⟩ ( al-Qurʾān ) y la poesía . También es bastante común agregar ḥarakāt a los hadices ⟨ ٱلْحَدِيث ⟩ ( al-ḥadīth ; plural: al-ḥādīth ) y la Biblia . Otro uso es en la literatura infantil. Además, ḥarakāt se utiliza en textos ordinarios en palabras individuales cuando una ambigüedad de pronunciación no puede resolverse fácilmente solo con el contexto. Los diccionarios árabes con marcas vocálicas proporcionan información sobre la pronunciación correcta tanto a hablantes nativos como extranjeros. En el arte y la caligrafía , se puede utilizar ḥarakāt simplemente porque su escritura se considera estéticamente agradable.
Un ejemplo de un árabe completamente vocalizado ( vocalizado o vocálico ) del Bismillah :
بِسْمِ ٱللَّٰهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ
bismi l-lāhi r-raḥmāni r-raḥīm
En el nombre de Dios, el Todomisericordioso, el Especialmente Misericordioso.
Algunos libros de texto árabes para extranjeros utilizan ahora el ḥarakāt como guía fonética para facilitar el aprendizaje de la lectura árabe. El otro método utilizado en los libros de texto es la romanización fonética de textos no vocalizados. Los estudiantes de árabe buscan textos árabes completamente vocalizados (es decir, textos árabes con ḥarakāt /diacríticos). Algunos diccionarios bilingües en línea también ofrecen el ḥarakāt como guía fonética, de manera similar a los diccionarios de inglés que ofrecen transcripción.
Las ḥarakāt حَرَكَات , que literalmente significan 'movimientos', son las marcas de vocales cortas. Existe cierta ambigüedad en cuanto a qué tashkīl también son ḥarakāt ; los tanwīn , por ejemplo, son marcadores tanto de vocales como de consonantes.
La fatḥah ⟨ فَتْحَة ⟩ es una pequeña línea diagonal colocada sobre una letra y representa una /a/ corta (como el sonido /a/ en la palabra inglesa "cat"). La palabra fatḥah en sí ( فَتْحَة ) significa apertura y se refiere a la apertura de la boca al producir una /a/ . Por ejemplo, con dāl (de aquí en adelante, la consonante base en los siguientes ejemplos): ⟨ دَ ⟩ /da/ .
Cuando se coloca una fatḥah antes de una letra simple ⟨ ا ⟩ ( alif ) (es decir, una que no tiene hamza o vocal propia), representa una /aː/ larga (cercana al sonido de "a" en la palabra inglesa "dad", con una vocal frontal abierta /æː/, no posterior /ɑː/ como en "father"). Por ejemplo: ⟨ دَا ⟩ /daː/ . La fatḥah no suele escribirse en tales casos. Cuando se coloca una fathah antes de la letra ⟨ ﻱ ⟩ (yā'), crea una /aj/ (como en "l ie "); y cuando se coloca antes de la letra ⟨ و ⟩ (wāw), crea una /aw/ (como en "c ow ").
Aunque emparejada con una letra simple crea una vocal anterior abierta (/a/), que a menudo se realiza como casi abierta (/ æ /), el estándar también permite variaciones, especialmente bajo ciertas condiciones ambientales. Por lo general, para tener la pronunciación más central (/ ä /) o posterior (/ ɑ /), la palabra presenta una consonante posterior cercana, como las enfáticas, así como qāf o rā' . Una cualidad "posterior" similar también la experimentan otras vocales en presencia de tales consonantes, sin embargo no se realiza de manera tan drástica como en el caso de fatḥah . [1] [2] [3]
Las fatḥah se codifican como U+0618 ؘ FATHA ÁRABE PEQUEÑA, U+064E َFATHA ÁRABE, U+FE76 ﹶFORMA AISLADA DE FATHA ÁRABE, o U+FE77 ﹷFORMA MEDIA DE FATHA ÁRABE.
Una línea diagonal similar debajo de una letra se llama kasrah ⟨ كَسْرَة ⟩ y designa una /i/ corta (como en "me", "be") y sus alófonos [i, ɪ, e, e̞, ɛ] (como en "Tim", "sit"). Por ejemplo: ⟨ دِ ⟩ /di/ . [4]
Cuando se coloca una kasrah antes de una letra simple ⟨ ﻱ ⟩ ( yā' ), representa una /iː/ larga (como en la palabra inglesa "steed"). Por ejemplo: ⟨ دِي ⟩ /diː/ . La kasrah no suele escribirse en estos casos, pero si yā' se pronuncia como un diptongo /aj/ , se debe escribir fatḥah sobre la letra precedente para evitar una mala pronunciación. La palabra kasrah significa 'romper'. [1]
Las Kasrah se codifican como U+061A ؚKASRA ÁRABE PEQUEÑO, U+0650 ِKASRA ÁRABE, U+FE7A ﹺFORMA AISLADA DE KASRA ÁRABEo U+FE7B ﹻFORMA MEDIA DE KASRA ÁRABE.
El ḍammah ⟨ ضَمَّة ⟩ es un pequeño diacrítico en forma de rizo que se coloca sobre una letra para representar una /u/ corta (como en "duque", más corta "tú") y sus alófonos [u, ʊ, o, o̞, ɔ] (como en "poner", o "toro"). Por ejemplo: ⟨ دُ ⟩ /du/ . [4]
Cuando se coloca una ḍammah antes de una letra simple ⟨ و ⟩ ( wāw ), representa una /uː/ larga (como el sonido 'oo' en la palabra inglesa "swoop"). Por ejemplo: ⟨ دُو ⟩ /duː/ . La ḍammah no suele escribirse en estos casos, pero si wāw se pronuncia como un diptongo /aw/ , se debe escribir fatḥah sobre la consonante precedente para evitar una mala pronunciación. [1]
La palabra ḍammah (ضَمَّة) en este contexto significa redondeo , ya que es la única vocal redondeada en el inventario de vocales del árabe.
Las Ḍammah se codifican como U+0619 ؙDAMMA ÁRABE PEQUEÑA, U+064F ُDAMMA ÁRABE, U+FE78 ﹸFORMA AISLADA DE DAMMA ÁRABEo U+FE79 ﹹFORMA MEDIA DE DAMMA ÁRABE.
El superíndice (o daga) alif ⟨ أَلِف خَنْجَرِيَّة ⟩ ( alif khanjarīyah ), se escribe como un trazo vertical corto encima de una letra. Indica un sonido /aː/ largo para el cual normalmente no se escribe alif . Por ejemplo: ⟨ هَٰذَا ⟩ ( hādhā ) o ⟨ رَحْمَٰن ⟩ ( raḥmān ).
La daga alif aparece en pocas palabras, pero incluyen algunas comunes; sin embargo, rara vez se escribe, incluso en textos completamente vocalizados. La mayoría de los teclados no tienen daga alif . La palabra Allah ⟨ الله ⟩ ( Allāh ) generalmente se produce automáticamente al ingresar alif lām lām hāʾ . La palabra consiste en alif + ligadura de lām doble con una shaddah y una daga alif sobre lām , seguida de ha' .
La maddah ⟨ مَدَّة ⟩ es un diacrítico en forma de tilde , que solo puede aparecer encima de un alif (آ) e indica una oclusión glotal /ʔ/ seguida de una /aː/ larga .
En teoría, la misma secuencia /ʔaː/ también podría representarse con dos alif , como en * ⟨ أَا ⟩ , donde una hamza sobre el primer alif representa el /ʔ/ mientras que el segundo alif representa el /aː/ . Sin embargo, en la ortografía árabe nunca se utilizan alif consecutivos . En cambio, esta secuencia siempre debe escribirse como un solo alif con una maddah encima, la combinación conocida como alif maddah . Por ejemplo: ⟨ قُرْآن ⟩ /qurˈʔaːn/ .
En los escritos coránicos, se coloca una maddah sobre cualquier otra letra para indicar el nombre de la letra, aunque algunas letras pueden llevar una daga alif . Por ejemplo: ⟨ لٓمٓصٓ ⟩ ( lām - mīm - ṣād ) o ⟨ يـٰسٓ ⟩ ( yāʼ-sīn )
El waṣlah ⟨ وَصْلَة ⟩ , alif waṣlah ⟨ أَلِف وَصْلَة ⟩ o hamzat waṣl ⟨ هَمْزَة وَصْل ⟩ parece la cabeza de un pequeño ṣād encima de un alif ⟨ ٱ ⟩ (también indicado por un alif ⟨ ا ⟩ sin hamzah ). Significa que el alif no se pronuncia cuando su palabra no comienza una oración. Por ejemplo: ⟨ بِٱسْمِ ⟩ ( bismi ), pero ⟨ ٱمْشُوا۟ ⟩ ( imshū no mshū ). Esto se debe a que en árabe, la primera consonante de una palabra siempre debe ir seguida de un sonido vocálico: si la segunda letra de la waṣlah tiene una kasrah, la alif-waslah produce el sonido /i/. Sin embargo, cuando la segunda letra de esta tiene una dammah, produce el sonido /u/.
Aparece solo al principio de las palabras, pero puede aparecer después de las preposiciones y del artículo definido. Se encuentra comúnmente en los verbos imperativos, el aspecto perfectivo de las raíces verbales VII a X y sus sustantivos verbales ( maṣdar ). El alif del artículo definido se considera un waṣlah .
Aparece en frases y oraciones (discurso conectado, no formas aisladas/de diccionario):
Al igual que el superíndice alif, no está escrito en escrituras completamente vocalizadas, a excepción de los textos sagrados, como el Corán y la Biblia arabizada.
El sukūn ⟨ سُكُونْ ⟩ es un diacrítico en forma de círculo que se coloca encima de una letra ( ْ ). Indica que la letra a la que está unido no está seguida por una vocal, es decir, cero -vocal.
Es un símbolo necesario para escribir sílabas consonante-vocal-consonante, muy comunes en árabe. Por ejemplo: ⟨ دَدْ ⟩ ( papá ).
El sukūn también puede usarse para representar un diptongo. Un fatḥah seguido de la letra ⟨ ﻱ ⟩ ( yā' ) con un sukūn encima ( ـَيْ ) indica el diptongo ay ( IPA /aj/ ). Un fatḥah , seguido de la letra ⟨ ﻭ ⟩ ( wāw ) con un sukūn , ( ـَوْ ) indica /aw/ .
Los sukūn se codifican como U+0652 ْSUKUN ÁRABE, U+FE7E ﹾFORMA AISLADA SUKUN ÁRABEo U+FE7F ﹿFORMA MEDIA SUKUN ÁRABE.
El sukūn puede tener también una forma alternativa de la pequeña cabeza alta de ḥāʾ ( U+06E1 ۡ CABEZA ÁRABE PEQUEÑA ALTA SIN PUNTO DE KHAH ), particularmente en algunos Coranes. También pueden existir otras formas (por ejemplo, como una pequeña coma sobre ⟨ʼ⟩ o como un circunflejo ⟨ˆ⟩ en nastaʿlīq ). [5]
Los tres diacríticos vocálicos pueden duplicarse al final de una palabra para indicar que la vocal va seguida de la consonante n . Pueden considerarse o no ḥarakāt y se conocen como tanwīn ⟨ تَنْوِين ⟩ o nunación. Los signos indican, de izquierda a derecha, -an, -in, -un .
Estas terminaciones se utilizan como terminaciones gramaticales indefinidas sin pausa en árabe literario o árabe clásico ( solo triptotes ). En un texto vocalizado, pueden escribirse incluso si no se pronuncian (ver pausa ). Ver i'rāb para más detalles. En muchos dialectos árabes hablados, las terminaciones están ausentes. Muchos libros de texto árabes introducen el árabe estándar sin estas terminaciones. Las terminaciones gramaticales pueden no estar escritas en algunos textos árabes vocalizados, ya que el conocimiento de i'rāb varía de un país a otro y existe una tendencia a simplificar la gramática árabe.
El signo ⟨ ـً ⟩ se escribe más comúnmente en combinación con ⟨ ـًا ⟩ ( alif ), ⟨ ةً ⟩ ( tā' marbūṭah ), ⟨ أً ⟩ ( alif hamzah ) o de forma independiente ⟨ ءً ⟩ ( hamzah ). Alif siempre debe escribirse (excepto en palabras que terminan en tā' marbūṭah , hamzah o diptotes ) incluso si an no lo está. Casos gramaticales y terminaciones de tanwīn en formas de triptote indefinido:
El shadda o shaddah ⟨ شَدَّة ⟩ ( shaddah ), o tashdid ⟨ تَشْدِيد ⟩ ( tashdīd ), es un signo diacrítico con forma de pequeña " w " latina escrita.
Se utiliza para indicar geminación (duplicación de consonantes o longitud extra), que es fonémica en árabe. Se escribe encima de la consonante que se va a duplicar. Es la única ḥarakah que se usa comúnmente en la ortografía ordinaria para evitar ambigüedades . Por ejemplo: ⟨ دّ ⟩ /dd/ ; madrasah ⟨ مَدْرَسَة ⟩ ('escuela') vs. mudarrisah ⟨ مُدَرِّسَة ⟩ ('maestra', mujer). Tenga en cuenta que cuando la letra duplicada lleva una vocal, es la shaddah a la que se une la vocal, no a la letra en sí: ⟨ دَّ ⟩ /dda/ , ⟨ دِّ ⟩ /ddi/ .
Las shaddah están codificadas como U+0651 ّSHADDA ÁRABE, U+FE7C ﹼFORMA AISLADA DE SHADDA ÁRABEo U+FE7D ﹽFORMA MEDIA DE SHADDA ÁRABE.
Los i'jām ( إِعْجَام ; a veces también llamados nuqaṭ ) [6] son los puntos diacríticos que distinguen varias consonantes que tienen la misma forma ( rasm ), como ⟨ ص ⟩ /sˤ/ , ⟨ ض ⟩ /dˤ/ . Normalmente los i'jām no se consideran diacríticos sino parte de la letra.
Los manuscritos antiguos del Corán no utilizaban diacríticos ni para las vocales ni para distinguir los diferentes valores del rasm . Primero se introdujo la señalización vocálica, como un punto rojo colocado encima, debajo o al lado del rasm , y más tarde se introdujo la señalización consonántica, como rayas negras cortas y delgadas, simples o múltiples, colocadas encima o debajo del rasm . Estos i'jām se convirtieron en puntos negros aproximadamente al mismo tiempo que el ḥarakāt se convirtió en pequeñas letras o trazos negros.
Por lo general, los egipcios no usan puntos debajo de la yā' final ( ي ), que se ve exactamente como alif maqṣūrah ( ى ) en la escritura a mano y en la imprenta. Esta práctica también se usa en copias del muṣḥaf ( Corán ) escritas por 'Uthman Ṭāhā . La misma unificación de yā y alif maqṣūrā ha sucedido en persa , dando como resultado lo que el estándar Unicode llama " letra árabe farsi Yeh ", que se ve exactamente igual que yā en las formas inicial y media, pero exactamente igual que alif maqṣūrah en las formas final y aislada.
En la época en que el i'jām era opcional, las letras sin punta eran ambiguas. Para aclarar que una letra carecería de i'jām en un texto con punta, la letra podía marcarse con un pequeño diacrítico en forma de v o de gaviota encima, también un semicírculo superíndice (media luna), un punto subíndice (excepto en el caso de ⟨ ح ⟩ ; se usaban tres puntos con ⟨ س ⟩ ), o una miniatura subíndice de la propia letra. Un trazo superíndice conocido como jarrah , parecido a una fatħah larga , se usaba para un sin contraído (asimilado) . Así, ⟨ ڛ سۣ سۡ سٚ ⟩ se usaban para indicar que la letra en cuestión era realmente ⟨ س ⟩ y no ⟨ ش ⟩ . [7] Estos signos, conocidos colectivamente como 'alāmātu-l-ihmāl , todavía se utilizan ocasionalmente en la caligrafía árabe moderna , ya sea por su propósito original (es decir, marcar letras sin i'jām ), o a menudo como rellenos de espacios puramente decorativos. La pequeña ک sobre el kāf en sus formas finales y aisladas ⟨ ك ـك ⟩ era originalmente un 'alāmatu-l-ihmāl que se convirtió en una parte permanente de la letra. Anteriormente, este signo también podía aparecer sobre la forma medial de kāf , cuando esa letra se escribía sin el trazo en su ascendente . Cuando kaf se escribía sin ese trazo, podía confundirse con lam , por lo que kaf se distinguía con un superíndice kaf o un pequeño superíndice hamza ( nabrah ), y lam con un superíndice lam ( lam-alif-mim ). [8]
Aunque no siempre se considera una letra del alfabeto, la hamza هَمْزة ( hamzah , oclusión glotal ) suele aparecer como una letra independiente en la escritura, se escribe en textos sin puntos y no se considera un tashkīl . Puede aparecer como una letra por sí sola o como un diacrítico sobre o debajo de un alif , un wāw o un yā .
La letra que se debe utilizar para apoyar la hamzah depende de la calidad de las vocales adyacentes y su ubicación en la palabra;
Consideremos las siguientes palabras: ⟨ أَخ ⟩ /ʔax/ ("hermano"), ⟨ إسْماعِيل ⟩ /ʔismaːʕiːl/ ("Ismael"), ⟨ أُمّ ⟩ /ʔumm/ ("madre"). Las tres palabras anteriores "comienzan" con una vocal que abre la sílaba y, en cada caso, se utiliza alif para designar la oclusión glotal inicial (el comienzo real ). Pero si consideramos las sílabas intermedias que "comienzan" con una vocal: ⟨ نَشْأة ⟩ /naʃʔa/ ("origen"), ⟨ أَفْئِدة ⟩ /ʔafʔida/ ("corazones"; note la sílaba /ʔi/ ; singular ⟨ فُؤاد ⟩ / fuʔaːd/ ), ⟨ رُؤُوس ⟩ /ruʔuːs/ ("cabezas", singular ⟨ رَأْس ⟩ /raʔs/ ), la situación es diferente, como se señaló anteriormente. Vea el artículo completo sobre hamzah para más detalles.
Los diacríticos que no se utilizan en el árabe estándar moderno, pero sí en otros idiomas que utilizan la escritura árabe, y a veces para escribir dialectos árabes, incluyen (la lista no es exhaustiva):
Descripción | Unicode | Ejemplo | Idioma(s) | Notas |
---|---|---|---|---|
Barras y lineas | ||||
barra diagonal arriba | گ | Árabe (Irak), balti , burushaski , cachemir , kazajo , khowar , kurdo , kirguís , persa , sindhi , urdu , uigur |
| |
barra horizontal arriba | Pashto | |||
línea vertical arriba | ئۈ | Uigur |
| |
Puntos | ||||
2 puntos (verticales) | | |||
4 puntos | ڐ ٿ ڐ ڙ | Sindhi, antiguo indostánico | ||
punto de abajo | U+065C ٜ SIGNO VOCAL ÁRABE PUNTO ABAJO | 1 بٜ | Lenguas africanas [10] |
|
Variantes de los signos diacríticos del árabe estándar | ||||
hamza ondulada | 100% | Cachemira |
| |
dammah rizado arriba | ◌ࣥ | Rohingya |
| |
Rohingya |
| |||
doble dammah arriba | ◌ࣱ | Rohingya |
| |
dammahs rizadas invertidas y regulares arriba | ◌ࣨ | Rohingya |
| |
Tildes | ||||
forma de tilde diagonal arriba | ◌ࣤ | Rohingya |
| |
forma de tilde diagonal debajo | ◌ࣦ | Rohingya |
| |
Letras árabes | ||||
Letra árabe en miniatura hah (forma inicial) ﺣ arriba | ◌ۡ | Rohingya |
| |
Letra árabe en miniatura tah ط arriba | | Urdú | ||
Números árabes orientales [13] | ||||
Número árabe oriental 2: ٢ arriba | U+0775, U+0778, U+077A | | Burushaski |
|
Número árabe oriental 3: ٣ arriba | U+0776, U+0779, U+077B | | Burushaski |
|
Urdu número 4: ۴ arriba o abajo | U+0777, U+077C, U+077D | | Burushaski |
|
Otras formas | ||||
Nūn ġuṇnā , forma de "u" arriba | ن٘ | Urdú |
| |
Forma de "v" arriba | ۆ ێ ئۆ | Azerbaiyano , turcomano , kurdo , kazajo , uigur |
| |
forma de "v" invertida arriba | یٛ | Azerbaiyano , turcomano | ||
fatha punteada | ◌ࣵ | wólof | latín à | |
círculo con fatha | ◌ࣴ | wólof | latín ë | |
signo menor que - abajo | ◌ࣹ | wólof | latín e | |
signo mayor que - abajo | ◌ࣺ | wólof | latín é | |
signo menor que - arriba | ◌ࣷ | wólof | latín o | |
signo mayor que - arriba | ◌ࣸ | wólof | latín ó | |
anillo | ګ | Pashto |
| |
Otras formas | ||||
Forma de "pez" arriba | No me importa | Rohingya | Ṭāna , por ejemplo, دࣤ࣬ / دࣥ࣬ / دࣦ࣯, escrito encima o debajo de otros signos diacríticos para marcar un tono ascendente largo ( / ˨˦ / ). [14] [15] | |
Varios | Urdú |
|
Históricamente, la escritura árabe ha sido adoptada y utilizada por muchos idiomas tonales, como por ejemplo el xiao'erjing para el chino mandarín , así como la escritura ajami adoptada para escribir varios idiomas de África occidental. Sin embargo, la escritura árabe nunca tuvo una forma inherente de representar tonos hasta que fue adaptada para el idioma rohingya . El rohingya fonna son tres marcadores de tono que forman parte de la convención ortográfica estandarizada y aceptada del rohingya. Sigue siendo el único ejemplo conocido de marcadores de tono dentro de la escritura árabe . [14] [15]
Los marcadores de tono actúan como "modificadores" de los diacríticos vocálicos. En palabras más sencillas, son "diacríticos para los diacríticos". Se escriben "fuera" de la palabra, lo que significa que se escriben encima del diacrítico vocálico si el diacrítico se escribe encima de la palabra, y se escriben debajo del diacrítico si el diacrítico se escribe debajo de la palabra. Solo se escriben donde hay diacríticos vocálicos. Es importante tener esto en cuenta, ya que sin el diacrítico presente, no hay forma de distinguir entre los marcadores de tono y los I'jām, es decir, los puntos que se utilizan para hacer distinciones fonéticas de consonantes.
Harbay
El Hārbāy , como se le llama en rohingya, es un solo punto que se coloca sobre Fatḥah y Ḍammah , o Fatḥah rizado y Ḍammah rizado (diacríticos vocálicos exclusivos de los rohingya), o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizado , o su respectiva versión Kasratan . (p. ej. دً࣪ / دٌ࣪ / دࣨ࣪ / دٍ࣭ ) Este marcador de tono indica un tono alto corto ( /˥/ ). [14] [15]
Tala
El Ṭelā , como se le llama en rohingya, son dos puntos que se colocan encima de Fatḥah y Ḍammah , o Fatḥah rizada y Ḍammah rizada , o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizada , o sus respectivas versiones Kasratan . (p. ej. دَ࣫ / دُ࣫ / دِ࣮ ) Este marcador de tono indica un tono descendente largo ( /˥˩/ ). [14] [15]
Taena
La Ṭāna , como se la llama en rohingya, es una línea en forma de pez que se coloca encima de Fatḥah y Ḍammah , o Fatḥah rizada y Ḍammah rizada , o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizada , o su respectiva versión Kasratan . (p. ej. دࣤ࣬ / دࣥ࣬ / دࣦ࣯ ) Este marcador de tono indica un tono ascendente largo ( /˨˦/ ). [14] [15]
Según la tradición, el primero en encargar un sistema de harakat fue Ali , quien designó a Abu al-Aswad al-Du'ali para la tarea. Abu al-Aswad ideó un sistema de puntos para señalar las tres vocales cortas (junto con sus respectivos alófonos) del árabe. Este sistema de puntos es anterior al i'jām , puntos utilizados para distinguir entre diferentes consonantes.
El sistema de Harakat de Abu al-Aswad era diferente del sistema que conocemos hoy. El sistema utilizaba puntos rojos y cada disposición o posición indicaba una vocal corta diferente.
Un punto encima de una letra indicaba la vocal a , un punto debajo indicaba la vocal i , un punto al costado de una letra representaba la vocal u y dos puntos representaban la tanwīn .
Sin embargo, los primeros manuscritos del Corán no utilizaban los signos vocálicos para cada letra que los requería, sino sólo para las letras en las que eran necesarios para una lectura correcta.
El precursor del sistema que conocemos hoy es el sistema de Al Farahidi. Al-Farāhīdī descubrió que la tarea de escribir con dos colores diferentes era tediosa y poco práctica. Otra complicación fue que para entonces ya se había introducido el i'jām , que, si bien eran trazos cortos en lugar de los puntos redondos que vemos hoy, significaba que sin una distinción de color los dos podían confundirse.
En consecuencia, reemplazó la ḥarakāt con pequeñas letras superíndice: alif, yā' y wāw minúsculas para las vocales cortas correspondientes a las vocales largas escritas con esas letras, una s(h)īn minúscula para shaddah (geminada), una khā' minúscula para khafīf (consonante corta; en desuso). Su sistema es esencialmente el que conocemos hoy. [17]
El proceso de restauración automática de las marcas diacríticas se denomina diacritización o restauración diacrítica. Es útil para evitar la ambigüedad en aplicaciones como la traducción automática del árabe , la conversión de texto a voz y la recuperación de información . Se han desarrollado algoritmos de diacritización automática. [18] [19] Para el árabe estándar moderno , el algoritmo de última generación tiene una tasa de error de palabras (WER) del 4,79 %. Los errores más comunes son los nombres propios y las terminaciones de mayúsculas y minúsculas . [20] Existen algoritmos similares para otras variedades del árabe . [21]
{{cite book}}
: CS1 maint: ignored ISBN errors (link)