Escritura árabe en Unicode

Muchos sistemas de escritura Unicode , como el árabe , tienen reglas ortográficas especiales que requieren que ciertas combinaciones de formas de letras se combinen en formas de ligadura especiales . En inglés, el ampersand común (&) se desarrolló a partir de una ligadura en la que se combinaban las letras latinas manuscritas e y t (ortografía et , latín para y ). [1] Las reglas que rigen la formación de ligaduras en árabe pueden ser bastante complejas y requieren tecnologías especiales de modelado de escritura, como el motor caligráfico árabe de DecoType de Thomas Milo. [2]

A partir de Unicode 16.0, el alfabeto árabe está contenido en los siguientes bloques : [3]

El rango árabe básico codifica las letras y diacríticos estándar, pero no codifica formas contextuales (U+0621–U+0652 se basa directamente en ISO 8859-6 ); y también incluye los diacríticos más comunes y los dígitos árabe-índicos . El rango de Suplemento árabe codifica variantes de letras utilizadas principalmente para escribir idiomas africanos (no árabes). Los rangos Árabe extendido-B y Árabe extendido-A codifican anotaciones coránicas adicionales y variantes de letras utilizadas para varios idiomas no árabes. El rango de Formas de presentación árabe-A codifica formas contextuales y ligaduras de variantes de letras necesarias para persa, urdu, sindhi y idiomas de Asia central. El rango de Formas de presentación árabe-B codifica formas de espaciado de diacríticos árabes y formas de letras más contextuales. Las formas de presentación están presentes solo para compatibilidad con estándares más antiguos y actualmente no son necesarias para codificar texto. [4] El bloque de Símbolos alfabéticos matemáticos árabes codifica caracteres utilizados en expresiones matemáticas árabes. El bloque de números Siyaq índicos contiene un subconjunto especializado de la escritura árabe que se utilizó para la contabilidad en la India bajo el Imperio mogol desde el siglo XVII hasta mediados del siglo XX. [5] [6] El bloque de números Siyaq otomanos contiene un subconjunto especializado de la escritura árabe, también conocido como números Siyakat , utilizado para la contabilidad en los documentos turcos otomanos . [6]

Formas contextuales

A continuación se muestra una demostración del alfabeto básico utilizado en el árabe estándar moderno que ilustra cómo se espera que aparezcan las letras árabes en diferentes contextos. Los puntos de código enumerados como formas contextuales " no deben usarse en el intercambio general" [4] . Unicode tiene otros métodos para codificar la diferencia si es necesario, como el conector de ancho cero .


Unicode general
Formas contextualesNombre
AisladoFinal (Fin)Medial (medio)Inicial (Comienzo)
0627
A
FE8D
FE8E
'alif
0628
h
FE8F
FE90
FE92
FE91
licenciado en Letras
062A
A
FE95
FE96
FE98
FE97
ejército de reserva
062B
ث
FE99
FE9A
FE9C
FE9B
ejército de reserva
062C
ج
FE9D
FE9E
FEA0
FE9F
yo
062D
A
FEA1
FEA2
FEA4
FEA3
Ja
062E
خ
FEA5
FEA6
FEA8
FEA7
Ja
062F
د
FEA9
FEAA
dal
0630
h
FEAB
FEAC
Dala
0631
ر
FEAD
FEAE
real academia de bellas artes
0632
ز
FEAF
0 de febrero
Zayn/zay
0633
Å
1 de febrero
2 de febrero
4 de febrero
3 de febrero
pecado
0634
ش
5 de febrero
6 de febrero
8 de febrero
7 de febrero
pecado
0635
h
9 de febrero
FEBA
FEBC
FEBB
triste
0636
ض
FEBD
FEBE
FEC0
FEBF
ﺿ
papá
0637
ط
FEC1
FEC2
FEC4
FEC3
ejército de reserva
0638
ظ
FEC5
FEC6
FEC8
FEC7
ẓāʾ
0639
ع
FEC9
FECA
FECC
FECB
ayn
063A
A
FECD
FECE
FED0
FECF
ġayn
0641
FED1
Fed2
FED4
FED3
fa
0642
Fed5
FED6
FED8
Fed7
qaf
0643
a. m.
FED9
FEDA
FEDC
Banco de Desarrollo Económico
Federal
Kaf
0644
a. m .
FEDD
FEDE
Tarifa
0
FEDF
justicia
0645
m
Tarifa 1
Tarifa2
Tarifa 4
Tarifa3
mía
0646
Tarifa 5
Tarifa 6
Tarifa8
Tarifa7
monja
0647
horas
Tarifa 9
FEEA
FEEC
DEBILIDAD
Ja
0648
ALIMENTACIÓN
Tarifa
guau
064A
ي
FEF1
FEF2
FEF4
FEF3
yāʾ
0622
A
FE81
FE82
Maddah de Alif
0629
h
FE93
FE94
Tāʾ marbūṭah
0649
horas
FEEF
FEF0
maqsura de alif

Puntuación y adornos

En la escritura árabe regular solo se utilizan el signo de interrogación árabe ⟨ ؟ ⟩ y la coma árabe ⟨ ، ⟩, y la coma a menudo se sustituye por la coma del alfabeto latino ⟨ , ⟩, que también se utiliza como separador decimal cuando se utilizan números arábigos orientales (por ejemplo, ⟨100,6⟩ en comparación con ⟨ ١٠٠,٦ ⟩).

  • U+060C ، ‎ COMA ÁRABE
  • U+060D ؍ ‎ SEPARADOR DE FECHA ÁRABE
  • U+060E ؎ ‎ SIGNO DE VERSO POÉTICO ÁRABE
  • U+060F ؏ ‎ SIGNO ÁRABE
  • U+061B ؛ ‎ PUNTO Y COMA ÁRABE
  • U+061E ؞ ‎ SIGNO DE PUNTUACIÓN ÁRABE
  • U+061F ؟ ‎ SIGNO DE INTERROGACIÓN ÁRABE
  • U+066D ٭ ESTRELLA ÁRABE DE CINCO PUNTAS
  • U+06D4 ۔ ‎ PUNTO ÁRABE
  • U+06DD ۝ ‎ FIN ÁRABE
  • U+06DE ۞ ‎ INICIO ÁRABE
  • U+06E9 ۩ ‎ LUGAR ÁRABE
  • U+06FD ۽ ‎ SIGNO ÁRABE
  • U+FD3E Paréntesis izquierdo adornado árabe
  • U+FD3F ﴿ Paréntesis derecho adornado árabe

Ligaduras de palabras

Las formas de presentación árabes A tienen algunos caracteres definidos como "ligaduras de palabras" para los términos que se usan con frecuencia en expresiones formales en árabe. Rara vez se usan fuera de la mecanografía litúrgica profesional; además, el grafema rial normalmente se escribe completo, no mediante la ligadura.

  • U+FDF0 ‎ LIGADURA ÁRABE ( صلى , estilizada como صلے )
  • U+FDF1 ‎ LIGADURA ÁRABE ( قلى , estilizada como قلے )
  • U+FDF2 ‎ LIGATURA ÁRABE ( اللّٰه )
  • U+FDF3 ‎ LIGATURA ÁRABE ( اكبر ), como en la frase الله اكبر Allāhu akbar
  • U+FDF4 ‎ LIGATURA ÁRABE ( محمد )
  • U+FDF5 ‎ LIGATURA ÁRABE ( صلعم , la abreviatura de صلى الله عليه وسلم "la paz sea con él")
  • U+FDF6 ‎ LIGATURA ÁRABE ( رسول )
  • U+FDF7 ‎ LIGATURA ÁRABE ( عليه )
  • U+FDF8 ‎ LIGATURA ÁRABE ( وسلم )
  • U+FDF9 ‎ LIGATURA ÁRABE ( صلى )
  • U+FDFA ‎ LIGATURA ÁRABE ( صلى الله عليه وسلم "la paz sea con él")
  • U+FDFB ‎ LIGATURA ÁRABE ( جل جلاله )
  • U+FDFC ‎ SIGNO RIAL ( ريال )
  • U+FDFD ‎ LIGATURA ÁRABE ( بسم الله الرحمن الرحيم bism-i llāh-i r-raḥmān-i r-raḥīm )

Bloques de código

árabe

Tabla de caracteres

CódigoResultadoNombre Unicode
U+0600؀   Signo de número árabe
U+0601A   Signo árabe Sanah
U+0602؂   Marcador de notas al pie en árabe
U+0603A   Señal árabe Safha
U+0604؄   Signo árabe Samvat

Se utiliza para escribir las fechas de la era Samvat en urdu.

U+0605؅   Marca de número árabe arriba

Puede usarse con números coptos epactos.

U+0606؆   Raíz cúbica árabe-índica

→ U+221B ∛ Raíz cúbica

U+0607؇   Cuarta raíz árabe-índica

→ U+221C ∜ Cuarta raíz

U+0608Yo   Rayo árabe
U+0609Yo   Signo árabe-índico por mil

→ U+2030 ‰ Signo por mil

U+060A؊   Signo árabe-índico de diez mil

→ U+2031‱ Signo por diez mil

U+060B؋   Signo afgano
U+060C،   Coma árabe

También se utiliza con Thaana y siríaco en textos modernos.

→ U+002C , Coma

→ U+2E32 ⸲ Coma girada

→ U+2E41 ⹁ Coma invertida

U+060D؍   Separador de fecha árabe
U+060E؎   Signo de verso poético árabe
U+060F؏   Signo árabe Misra
U+0610ؐ   Signo árabe Sallallahou Alayhe Wassallam

Representa sallallahu alayhe wasallam "que la paz y las bendiciones de Dios sean con él"

U+0611ؑ   Señal árabe Alayhe Assallam

Representa alayhe assalam "la paz sea con él"

U+0612ؒ   Signo árabe Rahmatullah Alayhe

Representa a rahmatullah alayhe "que Dios tenga misericordia de él"

U+0613ؓ   Signo árabe Radi Allahou Anhu

representa radi allahu 'anhu "que Dios esté complacido con él"

U+0614ؔ   Signo árabe Takhallus

Signo que se coloca sobre el nombre o seudónimo de un poeta, o en algunos escritos utilizado para marcar todos los nombres propios.

U+0615ؕ   Árabe Tah Alto Pequeño

marca una posición de pausa recomendada en algunos Coranes publicados en Irán y Pakistán, no debe confundirse con el pequeño signo TAH utilizado como diacrítico para algunas letras como 0679

U+0616ؖ   Ligadura alta pequeña árabe Alef con Lam y Yeh

persa temprano

Ligadura alta pequeña árabe Alef con Yeh Barree

U+0617ؗ   Zain árabe pequeño y alto
U+0618ؘ   Fatha árabe pequeña

No debe confundirse con 064E Fatha

U+0619ؙ   Damma árabe pequeña

No debe confundirse con 064F Damma

U+061Aؚ   Kasra árabe pequeña

No debe confundirse con 0650 Kasra

U+061BA   Punto y coma árabe

También se utiliza con Thaana y siríaco en textos modernos → U+003B ; Punto y coma → U+204F ⁏ Punto y coma invertido → U+2E35 ⸵ Punto y coma girado

U+061CA   Letra árabe Mark (Alm)
U+061DA   Marca de fin de texto en árabe
U+061EYo   Signo de puntuación árabe de tres puntos
U+061F؟   Signo de interrogación árabe

También se utiliza con thaana y siríaco en textos modernos → U+003F ? Signo de interrogación → U+2E2E ⸮ Signo de interrogación invertido

U+0620ؠ   Letra árabe Kashmiri Yeh
U+0621A   Letra árabe Hamza

→ U+02BE ʾ Letra modificadora mitad derecha del anillo

U+0622A   Letra árabe Alef con Madda encima

≡ Última modificación: 2012-04-08 U+0627 U+0653

U+0623A   Letra árabe Alef con Hamza encima

≡ Ñ U+0627 U+0654

U+0624A   Letra árabe waw con hamza encima

≡ Å U+0648 U+0654

U+0625إ   Letra árabe Alef con Hamza debajo

≡ Å U+0627 U+0655

U+0626ئ   Letra árabe Yeh con Hamza encima

En kirguís, la hamza se ubica sistemáticamente en la parte superior derecha en las formas aisladas y finales ≡ ئ U+064A U+0654

U+0627ا   Letra árabe Alef
U+0628Ya   Letra árabe Beh
U+0629Ya   Letra árabe Teh Marbuta
U+062AYo   Letra árabe Teh
U+062B   Letra árabe Theh
U+062Cج   Letra árabe Jeem
U+062DYo   Letra árabe Hah
U+062Eخ   Letra árabe Khah
U+062F   Letra árabe Dal
U+0630ذ   Letra árabe Thal
U+0631ر   Letra árabe Reh
U+0632ز   Letra árabe Zain
U+0633س   Letra árabe vista
U+0634ش   Letra árabe Sheen
U+0635A   Letra árabe triste
U+0636ض   Letra árabe papá
U+0637ط   Letra árabe Tah
U+0638ظ   Letra árabe Zah
U+0639ع   Letra árabe Ain

→ U+01B9 ƹ Letra latina minúscula Ezh invertida → U+02BF ʿ LETRA MODIFICADORA MEDIO ANILLO IZQUIERDO

U+063AA   Letra árabe Ghain
U+063Bػ   Letra árabe Keheh con dos puntos encima
U+063Cؼ   Letra árabe Keheh con tres puntos debajo
U+063Dؽ   Letra árabe farsi Yeh con V invertida

Azerbaiyano

U+063Eؾ   Letra árabe farsi Yeh con dos puntos arriba
U+063Fؿ   Letra árabe farsi Yeh con tres puntos arriba
U+0640ـ   Tatweel árabe

Se inserta para estirar caracteres o para llevar tashkil sin letra base. También se utiliza con Adlam, Hanifi Rohingya, Mandaic, Manichaean, Psalter Pahlavi, Sogdian y Syriac= kashida.

U+0641ف   Letra árabe feh
U+0642ق   Letra árabe Qaf
U+0643ك   Letra árabe Kaf
U+0644A   Letra árabe Lam
U+0645mi   Letra árabe meem

Sindhi utiliza una forma con una cola corta.

U+0646ن   Letra árabe mediodía
U+0647ه   Letra árabe Heh
U+0648Yo   Letra árabe waw
U+0649ى   Letra árabe Alef Maksura

representa una letra de unión doble con forma de YEH sin puntos en ninguna forma posicional, no destinada a usarse en combinación con 0654 → U+0626 ئ Letra árabe Yeh con Hamza encima

U+064AYo   Letra árabe Yeh

pierde sus puntos cuando se usa en combinación con 0654 conserva sus puntos cuando se usa en combinación con otras marcas de combinación → U+08A8 ࢨ Letra árabe Yeh con dos puntos debajo y Hamza encima

U+064Bً   Fathatan árabe
U+064Cٌ   Damatán árabe

Una forma alternativa común se escribe como dos dammas entrelazadas, una de las cuales está girada 180 grados.

U+064Dٍ   Kasratan árabe
U+064Eَ   Fatha árabe
U+064Fُ   Damma árabe
U+0650ِ   Kasra árabe
U+0651ّ   Shadda árabe
U+0652ْ   Sukun árabe

marca la ausencia de una vocal después de la consonante base utilizada en algunos Coranes para marcar una vocal larga como ignorada puede tener una variedad de formas, incluida una circular y una forma que parece '06E1' → U+06E1 ۡ Cabeza árabe pequeña alta sin punto de Khah

U+0653ٓ   Maddah árabe arriba

utilizado para madd jaa'iz en ortografías del sur de Asia e Indonesia →U+089C ࢜ Árabe Madda Waajib →U+089E ࢞ Árabe Doble Madda →U+089F ࢟ Árabe Medio Madda sobre Madda

U+0654ٔ   Hamza árabe arriba

Restringido a la semántica de Hamza y Ezafe, no se utiliza como diacrítico para formar nuevas letras.

U+0655ٕ   Hamza árabe debajo
U+0656ٖ   Subíndice árabe Alef
U+0657ٗ   Damma árabe invertida

Cachemira, urdu = ulta pesh

U+06581   Árabe Mark Noon Ghunna

Baluchi indica nasalización en urdu

U+06591   Árabe Zwarakay

Pashto

U+065Aٚ   Signo de vocal árabe V pequeña arriba

Lenguas africanas

U+065B1   Signo de vocal árabe V pequeña invertida arriba

Lenguas africanas

U+065Cٜ   Signo de vocal árabe Punto debajo

Las lenguas africanas también se utilizan en el texto coránico en ortografías africanas y otras.

U+065Dٝ   Damma árabe invertida

Lenguas africanas

U+065Eٞ   Fatha árabe con dos puntos

Calami

U+065Fٟ   Hamza árabe ondulada debajo

Cachemira

U+0660٠   Dígito cero árabe-índico
U+06611   Dígito uno árabe-índico
U+0662٢   Dígito dos árabe-índico
U+0663٣   Dígito tres árabe-índico
U+0664٤   Dígito cuatro árabe-índico
U+06655   Dígito cinco árabe-índico
U+0666٦   Dígito seis árabe-índico
U+06677   Dígito siete árabe-índico
U+0668٨   Dígito ocho árabe-índico
U+0669٩   Nueve dígitos árabe-índicos
U+066A٪   Signo de porcentaje árabe

→ U+0025 % Signo de porcentaje

U+066B٫   Separador decimal árabe

La coma ordinaria es la más utilizada en su lugar

→ U+002C , Coma

U+066C٬   Separador de miles en árabe

La coma árabe es la más utilizada en su lugar

→ U+060C ، Coma árabe

→ U+0027 ' Apóstrofe

→ U+2019 ' Comilla simple derecha

U+066D   ٭   Estrella árabe de cinco puntas

apariencia bastante variable

→ U+002A * Asterisco

U+066Eٮ   Letra árabe sin punto Beh
U+066Fٯ   Letra árabe Qaf sin punto
U+0670ٰ   Letra árabe superíndice Alef
U+0671ٱ   Letra árabe Alef Wasla

Árabe coránico

U+0672ٲ   Letra árabe Alef con Hamza ondulada encima

Baluchi, Cachemira

U+0673ٳ   Letra árabe Alef con Hamza ondulada debajo (en desuso) [7] Cachemira

Este carácter está en desuso y su uso está totalmente desaconsejado. Utilice la secuencia 0627 065F en su lugar.

U+0674ٴ   Letra árabe alta Hamza

El kazajo y el jawi forman dígrafos

U+0675ٵ   Letra árabe alta Hamza Alef

La ortografía preferida es ‏ ٴا ‎‏ U+0674 U+0627

U+0676ٶ   Letra árabe alta Hamza Waw

La ortografía preferida es ‏ ٴو ‎‏ U+0674 U+0648

U+0677ٷ   Letra árabe U con Hamza encima

La ortografía preferida es ‏ ٴۇ ‎‏ U+0674 U+06C7

U+0678ٸ   Letra árabe alta Hamza Yeh

La ortografía preferida es ‏ ٴی ‎‏ U+0674 06CC

U+0679ٹ   Letra árabe tteh

Urdú

U+067Aٺ   Letra árabe tteheh

Sindhi

U+067Bٻ   Letra árabe Beeh

Sindhi

U+067Cټ   Letra árabe Teh con anillo

Pashto

U+067Dٽ   Letra árabe Teh con tres puntos arriba y abajo

Sindhi

U+067Eپ   Letra árabe peh

Persa, Urdu, ...

U+067Fٿ   Letra árabe Teheh

Sindhi

U+0680ڀ   Letra árabe Beheh

Sindhi

U+0681ځ   Letra árabe Hah con Hamza encima

Pashto, Sarikoli representa el fonema /dz/

U+0682ڂ   Letra árabe Hah con dos puntos verticales encima

No se utiliza en pastún moderno.

U+0683ڃ   Letra árabe Nyeh

Sindhi

U+0684ڄ   Letra árabe Dyeh

Sindhi, históricamente bosnio

U+0685څ   Letra árabe Hah con tres puntos encima

Pashto, Khwarazmian, Sarikoli representa el fonema /ts/ en pashto

U+0686چ   Letra árabe tcheh

Persa, Urdu, ...

U+0687ڇ   Letra árabe Tcheheh

Sindhi

U+0688ڈ   Letra árabe Ddal

Urdú

U+0689ډ   Letra árabe Dal con anillo

Pashto

U+068Aڊ   Letra árabe Dal con punto debajo

Sindhi, persa temprano, pegon, malgache

U+068Bڋ   Letra árabe Dal con punto debajo y Tah minúscula

Lahnda

U+068Cڌ   Letra árabe Dahal

Sindhi

U+068Dڍ   Letra árabe Ddahal

Sindhi

U+068Eڎ   Letra árabe Dul

Formulario antiguo para DUL, ahora obsoleto en Sindhi Burushaski

U+068Fڏ   Letra árabe Dal con tres puntos arriba y abajo

Forma actual de Sindhi utilizada para DUL

U+0690ڐ   Letra árabe Dal con cuatro puntos encima

Urdu antiguo, ya no se usa

U+0691ڑ   Letra árabe Rreh

Urdú

U+0692ڒ   Letra árabe Reh con V minúscula

kurdo

U+0693ړ   Letra árabe Reh con anillo

Pashto

U+0694ڔ   Letra árabe Reh con punto debajo

Kurdo, persa temprano

U+0695ڕ   Letra árabe Reh con V pequeña debajo

kurdo

U+0696ږ   Letra árabe Reh con punto debajo y punto arriba

Pashto

U+0697ڗ   Letra árabe Reh con dos puntos encima

Dargwa

U+0698ژ   Letra árabe Jeh

Persa, Urdu, ...

U+0699ڙ   Letra árabe Reh con cuatro puntos encima

Sindhi

U+069Aښ   Letra árabe vista con punto abajo y punto arriba

Pashto

U+069Bڛ   Letra árabe vista con tres puntos debajo

persa temprano

U+069Cڜ   Letra árabe vista con tres puntos abajo y tres puntos arriba

Árabe marroquí

U+069Dڝ   Letra árabe triste con dos puntos debajo

Turco

U+069Eڞ   Letra árabe triste con tres puntos encima

Bereber, Burushaski

U+069Fڟ   Letra árabe Tah con tres puntos encima

Hausa antiguo

U+06A0ڠ   Letra árabe Ain con tres puntos encima

Jawi

U+06A1ڡ   Letra árabe sin punto Feh

Adigio

U+06A2ڢ   Letra árabe Feh con punto desplazado hacia abajo

Árabe magrebí

U+06A3ڣ   Letra árabe Feh con punto debajo

Ingushetia

U+06A4ڤ   Letra árabe Veh

Árabe de Oriente Medio para palabras extranjeras Kurdo, Khwarazmian, persa temprano, Jawi

U+06A5ڥ   Letra árabe Feh con tres puntos debajo

Palabras extranjeras en árabe del norte de África

U+06A6ڦ   Letra árabe Peheh

Sindhi

U+06A7ڧ   Letra árabe Qaf con punto encima

Árabe magrebí, uigur

U+06A8ڨ   Letra árabe Qaf con tres puntos encima

Árabe tunecino y argelino

U+06A9ک   Letra árabe Keheh

Persa, urdu, sindhi, ...= kaf mashkula

U+06AAڪ   Letra árabe swash kaf

representa una letra distinta del árabe KAF (0643) en sindhi

U+06ABګ   Letra árabe Kaf con anillo

El pashto puede parecer un KAF árabe (0643) con un anillo debajo de la base.

U+06ACڬ   Letra árabe Kaf con punto encima

No se recomienda su uso para el Jawi gaf, aunque puede encontrarse en algunos datos de texto existentes; el carácter recomendado para el Jawi gaf es 0762 → U+0762 Ԣ Letra árabe Keheh con punto encima

U+06ADڭ   Letra árabe Ng

Uigur, kazajo, árabe marroquí, jawi temprano, persa temprano, ...

U+06AEڮ   Letra árabe Kaf con tres puntos debajo

Bereber, persa temprano, alternativa Pegon para 08B4

U+06AFگ   Letra árabe Gaf

Persa, Urdu, ...

U+06B0ڰ   Letra árabe Gaf con anillo

Lahnda

U+06B1ڱ   Letra árabe Ngoeh

Sindhi

U+06B2ڲ   Letra árabe Gaf con dos puntos debajo

No se utiliza en sindhi

U+06B3ڳ   Letra árabe gueh

Sindhi, Saraiki

U+06B4ڴ   Letra árabe Gaf con tres puntos encima

No se utiliza en sindhi ni karakalpak.

U+06B5ڵ   Letra árabe Lam con V minúscula

Kurdo, históricamente bosnio

U+06B6ڶ   Letra árabe Lam con punto encima

kurdo

U+06B7ڷ   Letra árabe Lam con tres puntos encima

kurdo

U+06B8ڸ   Letra árabe Lam con tres puntos debajo

Avar, Soqotri

U+06B9ڹ   Letra árabe mediodía con punto debajo
U+06BAں   Letra árabe Noon Ghunna

Urdu, árabe arcaico sin punto en las cuatro formas contextuales

U+06BBڻ   Letra árabe Rnoon

Sin punto en las cuatro formas contextuales Sindhi

U+06BCڼ   Letra árabe mediodía con anillo

Pashto

U+06BDڽ   Letra árabe mediodía con tres puntos encima

Jawi

U+06BEھ   Letra árabe Heh Doachashmee

Las formas dígrafos aspirados en urdu y otras lenguas del sur de Asia representan la fricativa glotal /h/ en uigur.

U+06BFڿ   Letra árabe tcheh con punto encima
U+06C0ۀ   Letra árabe Heh con Yeh encima

para ezafe, use 0654 sobre la letra base apropiada del idioma en realidad es una ligadura, no una letra independiente letra árabe hamzah sobre ha (1.0) ≡ ۀ U+06D5 U+0654

U+06C1ہ   Letra árabe Heh Objetivo

Urdú

U+06C2ۂ   Letra árabe Heh Goal con Hamza encima

El urdu en realidad es una ligadura, no una letra independiente ≡ۂ U+06C1 U+0654

U+06C3ۃ   Letra árabe Teh Marbuta Meta

Urdú

U+06C4ۄ   Letra árabe Waw con anillo

Cachemira

U+06C5ۅ   Letra árabe kirguisa Oe

Existe una variante del glifo kirguís que reemplaza la cola en forma de bucle con una barra horizontal que la atraviesa.

U+06C6ۆ   Letra árabe Oe

Uigur, kurdo, kazajo, azerbaiyano, históricamente bosnio

U+06C7ۇ   Letra árabe U

Azerbaiyano, kazajo, kirguiso, uigur

U+06C8ۈ   Letra árabe Yu

Uigur

U+06C9ۉ   Letra árabe kirguisa Yu

Kazajo, kirguís, históricamente bosnio

U+06CAۊ   Letra árabe waw con dos puntos encima

kurdo

U+06CBۋ   Letra árabe Ve

Uigur, kazajo

U+06CCی   Letra árabe farsi yeh

Árabe, persa, urdu, cachemiro... las formas inicial y medial de esta letra tienen puntos → U+0649 ى LETRA ÁRABE ALEF MAKSURA → U+064A ي Letra árabe Yeh

U+06CDۍ   Letra árabe Yeh con cola

Pashto, sindhi

U+06CEێ   Letra árabe Yeh con V minúscula

kurdo

U+06CFۏ   Letra árabe waw con punto encima

Jawi

U+06D0ې   Letra árabe E

Pashto, Uyghur utilizado como la letra bbeh en sindhi

U+06D1ۑ   Letra árabe Yeh con tres puntos debajo

Lenguas mende, hausa

U+06D2ے   Letra árabe Yeh Barree

Urdú

U+06D3ۓ   Letra árabe Yeh Barree con Hamza encima

Urdú

U+06D4۔   Punto final árabe

Urdú

U+06D5ە   Letra árabe Ae

Uigur, kazajo, kirguís

U+06D6ۖ   Ligadura alta pequeña árabe triste con lam y alef maksura
U+06D7ۗ   Ligadura alta pequeña árabe Qaf con Lam y Alef Maksura
U+06D8ۘ   Forma inicial de Meem alta y pequeña en árabe
U+06D9ۙ   Lam Alef árabe pequeña y alta
U+06DAۚ   Jeem árabe pequeño y alto
U+06DBۛ   Árabe Pequeño Alto Tres Puntos
U+06DCۜ   Árabe Pequeño Alto Visto
U+06DD۝   Final árabe de Ayah
U+06DE۞   Estrella árabe de Rub El Hizb
U+06DF۟   Árabe Pequeño Alto Redondeado Cero

más pequeño que la forma circular típica utilizada para 0652

U+06E0۠   Cero rectangular vertical pequeño árabe

El término "cero rectangular" es una traducción del nombre árabe de este signo.

U+06E1ۡ   Presentación de la forma de cabeza de Khah árabe pequeña sin puntos altos de 0652, utilizando tecnología de fuentes para seleccionar la variante preferida

usado en algunos Coranes para marcar la ausencia de una vocal = árabe jazm → U+0652 ْ árabe Sukun

U+06E2ۢ   Forma aislada árabe pequeña y alta de Meem
U+06E3ۣ   Árabe Pequeño Bajo Visto
U+06E4ۤ   Madda árabe pequeña y alta

Generalmente se utiliza con 06E5, 06E6, 06E7 y 08F3

U+06E5ۥ   Pequeña waw árabe

→ U+08D3 ࣓ Waw árabe pequeña y grave → U+08F3 ࣳ Waw árabe pequeña y aguda

U+06E6ۦ   Yeh árabe pequeño
U+06E7ۧ   Árabe pequeña alta Yeh
U+06E8ۨ   Mediodía árabe pequeño
U+06E9۩   Lugar árabe de Sajdah

Hay una variedad de glifos aceptables para este personaje.

U+06EA۪   Centro vacío árabe de parada baja
U+06EB۫   Centro vacío árabe de parada alta
U+06EC۬   Tope alto árabe redondeado con centro relleno

También se utiliza en textos coránicos en ortografías africanas y otras para representar wasla, ikhtilas, etc.

U+06EDۭ   Árabe pequeño bajo Meem
U+06EEۮ   Letra árabe Dal con V invertida
U+06EFۯ   Letra árabe Reh con V invertida

También se utiliza en el persa temprano.

U+06F00   Dígito cero árabe-índico extendido
U+06F11   Dígito uno árabe-índico extendido
U+06F22   Dígito dos árabe-índico extendido
U+06F3۳   Dígito tres árabe-índico extendido
U+06F44   Dígito cuatro árabe-índico extendido

El persa tiene un glifo diferente al sindhi y al urdu.

U+06F55   Dígito cinco árabe-índico extendido

El persa, el sindhi y el urdu comparten un glifo diferente del árabe

U+06F66   Dígito seis árabe-índico extendido

El persa, el sindhi y el urdu tienen glifos diferentes a los del árabe.

U+06F77   Dígito siete árabe-índico extendido

El urdu y el sindhi tienen glifos diferentes a los del árabe.

U+06F88   Dígito ocho árabe-índico extendido
U+06F99   Dígito nueve árabe-índico extendido
U+06FAۺ   Letra árabe Sheen con punto debajo
U+06FBۻ   Letra árabe papá con punto debajo
U+06FCۼ   Letra árabe Ghain con punto debajo
U+06FD۽   Signo árabe Sindhi Ampersand
U+06FE۾   Signo árabe Sindhi Postposición Hombres
U+06FFۿ   Letra árabe Heh con V invertida

Mesa compacta

Árabe [1] [2] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+060x ؀  A  A  A  A  A AAYoYoA mí؋،؍A؏
U+061xAؑؒAؔAؘؖؗAؚA ALM AA؟
U+062xAAAAAAAAبYaA míثجAsiخ
U+063xAرزسشAضAظعAػAAAؿ
U+064xـyoق1Ami11YoYoYoًٌٍَُ
U+065xِ1ْٕٖٓٔ111ٚ11ٝ1ٟ
U+066x٠1٢1015٦7111٫٬٭ٮٯ
U+067xٰٱ1ٳ11ٶٷٸٹ1ٻ1ٽ1ٿ
U+068xڀځڂڃڄڅچڇڈډڊڋڌڍڎڏ
U+069xڐڑڒړڔڕږڗژڙښڛڜڝڞڟ
U+06Axڠڡڢڣڤڥڦڧڨکڪګڬڭڮگ
U+06Bxڰڱڲڳڴڵڶڷڸڹںڻڼڽھڿ
U+06Cxۀہۂۃۄۅۆۇۈۉۊۋیۍێۏ
U+06Dxېۑےۓ۔ەۖۗۘۙۚۛۜ ۝ ۞۟
U+06Exۣ۠ۡۢۤۥۦۧۨ۩۪ۭ۫۬ۮۯ
U+06Fx0123456789ۺۻۼ۽۾ۿ
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ El punto de código Unicode U+0673 está obsoleto a partir de la versión Unicode 6.0

Suplemento árabe

Suplemento árabe [1] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+075xn����n������n����n��n������
U+076x��������������������nn��nnn
U+077x������������������n����������
Notas
1. ^ A partir de la versión Unicode 16.0

Árabe ampliado-B

Árabe ampliado-B [1] [2] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+087x
U+088xAAA.Yo
U+089x ࢐  ࢑ AA
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ Las áreas grises indican puntos de código no asignados

Árabe extendido-A

Árabe ampliado-A [1] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+08AxAAAYoYoEnYoYo
U+08BxAAYoA míAA mí
U+08CxAAAYoYoA mí
U+08DxAYYoAAAYo
U+08Ex A AA.AYoYoYoYoYo
U+08FxAAA míAA míA mí
Notas
1. ^ A partir de la versión Unicode 16.0

Formularios de presentación en árabe A

Se trata en su mayoría de ligaduras que se pueden crear a partir de los caracteres de los gráficos anteriores, con excepción de los grafemas tipo corchete ﴾ ﴿ y algunas de ellas son ligaduras de frases litúrgicas comunes.

Formularios de presentación árabes-A [1] [2] [3] Cuadro de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+FB5x
U+FB6x
U+FB7xﭿ
U+FB8x
U+FB9x
U+FBAx
U+FBBx﮿
U+FBCx
U+FBDx
U+FBEx
U+FBFxﯿ
U+FC0x
U+FC1x
U+FC2x
U+FC3xﰿ
U+FC4x
U+FC5x
U+FC6x
U+FC7xﱿ
U+FC8x
U+FC9x2222
U+FCAx
U+FCBx122ﲿ
U+FCCx
U+FCDx
U+FCEx
U+FCFxﳿ
U+FD0x
U+FD1x
U+FD2x
U+FD3x﴿
U+FD4x
U+FD5x
U+FD6x
U+FD7xﵿ
U+FD8x
U+FD9x
U+FDAx
U+FDBxﶿ
U+FDCx
U+FDDx
U+FDEx
U+FDFx﷿
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ Las áreas grises indican puntos de código no asignados
3. ^ Las áreas negras indican caracteres no codificados (puntos de código que se garantiza que nunca se asignarán como caracteres codificados en el estándar Unicode).

Formularios de presentación en árabe B

Todos ellos se pueden crear a partir de los caracteres del gráfico básico.

Formularios de presentación árabes-B [1] [2] Cuadro de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+FE7xﹿ
U+FE8x
U+FE9x
U+FEAx
U+FEBxﺿ
U+FECx
U+FEDx
U+FEEx
U+FEFxZW
NBSP
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ Las áreas grises indican puntos de código no asignados

Símbolos numéricos de Rumi

Símbolos numéricos de Rumi [1] [2] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+10E6x𐹠𐹡𐹢𐹣𐹤𐹥𐹦𐹧𐹨𐹩𐹪𐹫𐹬𐹭𐹮𐹯
U+10E7x𐹰𐹱𐹲𐹳𐹴𐹵𐹶𐹷𐹸𐹹𐹺𐹻𐹼𐹽𐹾
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ El área gris indica un punto de código no asignado

Árabe extendido-C

Árabe Extendido-C [1] [2] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+10ECx𐻂𐻃𐻄
U+10EDx
U+10 EEx
U+10EFx𐻼𐻽𐻾𐻿
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ Las áreas grises indican puntos de código no asignados

Números de Siyaq índicos

Números de la lengua india [1] [2] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+1EC7x𞱱𞱲𞱳𞱴𞱵𞱶𞱷𞱸𞱹𞱺𞱻𞱼𞱽𞱾𞱿
U+1EC8x𞲀𞲁𞲂𞲃𞲄𞲅𞲆𞲇𞲈𞲉𞲊𞲋𞲌𞲍𞲎𞲏
U+1EC9x𞲐𞲑𞲒𞲓𞲔𞲕𞲖𞲗𞲘𞲙𞲚𞲛𞲜𞲝𞲞𞲟
U+1ECAx𞲠𞲡𞲢𞲣𞲤𞲥𞲦𞲧𞲨𞲩𞲪𞲫𞲬𞲭𞲮𞲯
U+1 ECBx𞲰𞲱𞲲𞲳𞲴
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ Las áreas grises indican puntos de código no asignados

Números del Siyaq otomano

Números del siyaq otomano [1] [2] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+1ED0x𞴁𞴂𞴃𞴄𞴅𞴆𞴇𞴈𞴉𞴊𞴋𞴌𞴍𞴎𞴏
U+1ED1x𞴐𞴑𞴒𞴓𞴔𞴕𞴖𞴗𞴘𞴙𞴚𞴛𞴜𞴝𞴞𞴟
U+1ED2x𞴠𞴡𞴢𞴣𞴤𞴥𞴦𞴧𞴨𞴩𞴪𞴫𞴬𞴭𞴮𞴯
U+1ED3x𞴰𞴱𞴲𞴳𞴴𞴵𞴶𞴷𞴸𞴹𞴺𞴻𞴼𞴽
U+1ED4x
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ Las áreas grises indican puntos de código no asignados

Símbolos alfabéticos matemáticos árabes

Símbolos alfabéticos matemáticos árabes [1] [2] Tabla de códigos oficiales del Consorcio Unicode (PDF)
 0123456789ABdoDmiF
U+1EE0x𞸀𞸁𞸂𞸃𞸅𞸆𞸇𞸈𞸉𞸊𞸋𞸌𞸍𞸎𞸏
U+1EE1x𞸐𞸑𞸒𞸓𞸔𞸕𞸖𞸗𞸘𞸙𞸚𞸛𞸜𞸝𞸞𞸟
U+1EE2x𞸡𞸢𞸤𞸧𞸩𞸪𞸫𞸬𞸭𞸮𞸯
U+1EE3x𞸰𞸱𞸲𞸴𞸵𞸶𞸷𞸹𞸻
U+1EE4x𞹂𞹇𞹉𞹋𞹍𞹎𞹏
U+1EE5x𞹑𞹒𞹔𞹗𞹙𞹛𞹝𞹟
U+1EE6x𞹡𞹢𞹤𞹧𞹨𞹩𞹪𞹬𞹭𞹮𞹯
U+1EE7x𞹰𞹱𞹲𞹴𞹵𞹶𞹷𞹹𞹺𞹻𞹼𞹾
U+1EE8x𞺀𞺁𞺂𞺃𞺄𞺅𞺆𞺇𞺈𞺉𞺋𞺌𞺍𞺎𞺏
U+1EE9x𞺐𞺑𞺒𞺓𞺔𞺕𞺖𞺗𞺘𞺙𞺚𞺛
U+1EEAx𞺡𞺢𞺣𞺥𞺦𞺧𞺨𞺩𞺫𞺬𞺭𞺮𞺯
U+1EEBx𞺰𞺱𞺲𞺳𞺴𞺵𞺶𞺷𞺸𞺹𞺺𞺻
U+1EECx
U+1 EEDx
U+1EEEx
U+1 EEFx𞻰𞻱
Notas
1. ^ A partir de la versión Unicode 16.0
2. ^ Las áreas grises indican puntos de código no asignados

Referencias

  1. ^ "¿Cuál es el origen del ampersand (&)?"
  2. ^ unicode.org Biografía: Thomas Milo - DecoType
  3. ^ "UAX #24: Archivo de datos de script". Base de datos de caracteres Unicode . El Consorcio Unicode.
  4. ^ ab "Sección 9.2: Árabe, Formas de presentación árabes-B". El estándar Unicode . El Consorcio Unicode. Septiembre de 2024.
  5. ^ Pandey, Anshuman (5 de noviembre de 2015). "L2/15-121R2: Propuesta para codificar los números índicos siyaq" (PDF) .
  6. ^ ab "Capítulo 22: Símbolos". Unicode, Inc. Septiembre de 2024.
  7. ^ Obsoleto a partir de la versión Unicode 6.0 Historial de cambios de UCD "La combinación particular de una alef con esta marca vocálica debe escribirse con la secuencia <U+0627 LETRA ÁRABE ALEF, U+065F HAMZA ONDULADA ÁRABE ABAJO>, en lugar de con el carácter U+0673 LETRA ÁRABE ALEF CON HAMZA ONDULADA ABAJO, que ha quedado obsoleto y que no es canónicamente equivalente. "Sección 9.2: Árabe, marcas vocálicas adicionales". El estándar Unicode . El Consorcio Unicode. Septiembre de 2024.
  • Oibane. "Problemas con Unicode". Árabe en Linux . Archivado desde el original el 3 de febrero de 2008.
  • Arabunic. "Arabúnico: unicode <-> glifos, convertidor bidireccional". Aplicación Java que convierte glifos a unicode (y unicode a glifos). Tiene en cuenta ligaduras, lam-alif, diacríticos, etc.
  • Scheherazade o Scheherazade New, una fuente de escritura árabe extendida diseñada por SIL International , distribuida bajo la Licencia de Fuente Abierta SIL (OFL)
  • Harmattan, una fuente de escritura árabe extendida diseñada por SIL International para África Occidental, distribuida bajo la Licencia de Fuente Abierta SIL (OFL)
Obtenido de "https://es.wikipedia.org/w/index.php?title=Escritura_árabe_en_Unicode&oldid=1247221035"