Alfabeto urdu اُردُو حُرُوفِ تَہَجِّی Urdū ḥurūf-i tahajjī | |
---|---|
Tipo de script | |
Guión oficial | |
Idiomas |
|
Guiones relacionados | |
Sistemas parentales | |
Unicode | |
U+0600 a U+06FF U+0750 a U+077F | |
Alfabeto urdu |
---|
ا ( آ ) ب پ ت ٹ ث ج چ ح خ د ڈ ذ ر ڑ ز ژ س ش ص ض ط ظ ع غ ف ق ک گ ل م ن ( ں ) و ہ ( ھ ) ء ی ے |
Escritura persoárabe extendida |
Sistemas de escritura |
---|
Abjad |
Abugida |
Alphabetical |
Logographic |
Syllabic |
Hybrids |
Japanese (Logographic and syllabic) Hangul (Alphabetic and syllabic) |
El alfabeto urdu ( urdu : اُردُو حُرُوفِ تَہَجِّی , romanizado : urdū ḥurūf-i tahajjī ) es el alfabeto de derecha a izquierda utilizado para escribir urdu . Es una modificación del alfabeto persa , que a su vez deriva de la escritura árabe . Tiene estatus cooficial en las repúblicas de Pakistán , India y Sudáfrica . El alfabeto urdu tiene hasta 39 [4] o 40 [5] letras distintas sin mayúsculas y minúsculas diferenciadas y generalmente se escribe en la escritura caligráfica Nastaʿlīq , mientras que el árabe se escribe más comúnmente en el estilo Naskh .
Por lo general, las simples transliteraciones del urdu al alfabeto latino (llamado urdu romano ) omiten muchos elementos fonémicos que no tienen equivalente en inglés ni en otros idiomas comúnmente escritos en escritura latina .
La escritura urdu estándar es una versión modificada de la escritura persoárabe y tiene su origen en el Irán del siglo XIII . También está relacionada con la shahmukhi , utilizada para las variedades de la lengua punjabi en Punjab, Pakistán . Está estrechamente relacionada con el desarrollo del estilo nastaʻliq de la escritura persoárabe.
A pesar de la invención de la máquina de escribir urdu en 1911, los periódicos urdu continuaron publicando copias de textos manuscritos de calígrafos conocidos como katibs o khush-navees hasta finales de los años 1980. El periódico nacional paquistaní Daily Jang fue el primer periódico urdu en utilizar la composición basada en computadora nastaʿlīq . Se están realizando esfuerzos para desarrollar un soporte urdu más sofisticado y fácil de usar en computadoras e Internet . Hoy en día, casi todos los periódicos, revistas, diarios y publicaciones periódicas urdu se componen en computadoras con programas de software urdu.
Además del subcontinente indio , la escritura urdu también se utiliza en la gran diáspora de Pakistán , incluido el Reino Unido , los Emiratos Árabes Unidos , los Estados Unidos , Canadá , Arabia Saudita y otros lugares. [5]
El urdu se escribe en estilo nastaliq ( persa : نستعلیق nastaʿlīq). El estilo de escritura caligráfica nastaliq comenzó como una mezcla persa de las escrituras naskh y taliq . Después de la conquista musulmana del subcontinente indio , nastaʻliq se convirtió en el estilo de escritura preferido para el urdu. Es el estilo dominante en Pakistán y muchos escritores urdu en otras partes del mundo lo usan. Nastaʿlīq es más cursivo y fluido que su contraparte naskh.
En el alfabeto árabe y en muchos otros derivados de él, se considera que las letras tienen dos o tres formas generales cada una, según su posición en la palabra (aunque la caligrafía árabe puede añadir una gran complejidad). Pero el estilo nastaliq en el que se escribe el urdu utiliza más de tres formas generales para muchas letras, incluso en documentos simples y no decorativos. [6]
La escritura urdu es una escritura abyad derivada de la escritura persa moderna , que a su vez es un derivado de la escritura árabe . Como abyad, la escritura urdu solo muestra consonantes y vocales largas; las vocales cortas solo se pueden inferir por la relación de las consonantes entre sí. Si bien este tipo de escritura es conveniente en lenguas semíticas como el árabe y el hebreo , cuyas raíces consonánticas son la clave de la oración, el urdu es una lengua indoeuropea , que requiere más precisión en la pronunciación del sonido vocálico, por lo que necesita más memorización. El número de letras en el alfabeto urdu es algo ambiguo y debatido. [7]
Nombre [8] | Formularios | API | Romanización | Unicode | Orden | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Urdu Urdu romano | Aislado | Final | Medio | Inicial | ALA-LC [9] | Hunteriano [10] | [A] | [12] | [B] | ||
el alif | A | ـا | /ɑː/, /ʔ/, muda [C] | a , - | a , - | U+0627 | 1 | 1 | 1 | ||
بے bē | ب | ـب | ـبـ | Ya | /b/ | b | b | U+0628 | 2 | 2 | 2 |
پے pē | 1 | ـپ | ـپـ | پـ | /pag/ | pag | pag | U+067E | 3 | 3 | 3 |
تے tē | A mí | Sí | تـ | Sí | /t/ | a | a | U+062A | 4 | 4 | 4 |
ٹے ṭē | ٹ | ـٹ | ـٹـ | ٹـ | /ʈ/ | Sí | a | U+0679 | 5 | 5 | 5 |
Sí , sí | ث | Sí | ـثـ | Sí | /s/ | s | s | U+062B | 6 | 6 | 6 |
el señor jīm | ج | ـج | ـجـ | Sí | /d͡ʒ/ | yo | yo | U+062C | 7 | 7 | 7 |
چے cē | چ | ـچ | ـچـ | چـ | /t͡ʃ/ | do | c | U+0686 | 8 | 8 | 8 |
El hombre que se acostó | Asi | ـح | ـحـ | Sí | /ɦ/ | o | yo | U+062D | 9 | 9 | 9 |
حائے حطی ḥā'e huttī | |||||||||||
حائے مہملہ ḥā'e muhmala | |||||||||||
خے k͟hē | خ | ـخ | ـخـ | Sí | /incógnita/ | k͟h | Yo | U+062E | 10 | 10 | 10 |
El dal | Sí | Sí | /d/ | d | d | U+062F | 11 | 11 | 11 | ||
ڈال ḍāl | ڈ | ـڈ | /ɖ/ | d | d | U+0688 | 12 | 12 | 12 | ||
El hombre | A | ـذ | /y/ | ẕ | el | U+0630 | 13 | 13 | 13 | ||
رے rē | ر | ـر | /r/ | a | a | U+0631 | 14 | 14 | 14 | ||
ڑے ṛē | ڑ | ـڑ | /ɽ/ [D] | ṛ | a | U+0691 | 15 | 15 | 15 | ||
زے zē | ز | ـز | /y/ | el | el | U+0632 | 16 | 16 | 16 | ||
ژے zhē | ژ | ـژ | /ʒ/ [Mi] | es | es | U+0698 | 17 | 17 | 17 | ||
No es pecado | س | ـس | ـسـ | Sí | /s/ | s | s | U+0633 | 18 | 18 | 18 |
El shin | ش | ـش | ـشـ | Ya | /ʃ/ | ella | ella | U+0634 | 19 | 19 | 19 |
El sueño | A | ـص | صـ | Sí | /s/ | s | s | U+0635 | 20 | 20 | 20 |
El hombre ẓwād | ض | ـض | ـضـ | Sí | /y/ | ẓ | el | U+0636 | 21 | 21 | 21 |
طوے t̤oʼē | A | ـط | ـطـ | Asi | /t/ | eso | a | U+0637 | 22 | 22 | 22 |
ظوے z̤oʼē | ظ | ـظ | ـظـ | ظـ | /y/ | z̤ | el | U+0638 | 23 | 23 | 23 |
Sí , sí | ع | ـع | عـ | عـ | /ɑː/, /oː/, /eː/, /ʔ/, /ʕ/, mudo | ` | ` [ cita requerida ] | U+0639 | 24 | 24 | 24 |
غین g͟hain | A | ـغ | ـغـ | Sí | /ɣ/ | G͟h | Gh | U+063A | 25 | 25 | 25 |
فے fē | Yo | ـف | ـفـ | فـ | /F/ | F | F | U+0641 | 26 | 26 | 26 |
El qaf | ق | ـق | ـقـ | قـ | /q/ | q | q | U+0642 | 27 | 27 | 27 |
کاف kāf | ک | ـک | ـکـ | کـ | /a/ | a | a | U+06A9 | 28 | 28 | 28 |
گاف gāf | گ | ـگ | ـگـ | گـ | /ɡ/ | gramo | gramo | U+06AF | 29 | 29 | 29 |
El hombre es | A | Sí | ـلـ | Sí | /yo/ | yo | yo | U+0644 | 30 | 30 | 30 |
yo soy | mi | ـم | ـمـ | mucho | /metro/ | metro | metro | U+0645 | 31 | 31 | 31 |
نون monja | 1 | ـن | ـنـ | نـ | /n/, /ɲ/, /ɳ/, /ŋ/ | norte | norte | U+0646 | 32 | 32 | 32 |
نون غنّہ nūn g͟hunnā | ں ٘ | ـں | ـںـ | المالكـ | / ◌̃ / [D] | norte | norte | U+06BA U+0658 [F] | [GRAMO] | 32a | 33 |
واؤ wā'o | Yo | Sí | / ʋ /, /u ː /, / ʊ /, /o ː /, / ɔː / | v , ū , u , o , au | w , ū , u , o , au | U+0648 | 33 | 33 | 34 | ||
ہے él | ہ | ـہ | ـہـ | ہـ | /ɦ/, /ɑː/, /eː/ | h , a , e | h , a , e | U+06C1 [H] | 34 | 34 | 35 |
چھوٹی ہے choṭī hē | 34a | ||||||||||
دو چشمی ہے do-cashmī hē | ھ | ـھ | ـھـ | المالكـ | /ʰ/ o /ʱ/ [D] | yo | yo | U+06BE | 35 | 34b | 36 |
Sí, sí | ی | ـی | ـیـ | یـ | /j/, /iː/, /ɑː/ | y , í , á | y , í , á | U+06CC | 36 | 35 | 38 |
بڑی یے baṛī yē | ے | ـے | /ɛː/, /eː/ [D] | ay , e | ay , e | U+06D2 | 37 | 35b | 39 | ||
المزہ hamzah | A | ـئ | ـئـ | Sí | /ʔ/ o silenciosa [yo] | ʼ, –, yi | ʼ, –, yi | U+0626 | 35a | 37 [J] | |
A | U+0621 | 0 |
Tāʼ marbūṭah también se considera a veces la cuadragésima letra del alfabeto urdu, aunque rara vez se utiliza, salvo en ciertos préstamos del árabe. Tāʼ marbūṭah se considera una forma de tā, la versión árabe del urdu tē, pero no se pronuncia como tal y, cuando se reemplaza por una letra urdu en préstamos naturalizados, suele reemplazarse por Gol hē.
Grupo | Letra [A] | Nombre (ver: Glosario de palabras clave) | Unicode [13] [14] | |||
---|---|---|---|---|---|---|
Nastaliq [B] | Naskh con diacríticos | Urdu romano o inglés [4] [12] | ||||
Alif | A | A | Por favor, | El amor es mío [12] | Alif Maddah [12] [C] | U+0622 alef con madda encima [14] |
Hamza [D] | A | A | المزہ | فَمْزه [12] | Hamzah | U+0621 hamza [14] |
___ | ___ | Hamza en la línea | ||||
ٔ | ــٔـ | ___ | ___ | diacrítico hamza [C] [E] | U+0654 Hamza Arriba | |
A | A | المزہ | فَمْزه [12] | Hamzah | U+0626 sí con hamza arriba [14] | |
___ | ___ | ye hamza / alif hamza | ||||
ۓ | ۓ | ___ | ___ | Baṛī yē hamza | U+06D3 yeh barree con hamza encima [13] | |
A | A | واوِ مَہْمُوز | واوِ مَہْمُوز [12] | vav-e mahmuz [12] | U+0624 waw con hamza arriba [14] | |
ۂ ۂ | ۂ ـۂ | ___ | ___ | U+06C2 jeje gol con hamza arriba [13] o U+06C1 + U+0654 | ||
Árabe [F] | ۃ ۃ | ۃ ـۃ | Árabe : تاء مربوطة | Árabe : تَاء مَرْبُوطَة | tāʼ marbūṭah "atado ta" | U+06C3 el gol de marbuta [13] |
Sí | Sí, sí | U+0629 la marbuta [14] | ||||
A mí | A mí | Árabe : تاء مفتوحة | Árabe : تَاء مَفْتُوحَة | tāʼ maftūḥah "abrir ta" | U+062A El |
Hamza puede ser difícil de reconocer en la escritura urdu y en las fuentes diseñadas para replicarla, ya que se asemeja mucho a los dos puntos anteriores que aparecen en ت Té y ق Qaf, mientras que en las fuentes árabes y geométricas es más distintivo y se asemeja mucho a la forma occidental del numeral 2 (dos).
Dígrafo [9] | Transcripción [9] | API | Ejemplo |
بھ | bh | [b] | بھاری |
پھ | El ph | [pag] | پھول |
تھ | El | [tʰ] | تھم |
ٹھ | El | [ʈʰ] | ٹھنڈا |
جھ | Yo | [d͡ʒʱ] | جھاڑی |
چھ | c | [t͡ʃʰ] | الستری |
دھ | es | [d] | دھوبی |
ڈھ | El | [ɖʱ] | ڈھول |
رھ | Rh | [rʱ] | تیرھواں |
ڑھ | Rh | [ɽʱ] | اڑھائی |
کھ | Yo | [kʰ] | کھانسی |
گھ | Gh | [ɡʱ] | گھوڑا |
لھ | Lado izquierdo | [lʱ] | دولھا (alternativa de دُلہا ) |
mucho | Hola | [metro] | تمھیں (alternativa de تمہیں ) |
نھ | Nueva Hampshire | [norte] | ننھا (aunque podría decirse que es solo un grupo consonántico) |
وھ | ¿por qué? | [ʋʱ] | وھاب (aunque podría decirse que es solo un grupo consonántico) |
یھ | Sí | [jʱ] | [ ejemplo necesario ] |
El urdu tiene más letras añadidas a la base persa-árabe para representar sonidos que no están presentes en el persa, que ya tiene letras adicionales añadidas a la base árabe para representar sonidos que no están presentes en el árabe. Las letras añadidas se muestran en la siguiente tabla:
Carta | API |
---|---|
ٹ | /ʈ/ |
ڈ | /ɖ/ |
ڑ | /ɽ/ |
ں | /◌̃/ |
ے | /ɛ:/ o /e:/ . |
Existe una letra do-chashmi- he separada , ھ , para denotar una /ʰ/ o una /ʱ/ . Esta letra se utiliza principalmente como parte de la multitud de dígrafos, detallados en la subsección anterior. Además de estas letras, Shahmukhi agrega 2 consonantes sobre el alfabeto urdu para escribir punjabi , y Saraiki agrega 4 consonantes más.
El antiguo indostánico utilizaba cuatro puntos ٿ ڐ ڙ sobre tres letras árabes ت د ر para representar consonantes retroflejas. [16] En la escritura a mano, esos puntos se escribían a menudo como una pequeña línea vertical unida a un pequeño triángulo. Posteriormente, esta forma se volvió idéntica a una letra minúscula ط t̤oʼē . [17] Se supone común y erróneamente que ṭāʾ se utilizaba para indicar consonantes retroflejas debido a que era una consonante alveolar enfática que los escribas árabes pensaban que se aproximaba a las retroflejas indostaníes. [ cita requerida ] En el urdu moderno, to'e siempre se pronuncia como dental , no retrofleja . [ cita requerida ]
El idioma urdu tiene diez vocales y diez vocales nasalizadas. Cada vocal tiene cuatro formas según su posición: inicial, media, final y aislada. Al igual que en su alfabeto original, el árabe, las vocales urdu se representan mediante una combinación de dígrafos y diacríticos. Alif , Waw , Ye , He y sus variantes se utilizan para representar vocales.
El urdu no tiene vocales independientes. Las vocales cortas ( a , i , u ) se representan con diacríticos opcionales ( zabar , zer , pesh ) sobre la consonante precedente o una consonante sustitutiva ( alif , ain o hamzah ) si la sílaba comienza con la vocal, y las vocales largas con las consonantes alif , ain , ye y wa'o como matres lectionis, con diacríticos de desambiguación, algunos de los cuales son opcionales ( zabar , zer , pesh ), mientras que otros no lo son ( madd , hamzah ). El urdu no tiene vocales cortas al final de las palabras. Esta es una tabla de vocales en urdu:
Romanización | Pronunciación | Final | Medio | Inicial |
---|---|---|---|---|
a | /ə/ | N / A | ـَ | Sí |
a | /a/ | Sí, sí, sí | ـَا | A |
i | /ɪ/ | N / A | ـِ | اِ |
i | /i/ | ـِى | ـِیـ | اِیـ |
mi | /mi/ | ـے | ـیـ | ایـ |
ai | /ɛː/ | ـَے | ـَیـ | اَیـ |
tú | /ʊ/ | N / A | ـُ | اُ |
ū | /uː/ | ـُو | Sí | |
o | /oː/ | Sí | Sí | |
es | /ɔː/ | ـَو | Sí |
Alif es la primera letra del alfabeto urdu y se utiliza exclusivamente como vocal. Al principio de una palabra, alif se puede utilizar para representar cualquiera de las vocales cortas: اب ab , اسم ism , اردو Urdū . Para la ā larga al principio de las palabras se utiliza alif-mad: آپ āp , pero un alif simple en el medio y al final: بھاگنا bhāgnā .
Wāʾo se utiliza para traducir las vocales "ū", "o", "u" y "au" ([uː], [oː], [ʊ] y [ɔː] respectivamente), y también se utiliza para traducir la aproximante labiodental , [ʋ]. Solo cuando va precedido de la consonante k͟hē ( خ ), wāʾo puede traducir el sonido "u" ([ʊ]) (como en خود , " k͟hud " - yo mismo ), o no pronunciarse en absoluto (como en خواب , " k͟haab " - sueño ). Esto se conoce como wāʾo silencioso , y solo está presente en palabras prestadas del persa. [18]
Ye se divide en dos variantes: choṭī ye ("pequeño ye") y baṛī ye ("grande ye").
Choṭī ye ( ی ) se escribe en todas sus formas exactamente como en persa. Se utiliza para la vocal larga "ī" y la consonante "y".
Baṛī ye ( ے ) se utiliza para traducir las vocales "e" y "ai" ( /eː/ y /ɛː/ respectivamente). Baṛī ye se distingue por escrito de choṭī ye solo cuando aparece al final de una palabra/ligadura. Además, Baṛī ye nunca se utiliza para comenzar una palabra/ligadura, a diferencia de choṭī ye .
Nombre de la letra | Forma final | Forma media | Forma inicial | Forma aislada |
---|---|---|---|---|
چھوٹی يے Choṭī ye | ـی | ـیـ | یـ | ی |
El hombre Baṛī ye | ـے | ے |
Se divide en dos variantes: gol he ("redondo él") y do-cašmi he ("dos ojos él").
Gol he ( ہ ) se escribe de forma redondeada y en zigzag, y puede dar el sonido "h" ( /ɦ/ ) en cualquier parte de una palabra. Además, al final de una palabra, se puede utilizar para expresar la vocal "a" larga o la vocal "e" ( /ɑː/ o /eː/ ), lo que también altera ligeramente su forma (en los sistemas de escritura digital modernos, esta forma final se logra escribiendo dos he consecutivamente).
Do-cašmi he ( ھ ) se escribe como en el estilo árabe Naskh (como un bucle), para crear las consonantes aspiradas y escribir palabras árabes.
Nombre de la letra | Forma final | Forma media | Forma inicial | Forma aislada |
---|---|---|---|---|
Él es Gol él | ـہ | ـہـ | ہـ | ہ |
دو چشمی ہے Do-cašmi él | ـھ | ـھـ | المالكـ | ھ |
Ayn en su posición inicial y final es silenciosa en la pronunciación y es reemplazada por el sonido de su vocal precedente o sucesora.
La nasalización de vocales se representa mediante nun ghunna escrito después de sus versiones no nasalizadas, por ejemplo: ہَے cuando se nasaliza se convierte en ہَیں . En la forma media, nun ghunna se escribe igual que nun y se diferencia por un diacrítico llamado maghnoona o ulta jazm , que es un símbolo V superscrito sobre ن٘ .
Ejemplos:
Forma | Urdu | Transcripción |
Ortografía | ں | norte |
Formulario final | میں | principal |
Forma media | کن٘ول | kaṉwal |
El urdu utiliza el mismo subconjunto de diacríticos que se utilizan en árabe basándose en las convenciones persas. El urdu también utiliza nombres persas de los diacríticos en lugar de nombres árabes. Los diacríticos de uso común son zabar (árabe fatḥah ), zer (árabe kasrah ), pesh (árabe dammah ), que se utilizan para aclarar la pronunciación de las vocales, como se muestra arriba. Jazam ( ـْـ , árabe sukun ) se utiliza para indicar un grupo de consonantes y tashdid ( ـّـ , árabe shaddah ) se utiliza para indicar una geminación , aunque nunca se utiliza para verbos, que requieren que las consonantes dobles se escriban por separado. Otros diacríticos incluyen khari zabar (árabe dagger alif ), do zabar (árabe fathatan ), que se encuentran en algunas palabras árabes prestadas comunes. Otros diacríticos árabes también se utilizan a veces, aunque muy raramente, en palabras prestadas del árabe. Zer-e-izafat y hamzah-e-izafat se describen en la siguiente sección.
Además de los diacríticos comunes, el urdu también tiene diacríticos especiales, que a menudo se encuentran solo en diccionarios para la aclaración de la pronunciación irregular. Estos diacríticos incluyen kasrah-e-majhool , fathah-e-majhool , dammah-e-majhool , maghnoona , ulta jazam , alif-e-wavi y algunos otros diacríticos muy raros. Entre estos, solo maghnoona se usa comúnmente en diccionarios y tiene una representación Unicode en U+0658. Otros diacríticos solo rara vez se escriben en forma impresa, principalmente en algunos diccionarios avanzados. [19]
Iẓāfat es una construcción sintáctica de dos sustantivos, donde el primer componente es un sustantivo determinado y el segundo es un determinante. Esta construcción fue tomada prestada del persa. Se utiliza una vocal corta "i" para conectar estas dos palabras, y al pronunciar la palabra recién formada, la vocal corta se conecta a la primera palabra. Si la primera palabra termina en una consonante o en una ʿain ( ع ), puede escribirse como zer ( ِ ) al final de la primera palabra, pero generalmente no se escribe en absoluto. Si la primera palabra termina en choṭī he ( ہ ) o ye ( ی o ے ), entonces se utiliza hamzā ( ء ) sobre la última letra ( ۂ o ئ o ۓ ). Si la primera palabra termina en una vocal larga ( ا o و ), entonces se añade una variación diferente de baṛī ye ( ے ) con hamzā encima ( ئے , obtenida añadiendo ے a ئ ) al final de la primera palabra. [20]
Formularios | Ejemplo | Transcripción | Significado |
---|---|---|---|
ــِ | شیرِ پنجاب | sher -e -Panjāb | El león del Punjab |
ۂ | ملکۂ دنیا | malika- e- dunyā | La reina del mundo |
A | Un poco de miedo | walī -e -kāmil | santo perfecto |
ۓ | mucho más | mai- e- ishq | El vino del amor |
ئے | روئے زمین | rū-' e -zamīn | La superficie de la Tierra |
صدائے بلند | sadā-'e - buland | una voz alta |
En los primeros días de las computadoras, el urdu no estaba representado correctamente en ninguna página de códigos . Una de las primeras páginas de códigos para representar el urdu fue IBM Code Page 868, que data de 1990. [21] Otras páginas de códigos tempranas que representaban alfabetos urdu fueron Windows-1256 y la codificación MacArabic, ambas datan de mediados de la década de 1990. En Unicode , el urdu se representa dentro del bloque árabe. Otra página de códigos para el urdu, que se utiliza en la India, es el Código de escritura persoárabe para el intercambio de información . En Pakistán, la página de códigos de 8 bits desarrollada por la Autoridad Nacional del Idioma se llama Urdu Zabta Takhti ( اردو ضابطہ تختی ) (UZT) [22] que representa el urdu en su forma más completa, incluidos algunos de sus diacríticos especializados, aunque UZT no está diseñado para coexistir con el alfabeto latino.
Personajes en urdu | Caracteres en árabe |
---|---|
ہ (U+06C1) ھ (U+06BE) | 1 (U+0647) |
ی (U+06CC) | 1 (U+0649) 1 (U+064A) |
ک (U+06A9) | 1 (U+0643) |
Al igual que otros sistemas de escritura derivados de la escritura árabe, el urdu utiliza el rango Unicode 0600–06FF. [23] Algunos glifos en este rango parecen visualmente similares (o idénticos cuando se presentan utilizando fuentes particulares) a pesar de que la codificación subyacente es diferente. Esto presenta problemas para el almacenamiento y la recuperación de información. Por ejemplo, la copia electrónica de la Universidad de Chicago de "A Dictionary, Hindustani, and English" de John Shakespeare [24] incluye la palabra " بهارت " ( bhārat "India"). La búsqueda de la cadena " بھارت " no devuelve resultados, mientras que la consulta con la cadena (de apariencia idéntica en muchas fuentes) " بهارت " devuelve la entrada correcta. [25] Esto se debe a que la forma medial de la letra urdu do chashmi he (U+06BE), utilizada para formar dígrafos aspirados en urdu, es visualmente idéntica en su forma medial a la letra árabe hāʾ (U+0647; valor fonético /h/ ). En urdu, el fonema /h/ está representado por el carácter U+06C1, llamado gol he ( he redonda ), o chhoti he ( he pequeña ).
En 2003, el Centro de Investigación en Procesamiento del Lenguaje Urdu (CRULP) [26] —una organización de investigación afiliada a la Universidad Nacional de Informática y Ciencias Emergentes de Pakistán— produjo una propuesta para mapear la codificación UZT de 1 byte de caracteres urdu al estándar Unicode. [27] Esta propuesta sugiere un glifo Unicode preferido para cada carácter en el alfabeto urdu.
El Daily Jang fue el primer periódico urdu compuesto digitalmente en nastaʻliq por computadora. Se están realizando esfuerzos para desarrollar un soporte para urdu más sofisticado y fácil de usar en computadoras e Internet. Hoy en día, casi todos los periódicos, revistas, diarios y publicaciones periódicas en urdu se componen en computadoras a través de varios programas de software en urdu, el más extendido de los cuales es el paquete de publicación de escritorio InPage . Microsoft ha incluido soporte para el idioma urdu en todas las nuevas versiones de Windows y tanto Windows Vista como Microsoft Office 2007 están disponibles en urdu a través del soporte del Language Interface Pack [28] . La mayoría de las distribuciones de escritorio de Linux también permiten la fácil instalación del soporte para urdu y las traducciones. [29] Apple implementó el teclado en idioma urdu en los dispositivos móviles en su actualización de iOS 8 en septiembre de 2014. [30]
Existen varios estándares de romanización para escribir urdu con el alfabeto latino, aunque no son muy populares porque la mayoría no representan adecuadamente el idioma urdu. En lugar de esquemas de romanización estándar, las personas en Internet, teléfonos móviles y medios de comunicación a menudo usan una forma no estándar de romanización que intenta imitar la ortografía inglesa . El problema con este tipo de romanización es que solo puede ser leída por hablantes nativos, e incluso para ellos con gran dificultad. Entre los esquemas de romanización estandarizados, el más preciso es la romanización ALA-LC , que también cuenta con el apoyo de la Autoridad Nacional del Idioma. Otros esquemas de romanización a menudo son rechazados porque no pueden representar los sonidos en urdu adecuadamente, o a menudo no tienen en cuenta la ortografía urdu y favorecen la pronunciación sobre la ortografía. [31]
La Autoridad Nacional del Idioma de Pakistán ha desarrollado una serie de sistemas con notaciones específicas para indicar sonidos no ingleses, pero estos solo pueden ser leídos correctamente por alguien que ya esté familiarizado con las letras prestadas. [ cita requerida ]
El urdu romano también tiene importancia entre los cristianos de Pakistán y el norte de la India . El urdu fue la lengua nativa dominante entre los cristianos de Karachi y Lahore en el actual Pakistán y Madhya Pradesh , Uttar Pradesh Rajasthan en la India, durante la primera parte del siglo XIX y XX, y todavía lo usan los cristianos en estos lugares. Los cristianos paquistaníes e indios a menudo usaban la escritura romana para escribir urdu. Por lo tanto, el urdu romano fue una forma común de escribir entre los cristianos paquistaníes e indios en estas áreas hasta la década de 1960. La Sociedad Bíblica de la India publica Biblias en urdū romano que disfrutaron de la venta a fines de la década de 1960 (aunque todavía se publican hoy). Los cancioneros de la iglesia también son comunes en urdu romano. Sin embargo, el uso del urdu romano está disminuyendo con el uso más amplio del hindi y el inglés en estos estados.
Nombre de la(s) letra(s) | Palabra urdu | Ejemplos de otros usos | |||||||
---|---|---|---|---|---|---|---|---|---|
Forma aislada | Nombre en urdu | Urdu romano | Urdu | API | Nombre en urdu romano | Traducción al inglés | Urdu | Urdu romano o AFI | Traducción |
Asi | بَڑی حے | Baṛī ħē (baṛī ħē) | بَڑی | bəɽi [15] | bari / bari | grande / mayor [15] | بڑی آنت | Hormiga baṛi | intestino grueso |
ے | بَڑی يـے | Baṛī yē (español:baṛī yē) | Asi | Hormiga | intestino | ||||
ی | چھوٹی یے | čhōṭī yē | چھوٹی | tʃʰoːʈi [15] | choti | pequeño / menor / junior [15] | |||
ہ | چھوٹی ہے | čhōṭī hē | چھوٹی آنت | intestino delgado | |||||
العربية | gol he | الماربية | goːl [15] | gol | redondo / esférico / vago / tonto / obeso [32] | گول گپے | brecha de pago de gol | panipuri | |
ھ | دوچَشْمی ہے | dō-čašmī hē | دوچَشْمی | hacer-cashmi | de dos ojos [ cita requerida ] | El amor es mío | hacer-cashmi dorabin | prismáticos | |
دوربین | dorabin | telescopio | |||||||
Sí | hacer | 2 / dos | Una mujer | hacer ayvanit | bicameralismo | ||||
السمار | /tʃəʃm/ [15] | abismo | el ojo / la esperanza / la expectativa [32] | السمار | Cachemira | ojo | |||
ں | نُونِ غُنّہ | nun-e-gunnah | غُنّہ | ɣʊnnɑ [15] | ğunnah / g͟hunnah | sonido nasal o twang [15] | [ ejemplo necesario ] | ||
A | الِف مَدّه | Alif Maddah | مَدّه | maddah | Árabe : | [ ejemplo necesario ] | |||
A | واوِ مَہْمُوز | vav-e mahmuz | مَہْمُوز | mæhmuːz [15] | mahmuz | defectuoso / inadecuado [15] | [ ejemplo necesario ] | ||
ء ا آ ب پ ت ٹ ث ب ج چ خ ح د ڈ ذ ر ڑ ز ژ س ش ص ض ط ظ ع غ ف ق ک گ ل م ن ں و ہ ھ ی ے | El amor es grande [33] | harūf tahajī ( alfabeto ) | تہجی | tahaji | secuencia [ cita requerida ] | [ ejemplo necesario ] | |||
حُرُوف | /hʊruːf/ [15] | haruf | letras (plural) [15] (a menudo denominadas "alfabetos" en el inglés informal de Pakistán) | [ ejemplo necesario ] | |||||
حَرْف | /hərf/ [15] | Harf | "letra del alfabeto" / escritura a mano / declaración / culpa / estigma [15] | [ ejemplo necesario ] |