El estándar Unicode asigna varias propiedades a cada carácter y punto de código Unicode . [1] [2]
Las propiedades se pueden utilizar para manejar caracteres (puntos de código) en procesos, como en saltos de línea, dirección de script de derecha a izquierda o aplicación de controles. Algunas "propiedades de caracteres" también se definen para puntos de código que no tienen ningún carácter asignado y puntos de código que están etiquetados como "<no es un carácter>". Las propiedades de caracteres se describen en el Anexo estándar n.° 44. [2]
Las propiedades tienen niveles de fuerza: normativa, informativa, contributiva o provisional. Para simplificar la especificación, se puede asignar una propiedad de carácter especificando un rango continuo de puntos de código que tengan la misma propiedad. [3]
Las propiedades se muestran en el siguiente orden: [4]
[código];[nombre];[gc];[cc];[bc];[descomposición];[nv-dec];[nv-dig];[nv-num];[bm];[alias];;[mayúsculas];[minúsculas];[título en mayúsculas]
La propiedad entre 'alias' y 'mayúsculas' está obsoleta y ahora es nula para todos los caracteres Unicode.
La primera propiedad es el punto de código hexadecimal .
A cada carácter Unicode se le asigna un nombre único (na). [1] El nombre se compone de letras mayúsculas A–Z, dígitos 0–9, guión-menos y espacio . Se excluyen algunas secuencias: no se permiten nombres que comiencen con un espacio o guión, nombres que terminen con un espacio o guión, espacios o guiones repetidos y espacios después de un guión. Se garantiza que el nombre sea único dentro de Unicode y se puede usar para identificar un punto de código y su carácter. Los caracteres ideográficos, de los cuales hay decenas de miles, se nombran según el patrón " cjk unified ideograph - hhhh ". Por ejemplo, U+4E00 一 CJK UNIFIED IDEOGRAPH-4E00 . Los caracteres de formato también se nombran: U+00A0 NO-BREAK SPACE .
Las siguientes clases de puntos de código no tienen un Nombre (na=""): Controles (Categoría general: Cc), Uso privado (Co), Sustituto (Cs), No caracteres (Cn) y Reservado (Cn). Se puede hacer referencia a ellos, de manera informal, mediante un metanombre genérico o específico, llamado "Etiquetas de puntos de código": <control>, <control-0088>, <reserved>, <noncharacter- hhhh >, <private-use- hhhh > o <surrogate>. Dado que estas etiquetas contienen corchetes <>, nunca pueden aparecer como un Nombre, lo que evita confusiones.
En la versión 2.0 de Unicode, se cambiaron muchos nombres. A partir de entonces entró en vigor la regla de que "un nombre nunca cambiará", incluido el uso estricto (normativo) de los nombres alias. Los nombres en desuso de la versión 1.0 se trasladaron a la propiedad Alias para proporcionar cierta compatibilidad con versiones anteriores.
A partir de la versión 2.0 de Unicode, el nombre publicado para un punto de código nunca cambiará. Por lo tanto, en caso de que el nombre de un carácter esté mal escrito o si el nombre del carácter es completamente incorrecto o muy engañoso, se puede asignar un alias de nombre de carácter formal al carácter, y las aplicaciones pueden usar este alias en lugar del nombre de carácter defectuoso real. [1] Por ejemplo, U+FE18 ︘ FORMA DE PRESENTACIÓN PARA BRAZO LENTICULAR BLANCO DERECHO VERTICAL tiene el alias de nombre de carácter " FORMA DE PRESENTACIÓN PARA BRAZO LENTICULAR BLANCO DERECHO VERTICAL " para mitigar la ortografía incorrecta de "bracket" como "brakcet" [ sic ] en el nombre de carácter real; U+A015 ꀕ YI SÍLABA WU tiene el alias de nombre de carácter "MARCA DE ITERACIÓN DE SÍLABA YI" porque, a diferencia del nombre del carácter, no tiene un valor silábico fijo.
Además de los alias de nombres de caracteres, que son correcciones a nombres de caracteres defectuosos, a algunos caracteres se les asignan alias, que son nombres alternativos o abreviaturas. En el estándar Unicode se definen cinco tipos de alias de nombres de caracteres:
Todos los alias de nombres de caracteres formales siguen las reglas para nombres de caracteres permitidos y se garantiza que son únicos tanto dentro del alias de nombre de carácter como dentro de los espacios de nombres de caracteres (por este motivo, el nombre ISO 6429 "BELL" no está definido como un alias para U+0007 <control-0007> porque U+1F514 se llama "BELL"). [1]
A partir de la versión 16.0 de Unicode, se definen treinta y cinco alias de nombres de caracteres formales como correcciones para nombres de caracteres defectuosos. [5]
Además de estos nombres normativos, en las tablas de códigos Unicode se pueden mostrar nombres informales . Se trata de otros nombres de uso común para un carácter y no tienen la misma restricción de caracteres. No se garantiza que estos nombres informales sean únicos y pueden modificarse o eliminarse en versiones posteriores del estándar.
A cada punto de código se le asigna un valor para la categoría general. Esta es una de las propiedades de caracteres que también se definen para los puntos de código no asignados y los puntos de código que se definen como "no caracteres".
Categoría general (propiedad de carácter Unicode) [a] | |||||
---|---|---|---|---|---|
Valor | Categoría Mayor, menor | Tipo básico [b] | Personaje asignado [b] | Conde [c] (a partir de 16.0) | Observaciones |
L , letra; LC , letra mayúscula (sólo Lu, Ll y Lt) [d] | |||||
Lu | Letra, mayúscula | Gráfico | Personaje | 1.858 | |
Yo | Letra, minúscula | Gráfico | Personaje | 2.258 | |
Teniente | Carta, título en mayúscula | Gráfico | Personaje | 31 | Ligaduras o dígrafos que contienen una letra mayúscula seguida de una minúscula (por ejemplo, Dž , Lj , Nj y Dz ) |
Lágrimas | Letra, modificador | Gráfico | Personaje | 404 | Una letra modificadora |
Lo | Carta, otra | Gráfico | Personaje | 136.477 | Un ideograma o una letra de un alfabeto unicase |
M , Marcos | |||||
Minnesota | Marca, sin espacios | Gráfico | Personaje | 2.020 | |
Mc | Marca, espaciado combinando | Gráfico | Personaje | 468 | |
A mí | Marca, adjuntando | Gráfico | Personaje | 13 | |
N , Número | |||||
Dakota del Norte | Número, dígito decimal | Gráfico | Personaje | 760 | Todos estos, y sólo estos, tienen Tipo Numérico = De [e] |
En inglés | Número, letra | Gráfico | Personaje | 236 | Números compuestos de letras o símbolos similares a letras (por ejemplo, números romanos ) |
No | Número, otro | Gráfico | Personaje | 915 | Por ejemplo, fracciones vulgares , dígitos superíndices y subíndices , dígitos vigesimales. |
P , Puntuación | |||||
Ordenador personal | Puntuación, conector | Gráfico | Personaje | 10 | Incluye caracteres de subrayado y espaciado , como "_", y otros caracteres de unión de espacios. A diferencia de otros caracteres de puntuación, las bibliotecas de expresiones regulares pueden clasificarlos como caracteres de "palabra" . [f] |
Pd | Puntuación, guión | Gráfico | Personaje | 27 | Incluye varios caracteres de guion . |
PD | Puntuación, abierta | Gráfico | Personaje | 79 | Caracteres del corchete de apertura |
Pe | Puntuación, cerrar | Gráfico | Personaje | 77 | Caracteres de corchete de cierre |
Pi | Puntuación, cita inicial | Gráfico | Personaje | 12 | Comillas de apertura . No incluye las comillas "neutrales" ASCII. Puede comportarse como Ps o Pe según el uso |
Pf | Puntuación, cita final | Gráfico | Personaje | 10 | Comillas de cierre. Puede comportarse como Ps o Pe según el uso. |
Correos | Puntuación, otros | Gráfico | Personaje | 640 | |
S , Símbolo | |||||
Pequeño | Símbolo, matemáticas | Gráfico | Personaje | 950 | Símbolos matemáticos (p. ej., + , − , = , × , ÷ , √ , ∊ , ≠ ). No incluye paréntesis ni corchetes, que se encuentran en las categorías Ps y Pe. Tampoco incluye ! , * , - o / , que, a pesar de su uso frecuente como operadores matemáticos, se consideran principalmente "signos de puntuación". |
Carolina del Sur | Símbolo, moneda | Gráfico | Personaje | 63 | Símbolos monetarios |
Es | Símbolo, modificador | Gráfico | Personaje | 125 | |
Entonces | Símbolo, otro | Gráfico | Personaje | 7,376 | |
Z , Separador | |||||
Zs | Separador, espacio | Gráfico | Personaje | 17 | Incluye el espacio, pero no TAB , CR o LF , que son Cc |
Zl | Separador, línea | Formato | Personaje | 1 | Solo U+2028 SEPARADOR DE LÍNEA (LSEP) |
Zp | Separador, párrafo | Formato | Personaje | 1 | Solo U+2029 SEPARADOR DE PÁRRAFO (PSEP) |
C , Otro | |||||
Cc | Otros, control | Control | Personaje | 65 (nunca cambiará) [e] | Sin nombre, [g] <control> |
Cf | Otro, formato | Formato | Personaje | 170 | Incluye el guión suave , caracteres de control de unión ( ZWNJ y ZWJ ), caracteres de control para admitir texto bidireccional y caracteres de etiqueta de idioma. |
Cs | Otro, sustituto | Sustituto | No (solo se usa en UTF-16 ) | 2.048 (nunca cambiará) [e] | Sin nombre, [g] <sustituto> |
Co | Otros, uso privado | Uso privado | Carácter (pero sin interpretación especificada) | 137.468 en total (nunca cambiará) [e] ( 6.400 en BMP , 131.068 en Planes 15-16 ) | Sin nombre, [g] <private-use> |
En | Otros, no asignados | No personaje | No | 66 (no cambiará a menos que se amplíe el rango de puntos de código Unicode) [e] | Sin nombre, [g] <no personaje> |
Reservado | No | 819.467 | Sin nombre, [g] <reservado> | ||
|
Los caracteres tienen propiedades independientes para indicar que son un carácter de puntuación . Todas las propiedades tienen valores Sí/No : Dash , Quotation_Mark , Sentence_Terminal , Terminal_Punctuation . La propiedad Puntuación se refiere a los caracteres que se utilizan para dividir o estructurar el texto y se clasifican en diferentes tipos según sus funciones. Unicode asigna categorías específicas a estos caracteres de puntuación.
El espacio en blanco es un concepto que se utiliza con frecuencia para designar un efecto tipográfico. Básicamente, abarca caracteres invisibles que tienen un efecto de espaciado en el texto representado. Incluye espacios , tabulaciones y controles de formato de nueva línea. En Unicode, este tipo de caracteres tiene la propiedad "WSpace=yes". En la versión 16.0, hay 25 caracteres de espacio en blanco.
Nombre | Punto de código | Caja de ancho | ¿ Puede romperse ? | ¿ En IDN ? | Guion | Bloquear | Categoría general | Notas | |
---|---|---|---|---|---|---|---|---|---|
tabulación de caracteres | U+0009 | 9 | Sí | No | Común | Latín básico | Otros, control | HT, pestaña horizontal . Entidad con nombre HTML/XML : 	 , LaTeX : \tab , escape C :\t | |
avance de línea | U+000A | 10 | Es un salto de línea | Común | Latín básico | Otros, control | LF, Salto de línea . Entidad con nombre HTML/XML: 
 , Escape C:\n | ||
tabulación de línea | U+000B | 11 | Es un salto de línea | Común | Latín básico | Otros, control | VT, Tabulación vertical . C escape:\v | ||
avance de formulario | U+000C | 12 | Es un salto de línea | Común | Latín básico | Otros, control | FF, Avance de página . Escape C:\f | ||
retorno de carro | U+000D | 13 | Es un salto de línea | Común | Latín básico | Otros, control | CR, Retorno de carro . C escape:\r | ||
espacio | U+0020 | 32 | Sí | No | Común | Latín básico | Separador, espacio | El más común (espacio ASCII normal). LaTeX:\ | |
siguiente linea | U+0085 | 133 | Es un salto de línea | Común | Suplemento de latín-1 | Otros, control | NEL, Siguiente línea . LaTeX:\\ | ||
espacio sin interrupción | U+00A0 | 160 | No | No | Común | Suplemento de latín-1 | Separador, espacio | Espacio indivisible : idéntico a U+0020, pero no es un punto en el que se pueda dividir una línea. Entidad con nombre HTML/XML: ,   , LaTeX:~ | |
marca espacial ogham | U+1680 | 5760 | Sí | No | Ogam | Ogam | Separador, espacio | Se utiliza para separar palabras en textos Ogham . Normalmente, se trata de una línea vertical en texto vertical o de una línea horizontal en texto horizontal, pero también puede ser un espacio en blanco en fuentes "sin tallo". Requiere una fuente Ogham. | |
en quad | U+2000 | 8192 | Sí | No | Común | Puntuación general | Separador, espacio | Ancho de un en . U+2002 es canónicamente equivalente a este carácter; se prefiere U+2002. | |
en cuadrilátero | U+2001 | 8193 | Sí | No | Común | Puntuación general | Separador, espacio | También conocido como "mutton quad". Ancho de un em . U+2003 es canónicamente equivalente a este carácter; se prefiere U+2003. | |
en el espacio | U+2002 | 8194 | Sí | No | Común | Puntuación general | Separador, espacio | También conocido como "nut". Ancho de un en . U+2000 En Quad es canónicamente equivalente a este carácter; se prefiere U+2002. Entidad con nombre HTML/XML:   , LaTeX: \enspace (el espacio en LaTeX es un espacio sin interrupción) | |
espacio em | U+2003 | 8195 | Sí | No | Común | Puntuación general | Separador, espacio | También conocido como "mutton". Ancho de un em . U+2001 Em Quad es canónicamente equivalente a este carácter; se prefiere U+2003. Entidad con nombre HTML/XML:   , LaTeX:\quad | |
espacio de tres por em | U+2004 | 8196 | Sí | No | Común | Puntuación general | Separador, espacio | También conocido como "espacio grueso". Un tercio de un em de ancho. Entidad con nombre HTML/XML:   , LaTeX: \; (el espacio grueso de LaTeX es un espacio sin interrupción) | |
espacio de cuatro por em | U+2005 | 8197 | Sí | No | Común | Puntuación general | Separador, espacio | También conocido como "espacio intermedio". Un cuarto de un em de ancho. Entidad con nombre HTML/XML:   | |
espacio de seis por em | U+2006 | 8198 | Sí | No | Común | Puntuación general | Separador, espacio | Un sexto de un em de ancho. En tipografía informática, a veces se lo equipara a U+2009. | |
espacio de figura | U+2007 | 8199 | No | No | Común | Puntuación general | Separador, espacio | Espacio entre cifras . En fuentes con dígitos monoespaciados, igual al ancho de un dígito. Entidad con nombre HTML/XML:   | |
espacio de puntuación | U+2008 | 8200 | Sí | No | Común | Puntuación general | Separador, espacio | Tan ancho como la puntuación estrecha en una fuente, es decir, el ancho avanzado del punto o la coma. [6] Entidad nombrada HTML/XML:   | |
espacio delgado | U+2009 | 8201 | Sí | No | Común | Puntuación general | Separador, espacio | Espacio fino ; un quinto (a veces un sexto) de un em de ancho. Recomendado para usar como separador de miles para medidas hechas con unidades del SI . A diferencia de U+2002 a U+2008, su ancho puede ajustarse en la composición tipográfica. [7] Entidad con nombre HTML/XML:   ,   , LaTeX: \, (el espacio fino LaTeX es un espacio sin saltos) | |
espacio para el cabello | U+200A | 8202 | Sí | No | Común | Puntuación general | Separador, espacio | Más delgado que un espacio delgado. Entidad con nombre HTML/XML:   ,  | |
separador de línea | U+2028 | 8232 | Es un salto de línea | Común | Puntuación general | Separador, línea | |||
separador de párrafo | U+2029 | 8233 | Es un salto de línea | Común | Puntuación general | Separador, párrafo | |||
espacio estrecho sin interrupción | U+202F | 8239 | No | No | Común | Puntuación general | Separador, espacio | Espacio estrecho sin interrupción . Similar en función al espacio sin interrupción U+00A0. Cuando se utiliza con mongol, su ancho suele ser un tercio del espacio normal; en otros contextos, su ancho a veces se asemeja al del espacio delgado (U+2009). LaTeX:\, | |
espacio matemático medio | U+205F | 8287 | Sí | No | Común | Puntuación general | Separador, espacio | MMSP. Se utiliza en fórmulas matemáticas. Cuatro dieciochoavos de un em. [8] En tipografía matemática, los anchos de los espacios se dan normalmente en múltiplos enteros de un dieciochoavo de un em, y 4/18 em se puede utilizar en varias situaciones, por ejemplo entre la a y el + y entre el + y la b en la expresión a + b . [9] Entidad nombrada HTML/XML:   , LaTeX: \: (el espacio medio LaTeX es un espacio sin interrupción) | |
espacio ideográfico | U+3000 | 12288 | Sí | No | Común | Símbolos y puntuación del CJK | Separador, espacio | Tan ancho como una celda de carácter CJK ( ancho completo ). Se utiliza, por ejemplo, en tai tou . |
Nombre | Punto de código | Caja de ancho | ¿ Puede romperse ? | ¿ En IDN ? | Guion | Bloquear | Categoría general | Notas | |
---|---|---|---|---|---|---|---|---|---|
separador de vocales mongol | U+180E | 6158 | | Sí | No | mongol | mongol | Otro, Formato | MVS. Carácter de espacio angosto, utilizado en mongol para hacer que los dos últimos caracteres de una palabra adopten formas diferentes. [10] Ya no se clasifica como carácter de espacio (es decir, en la categoría Zs) en Unicode 6.3.0, aunque lo estaba en versiones anteriores del estándar. |
espacio de ancho cero | U+200B | 8203 | | Sí | No | ? | Puntuación general | Otro, Formato | ZWSP, espacio de ancho cero . Se utiliza para indicar límites de palabras a los sistemas de procesamiento de texto cuando se utilizan scripts que no utilizan espaciado explícito. Es similar al guión suave , con la diferencia de que este último se utiliza para indicar límites de sílabas y debe mostrar un guión visible cuando la línea se divide en él. Entidad nombrada HTML/XML : [11] [c] ​ |
Sin unión de ancho cero | U+200C | 8204 | | Sí | Depende del contexto [16] | ? | Puntuación general | Otro, Formato | ZWNJ, non-joiner de ancho cero . Cuando se coloca entre dos caracteres que de otro modo estarían conectados, un ZWNJ hace que se impriman en sus formas final e inicial, respectivamente. Entidad con nombre HTML/XML: ‌ |
ensamblador de ancho cero | U+200D | 8205 | | Sí | Depende del contexto [17] | ? | Puntuación general | Otro, Formato | ZWJ, conector de ancho cero . Cuando se coloca entre dos caracteres que de otro modo no estarían conectados, un ZWJ hace que se impriman en sus formas conectadas. También se puede utilizar para mostrar formas de unión de forma aislada. Dependiendo de si se espera una ligadura o conjunción de forma predeterminada, puede inducir (como en emoji y en cingalés ) o suprimir (como en devanagari ) la sustitución con un solo glifo, al tiempo que permite el uso de formas de unión individuales (a diferencia de ZWNJ). Entidad nombrada HTML/XML: ‍ |
ensamblador de palabras | U+2060 | 8288 | | No | No | ? | Puntuación general | Otro, Formato | WJ, conector de palabras . Similar a U+200B, pero no es un punto en el que se pueda dividir una línea. Entidad con nombre HTML/XML: ⁠ |
espacio irrompible de ancho cero | U+FEFF | 65279 | | No | No | ? | Formularios de presentación en árabe -B | Otro, Formato | Espacio indivisible de ancho cero . Se utiliza principalmente como marca de orden de bytes . Su uso como indicación de indivisible está en desuso a partir de Unicode 3.2; consulte U+2060 en su lugar. |
|
El valor de mayúsculas y minúsculas es normativo en Unicode. Se aplica a los alfabetos con letras mayúsculas y minúsculas. La diferencia entre mayúsculas y minúsculas se da en los alfabetos adlam, armenio, cherokee, copto, cirílico, deseret, garay, glagolítico, griego, khutsuri y mkhedruli georgiano, latín, medefaidrin, húngaro antiguo, osage, vithkuqi y warang citi.
(superior, inferior, título, plegable, tanto simple como completo)
Esta sección necesita ser ampliada . Puedes ayudar agregándole algo. ( Marzo de 2022 ) |
Ideográfico, alfabético, no característico.
Esta sección necesita ser ampliada . Puedes ayudar agregándole algo. ( Marzo de 2022 ) |
Algunos códigos comunes:
10–199 = varias clases de posición fija
Marcas que se adhieren a la letra base:
Marcas que no se adhieren a la letra base:
Hay seis propiedades de caracteres que pertenecen a la escritura bidireccional: Bidi_Class , Bidi_Control , Bidi_Mirrored , Bidi_Mirroring_Glyph , Bidi_Paired_Bracket y Bidi_Paired_Bracket_Type .
Una de las principales características de Unicode es la compatibilidad con la visualización de texto bidireccional ( Bidi ) de derecha a izquierda (R-to-L) y de izquierda a derecha (L-to-R). El algoritmo bidireccional Unicode UAX9 [19] describe el proceso de presentación de texto con direcciones de escritura alteradas. Por ejemplo, permite una cita en hebreo en un texto en inglés. El Bidi_Character_Type marca el comportamiento de un carácter en la escritura direccional. Para anular una dirección, Unicode ha definido caracteres de control de formato especiales ( Bidi-Control ). Estos caracteres pueden imponer una dirección y, por definición, solo afectan a la escritura bidireccional.
Cada punto de código tiene una propiedad denominada Bidi_Class , que define su comportamiento en un texto bidireccional tal como lo interpreta el algoritmo:
Tipo [2] | Descripción | Fortaleza | Direccionalidad | Ámbito general | Carácter Bidi_Control [3] |
---|---|---|---|---|---|
yo | De izquierda a derecha | Fuerte | De izquierda a derecha | La mayoría de los caracteres alfabéticos y silábicos, caracteres chinos, dígitos no europeos o no árabes, caracteres LRM,... | U+200E MARCA DE IZQUIERDA A DERECHA (LRM) |
R | De derecha a izquierda | Fuerte | De derecha a izquierda | Adlam, Garay, hebreo, mandaico, mende kikakui, n'ko, samaritano, escrituras antiguas como kharoshthi y nabateo, carácter RLM, ... | U+200F MARCA DE DERECHA A IZQUIERDA (RLM) |
Alabama | Letra árabe | Fuerte | De derecha a izquierda | Alfabetos árabe, hanifi, rohingya, sogdiano, siríaco y thaana, y la mayoría de los signos de puntuación específicos de esas escrituras, carácter ALM, ... | U+061C MARCA DE LETRA ÁRABE (ALM) |
ES | Número europeo | Débil | Cifras europeas, cifras árabes-índicas orientales, números epactos coptos, ... | ||
ES | Separador europeo | Débil | signo más , signo menos , ... | ||
Y | Terminador de número europeo | Débil | signo de grado , símbolos monetarios, ... | ||
UN | Número árabe | Débil | Dígitos árabe-índicos, separadores decimales y de miles árabes, dígitos Rumi, dígitos Hanifi Rohingya, ... | ||
CS | Separador de números comunes | Débil | dos puntos , coma , punto , espacio sin interrupción , ... | ||
NSM | Marca sin espaciado | Débil | Caracteres en categorías generales Marca, sin espacio y Marca, que encierra (Mn, Me) | ||
BN | Neutralidad de límites | Débil | Ignorables predeterminados, no caracteres, caracteres de control distintos de los dados explícitamente a otros tipos | ||
B | Separador de párrafos | Neutral | Separador de párrafos , funciones de nueva línea apropiadas, determinación de párrafos mediante protocolo de nivel superior | ||
S | Separador de segmentos | Neutral | Cortina a la italiana | ||
WS | Espacio en blanco | Neutral | espacio , espacio de figura , separador de línea , avance de página , bloque de puntuación general espacios (conjunto más pequeño que la lista de espacios en blanco de Unicode) | ||
EN | Otros neutrales | Neutral | Todos los demás caracteres, incluido el carácter de reemplazo de objeto. | ||
LRE | Incrustación de izquierda a derecha | Explícito | De izquierda a derecha | Sólo carácter LRE | INCRUSTACIÓN DE IZQUIERDA A DERECHA (LRE) U+202A |
LRO | Anulación de izquierda a derecha | Explícito | De izquierda a derecha | Sólo carácter LRO | U+202D ANULACIÓN DE IZQUIERDA A DERECHA (LRO) |
RLE | Incrustación de derecha a izquierda | Explícito | De derecha a izquierda | Sólo carácter RLE | U+202B INCORPORACIÓN DE DERECHA A IZQUIERDA (RLE) |
ORL | Anulación de derecha a izquierda | Explícito | De derecha a izquierda | Carácter RLO únicamente | U+202E ANULACIÓN DE DERECHA A IZQUIERDA (RLO) |
Formato direccional pop | Explícito | Sólo caracteres PDF | FORMATO DIRECCIONAL POP U+202C (PDF) | ||
LRI | Aislamiento de izquierda a derecha | Explícito | De izquierda a derecha | Sólo caracteres LRI | U+2066 AISLAMIENTO DE IZQUIERDA A DERECHA (LRI) |
RLI | Aislamiento de derecha a izquierda | Explícito | De derecha a izquierda | Sólo caracteres RLI | U+2067 AISLAMIENTO DE DERECHA A IZQUIERDA (RLI) |
FSI | Primer aislado fuerte | Explícito | Sólo carácter FSI | U+2068 PRIMER AISLAMIENTO FUERTE (FSI) | |
PDI | Aislamiento direccional pop | Explícito | Sólo caracteres PDI | Aislamiento direccional de pop (PDI) U+2069 | |
Notas
|
En situaciones normales, el algoritmo puede determinar la dirección de un texto mediante esta propiedad de carácter. Para controlar situaciones Bidi más complejas, por ejemplo, cuando un texto en inglés tiene una cita en hebreo, se agregan opciones adicionales a Unicode. Doce caracteres tienen la propiedad Bidi_Control=Yes
: ALM, FSI, LRE, LRI, LRM, LRO, PDF, PDI, RLE, RLI, RLM y RLO como se nombra en la tabla. Estos son caracteres de control de formato invisibles, solo utilizados por el algoritmo y sin efecto fuera del formato bidireccional. [19] A pesar del nombre, son caracteres de formato, no caracteres de control, y tienen la categoría general Otro, formato (Cf) en la definición Unicode.
Básicamente, el algoritmo determina una secuencia de caracteres con el mismo tipo de dirección fuerte (R-a-L o L-a-R), teniendo en cuenta la anulación de los controles Bidi especiales. A las cadenas de números (tipos débiles) se les asigna una dirección de acuerdo con su entorno fuerte, al igual que a los caracteres neutrales. Finalmente, los caracteres se muestran según la dirección de una cadena.
Hay dos propiedades de caracteres que son relevantes para determinar una imagen reflejada de un glifo en un texto bidireccional: Bidi_Mirrored=Yes
indica que el glifo debe reflejarse cuando se escribe de derecha a izquierda. La propiedad Bidi_Mirroring_Glyph=U+hhhh
puede entonces señalar el carácter reflejado. Por ejemplo, los paréntesis ( , ) se reflejan de esta manera. Dar forma a las escrituras cursivas, como la árabe, y reflejar glifos que tienen una dirección no es parte del algoritmo.
Los caracteres se clasifican con un tipo numérico . [1] Los caracteres como fracciones, subíndices, superíndices, números romanos, numeradores de moneda, números encerrados en un círculo y dígitos específicos de la escritura son de tipo numérico. Tienen un valor numérico que puede ser decimal, incluidos cero y negativos, o una fracción vulgar. Si no existe dicho valor, como ocurre con la mayoría de los caracteres, el tipo numérico es "Ninguno".
Los caracteres que tienen un valor numérico se dividen en tres grupos: decimal (De), dígito (Di) y numérico (Nu, es decir, todos los demás). "Decimal" significa que el carácter es un dígito decimal. Solo los caracteres que forman parte de un rango codificado contiguo de 0 a 9 tienen el tipo numérico decimal. Otros dígitos, como los superíndices, tienen el tipo numérico dígito. Todos los caracteres numéricos, como las fracciones y los números romanos, terminan con el tipo "numérico". El efecto deseado es que un analizador simple pueda usar estos valores numéricos decimales, sin distraerse con, por ejemplo, un superíndice numérico o una fracción. Ochenta y tres ideogramas CJK que representan un número, incluidos los utilizados para contabilidad, se escriben como numéricos.
Por otra parte, los caracteres que podrían tener un valor numérico como segundo significado siguen estando marcados como de tipo numérico None y no tienen valor numérico. Por ejemplo, se pueden utilizar letras latinas en la numeración de párrafos como "II.A.1.b", pero las letras "I", "A" y "b" no son numéricas (tipo None ) y no tienen valor numérico.
propiedad de carácter Unicode ) | Tipo numérico [a] [b] (||||
---|---|---|---|---|
Tipo numérico | Código | Tiene valor numérico | Ejemplo | Observaciones |
No numérico | <none> | No |
| Valor numérico="NaN" |
Decimal | De | Sí |
| Dígito recto (decimal- raíz ). Corresponde en ambos sentidos con la categoría general = Nd [a] |
Dígito | Di | Sí |
| Decimal, pero en contexto tipográfico |
Numérico | Nu | Sí |
| Valor numérico, pero no base decimal |
a. ^ "Sección 4.6: Valor numérico". El estándar Unicode . Consorcio Unicode. Septiembre de 2024. | ||||
b. ^ "Tipos numéricos derivados de Unicode 16.0". Base de datos de caracteres Unicode . Consorcio Unicode. 30 de abril de 2024. |
Los caracteres hexadecimales son aquellos que se encuentran en la serie con valores hexadecimales 0...9ABCDEF (dieciséis caracteres, valor decimal 0-15). La propiedad de carácter Hex_Digit se establece en Sí cuando un carácter se encuentra en una de estas series:
Caracteres en Unicode marcados [a]Hex_Digit=Yes | |||
---|---|---|---|
0123456789ABCDEF | Latín básico, mayúsculas | TambiénASCII_Hex_Digit=Yes | |
0123456789abcdef | Latín básico, letras minúsculas | TambiénASCII_Hex_Digit=Yes | |
0123456789ABCDEF | Formularios de ancho completo , mayúsculas | ||
0123456789abcdef | Formularios de ancho completo, letras pequeñas | ||
a. ^ "Unicode 16.0 UCD: PropList.txt". 2024-05-31 . Consultado el 2024-09-13 . |
Cuarenta y cuatro caracteres están marcados como Hex_Digit . Los del bloque de latín básico también están marcados como ASCII_Hex_Digit .
Unicode no tiene caracteres separados para los valores hexadecimales. Una consecuencia es que, cuando se utilizan caracteres regulares, no es posible determinar si se pretende un valor hexadecimal, o incluso si se pretende un valor en absoluto. Esto se debe determinar en un nivel superior, por ejemplo, anteponiendo 0x a un número hexadecimal o por contexto. La única característica es que Unicode puede indicar que una secuencia puede o no ser un valor hexadecimal.
Un bloque es un rango de puntos de código contiguos y con un nombre único. Se identifica por su primer y último punto de código. Los bloques no se superponen . Un bloque puede contener puntos de código reservados, no asignados, etc. Cada carácter asignado tiene un único valor de "nombre de bloque" de los 338 nombres asignados a partir de la versión 16.0 de Unicode. Los puntos de código no asignados fuera de un bloque existente tienen el valor predeterminado "No_block".
Avión | Rango de bloques | Nombre del bloque | Puntos de código [a] | Personajes asignados | Guiones [b] [c] [d] [e] [f] |
---|---|---|---|---|---|
0 BMP | U+0000..U+007F | Latín básico [g] | 128 | 128 | Latín (52 caracteres), común (76 caracteres) |
0 BMP | U+0080..U+00FF | Suplemento latino-1 [h] | 128 | 128 | Latín (64 caracteres), Común (64 caracteres) |
0 BMP | U+0100..U+017F | Latín extendido-A | 128 | 128 | latín |
0 BMP | U+0180..U+024F | Latín extendido-B | 208 | 208 | latín |
0 BMP | U+0250..U+02AF | Extensiones de IPA | 96 | 96 | latín |
0 BMP | U+02B0..U+02FF | Letras modificadoras de espaciado | 80 | 80 | Bopomofo (2 caracteres), latín (14 caracteres), común (64 caracteres) |
0 BMP | U+0300..U+036F | Combinación de signos diacríticos | 112 | 112 | Heredado |
0 BMP | U+0370..U+03FF | Griego y copto | 144 | 135 | Copto (14 caracteres), Griego (117 caracteres), Común (4 caracteres) |
0 BMP | U+0400..U+04FF | cirílico | 256 | 256 | Cirílico (254 caracteres), Heredado (2 caracteres) |
0 BMP | U+0500..U+052F | Suplemento cirílico | 48 | 48 | cirílico |
0 BMP | U+0530..U+058F | armenio | 96 | 91 | armenio |
0 BMP | U+0590..U+05FF | hebreo | 112 | 88 | hebreo |
0 BMP | U+0600..U+06FF | árabe | 256 | 256 | Árabe (238 caracteres), Común (6 caracteres), Heredado (12 caracteres) |
0 BMP | U+0700..U+074F | Siríaco | 80 | 77 | Siríaco |
0 BMP | U+0750..U+077F | Suplemento árabe | 48 | 48 | árabe |
0 BMP | U+0780..U+07BF | Taana | 64 | 50 | Taana |
0 BMP | U+07C0..U+07FF | Nko | 64 | 62 | N'Ko |
0 BMP | U+0800..U+083F | samaritano | 64 | 61 | samaritano |
0 BMP | U+0840..U+085F | Mandaico | 32 | 29 | Mandaico |
0 BMP | U+0860..U+086F | Suplemento siríaco | 16 | 11 | Siríaco |
0 BMP | U+0870..U+089F | Árabe ampliado-B | 48 | 42 | árabe |
0 BMP | U+08A0..U+08FF | Árabe extendido-A | 96 | 96 | Árabe (95 caracteres), común (1 carácter) |
0 BMP | U+0900..U+097F | Devanagari | 128 | 128 | Devanagari (122 caracteres), Común (2 caracteres), Heredado (4 caracteres) |
0 BMP | U+0980..U+09FF | bengalí | 128 | 96 | bengalí |
0 BMP | U+0A00..U+0A7F | Gurmukhi | 128 | 80 | Gurmukhi |
0 BMP | U+0A80..U+0AFF | Gujarati | 128 | 91 | Gujarati |
0 BMP | U+0B00..U+0B7F | Oriya | 128 | 91 | Oriya |
0 BMP | U+0B80..U+0BFF | Tamil | 128 | 72 | Tamil |
0 BMP | U+0C00..U+0C7F | Télugu | 128 | 100 | Télugu |
0 BMP | U+0C80..U+0CFF | Canarés | 128 | 91 | Canarés |
0 BMP | U+0D00..U+0D7F | Malabar | 128 | 118 | Malabar |
0 BMP | U+0D80..U+0DFF | Cingalés | 128 | 91 | Cingalés |
0 BMP | U+0E00..U+0E7F | tailandés | 128 | 87 | Tailandés (86 caracteres), común (1 carácter) |
0 BMP | U+0E80..U+0EFF | Laosiano | 128 | 83 | Laosiano |
0 BMP | U+0F00..U+0FFF | tibetano | 256 | 211 | Tibetano (207 caracteres), Común (4 caracteres) |
0 BMP | U+1000..U+109F | Birmania | 160 | 160 | Birmania |
0 BMP | U+10A0..U+10FF | georgiano | 96 | 88 | Georgiano (87 caracteres), Común (1 carácter) |
0 BMP | U+1100..U+11FF | Hangul Jamo | 256 | 256 | Hangul |
0 BMP | U+1200..U+137F | Etíope | 384 | 358 | Etíope |
0 BMP | U+1380..U+139F | Suplemento etíope | 32 | 26 | Etíope |
0 BMP | U+13A0..U+13FF | Cherokee | 96 | 92 | Cherokee |
0 BMP | U+1400..U+167F | Sílabas aborígenes canadienses unificadas | 640 | 640 | Aborigen canadiense |
0 BMP | U+1680..U+169F | Ogam | 32 | 29 | Ogam |
0 BMP | U+16A0..U+16FF | Rúnico | 96 | 89 | Rúnico (86 caracteres), Común (3 caracteres) |
0 BMP | U+1700..U+171F | Tagalo | 32 | 23 | Tagalo |
0 BMP | U+1720..U+173F | Hanunoo | 32 | 23 | Hanunoo (21 caracteres), Común (2 caracteres) |
0 BMP | U+1740..U+175F | Buhid | 32 | 20 | Buhid |
0 BMP | U+1760..U+177F | Tagbanwa | 32 | 18 | Tagbanwa |
0 BMP | U+1780..U+17FF | Jemer | 128 | 114 | Jemer |
0 BMP | U+1800..U+18AF | mongol | 176 | 158 | Mongol (155 caracteres), Común (3 caracteres) |
0 BMP | U+18B0..U+18FF | Sílabas aborígenes canadienses unificadas ampliadas | 80 | 70 | Aborigen canadiense |
0 BMP | U+1900..U+194F | Limbu | 80 | 68 | Limbu |
0 BMP | U+1950..U+197F | Tai Le | 48 | 35 | Tai Le |
0 BMP | U+1980..U+19DF | Nuevo Tai Lue | 96 | 83 | Nuevo Tai Lue |
0 BMP | U+19E0..U+19FF | Símbolos jemeres | 32 | 32 | Jemer |
0 BMP | U+1A00..U+1A1F | buginés | 32 | 30 | buginés |
0 BMP | U+1A20..U+1AAF | Tai Tham | 144 | 127 | Tai Tham |
0 BMP | U+1AB0..U+1AFF | Combinación de signos diacríticos ampliada | 80 | 31 | Heredado |
0 BMP | U+1B00..U+1B7F | balinés | 128 | 127 | balinés |
0 BMP | U+1B80..U+1BBF | Sundanés | 64 | 64 | Sundanés |
0 BMP | U+1BC0..U+1BFF | Batak | 64 | 56 | Batak |
0 BMP | U+1C00..U+1C4F | Lepcha | 80 | 74 | Lepcha |
0 BMP | U+1C50..U+1C7F | Ol Chiki | 48 | 48 | Ol Chiki |
0 BMP | U+1C80..U+1C8F | Cirílico extendido-C | 16 | 11 | cirílico |
0 BMP | U+1C90..U+1CBF | Georgiano extendido | 48 | 46 | georgiano |
0 BMP | U+1CC0..U+1CCF | Suplemento Sundanés | 16 | 8 | Sundanés |
0 BMP | U+1CD0..U+1CFF | Extensiones védicas | 48 | 43 | Común (16 caracteres), Heredado (27 caracteres) |
0 BMP | U+1D00..U+1D7F | Extensiones fonéticas | 128 | 128 | Cirílico (2 caracteres), griego (15 caracteres), latín (111 caracteres) |
0 BMP | U+1D80..U+1DBF | Suplemento de extensiones fonéticas | 64 | 64 | Griego (1 carácter), latín (63 caracteres) |
0 BMP | U+1DC0..U+1DFF | Suplemento de combinación de signos diacríticos | 64 | 64 | Heredado |
0 BMP | U+1E00..U+1EFF | Latín extendido adicional | 256 | 256 | latín |
0 BMP | U+1F00..U+1FFF | Griego extendido | 256 | 233 | Griego |
0 BMP | U+2000..U+206F | Puntuación general | 112 | 111 | Común (109 caracteres), Heredado (2 caracteres) |
0 BMP | U+2070..U+209F | Superíndices y subíndices | 48 | 42 | Latín (15 caracteres), común (27 caracteres) |
0 BMP | U+20A0..U+20CF | Símbolos monetarios | 48 | 33 | Común |
0 BMP | U+20D0..U+20FF | Combinación de signos diacríticos para símbolos | 48 | 33 | Heredado |
0 BMP | U+2100..U+214F | Símbolos similares a letras | 80 | 80 | Griego (1 carácter), latín (4 caracteres), común (75 caracteres) |
0 BMP | U+2150..U+218F | Formas numéricas | 64 | 60 | Latín (41 caracteres), común (19 caracteres) |
0 BMP | U+2190..U+21FF | Flechas | 112 | 112 | Común |
0 BMP | U+2200..U+22FF | Operadores matemáticos | 256 | 256 | Común |
0 BMP | U+2300..U+23FF | Varios Técnicos | 256 | 256 | Común |
0 BMP | U+2400..U+243F | Imágenes de control | 64 | 42 | Común |
0 BMP | U+2440..U+245F | Reconocimiento óptico de caracteres | 32 | 11 | Común |
0 BMP | U+2460..U+24FF | Alfanuméricos cerrados | 160 | 160 | Común |
0 BMP | U+2500..U+257F | Dibujo de caja | 128 | 128 | Común |
0 BMP | U+2580..U+259F | Elementos de bloque | 32 | 32 | Común |
0 BMP | U+25A0..U+25FF | Formas geométricas | 96 | 96 | Común |
0 BMP | U+2600..U+26FF | Símbolos varios | 256 | 256 | Común |
0 BMP | U+2700..U+27BF | Simbolos | 192 | 192 | Común |
0 BMP | U+27C0..U+27EF | Símbolos matemáticos varios-A | 48 | 48 | Común |
0 BMP | U+27F0..U+27FF | Flechas suplementarias-A | 16 | 16 | Común |
0 BMP | U+2800..U+28FF | Patrones Braille | 256 | 256 | Braille |
0 BMP | U+2900..U+297F | Flechas suplementarias B | 128 | 128 | Común |
0 BMP | U+2980..U+29FF | Símbolos matemáticos varios-B | 128 | 128 | Común |
0 BMP | U+2A00..U+2AFF | Operadores matemáticos suplementarios | 256 | 256 | Común |
0 BMP | U+2B00..U+2BFF | Símbolos y flechas varios | 256 | 253 | Común |
0 BMP | U+2C00..U+2C5F | Glagolítico | 96 | 96 | Glagolítico |
0 BMP | U+2C60..U+2C7F | Latín extendido-C | 32 | 32 | latín |
0 BMP | U+2C80..U+2CFF | copto | 128 | 123 | copto |
0 BMP | U+2D00..U+2D2F | Suplemento georgiano | 48 | 40 | georgiano |
0 BMP | U+2D30..U+2D7F | Tifinagh | 80 | 59 | Tifinagh |
0 BMP | U+2D80..U+2DDF | Etíope ampliado | 96 | 79 | Etíope |
0 BMP | U+2DE0..U+2DFF | Cirílico extendido-A | 32 | 32 | cirílico |
0 BMP | U+2E00..U+2E7F | Puntuación suplementaria | 128 | 94 | Común |
0 BMP | U+2E80..U+2EFF | Suplemento de radicales CJK | 128 | 115 | Han |
0 BMP | U+2F00..U+2FDF | Radicales de Kangxi | 224 | 214 | Han |
0 BMP | U+2FF0..U+2FFF | Caracteres de descripción ideográfica | 16 | 16 | Común |
0 BMP | U+3000..U+303F | Símbolos y puntuación del CJK | 64 | 64 | Han (15 caracteres), Hangul (2 caracteres), Común (43 caracteres), Heredado (4 caracteres) |
0 BMP | U+3040..U+309F | Hiragana | 96 | 93 | Hiragana (89 caracteres), Común (2 caracteres), Heredado (2 caracteres) |
0 BMP | U+30A0..U+30FF | Katakana | 96 | 96 | Katakana (93 caracteres), Común (3 caracteres) |
0 BMP | U+3100..U+312F | Bopomofo | 48 | 43 | Bopomofo |
0 BMP | U+3130..U+318F | Compatibilidad con Hangul Jamo | 96 | 94 | Hangul |
0 BMP | U+3190..U+319F | Canbún | 16 | 16 | Común |
0 BMP | U+31A0..U+31BF | Bopomofo ampliado | 32 | 32 | Bopomofo |
0 BMP | U+31C0..U+31EF | Trazos de CJK | 48 | 39 | Común |
0 BMP | U+31F0..U+31FF | Extensiones fonéticas del katakana | 16 | 16 | Katakana |
0 BMP | U+3200..U+32FF | Letras y meses CJK adjuntos | 256 | 255 | Hangul (62 caracteres), Katakana (47 caracteres), Común (146 caracteres) |
0 BMP | U+3300..U+33FF | Compatibilidad con CJK | 256 | 256 | Katakana (88 caracteres), Común (168 caracteres) |
0 BMP | U+3400..U+4DBF | Ideogramas unificados del CJK, extensión A | 6,592 | 6,592 | Han |
0 BMP | U+4DC0..U+4DFF | Símbolos del hexagrama de Yijing | 64 | 64 | Común |
0 BMP | U+4E00..U+9FFF | Ideogramas unificados del CJK | 20,992 | 20,992 | Han |
0 BMP | U+A000..U+A48F | Sílabas Yi | 1.168 | 1.165 | Y |
0 BMP | U+A490..U+A4CF | Radicales Yi | 64 | 55 | Y |
0 BMP | U+A4D0..U+A4FF | Lisu | 48 | 48 | Lisu |
0 BMP | U+A500..U+A63F | Vai | 320 | 300 | Vai |
0 BMP | U+A640..U+A69F | Cirílico extendido-B | 96 | 96 | cirílico |
0 BMP | U+A6A0..U+A6FF | Bambú | 96 | 88 | Bambú |
0 BMP | U+A700..U+A71F | Letras de tono modificador | 32 | 32 | Común |
0 BMP | U+A720..U+A7FF | Latín extendido-D | 224 | 199 | Latín (194 caracteres), común (5 caracteres) |
0 BMP | U+A800..U+A82F | Syloti Nagri | 48 | 45 | Syloti Nagri |
0 BMP | U+A830..U+A83F | Formas comunes de números índicos | 16 | 10 | Común |
0 BMP | U+A840..U+A87F | Fags-pa | 64 | 56 | Phags Pa |
0 BMP | U+A880..U+A8DF | Saurastra | 96 | 82 | Saurastra |
0 BMP | U+A8E0..U+A8FF | Devanagari extendido | 32 | 32 | Devanagari |
0 BMP | U+A900..U+A92F | Kayah Li | 48 | 48 | Kayah Li (47 caracteres), común (1 carácter) |
0 BMP | U+A930..U+A95F | Reenganche | 48 | 37 | Reenganche |
0 BMP | U+A960..U+A97F | Hangul Jamo Extendido-A | 32 | 29 | Hangul |
0 BMP | U+A980..U+A9DF | javanés | 96 | 91 | Javanés (90 caracteres), común (1 carácter) |
0 BMP | U+A9E0..U+A9FF | Myanmar ampliado-B | 32 | 31 | Birmania |
0 BMP | U+AA00..U+AA5F | Cham | 96 | 83 | Cham |
0 BMP | U+AA60..U+AA7F | Myanmar ampliado-A | 32 | 32 | Birmania |
0 BMP | U+AA80..U+AADF | Tai Vietnam | 96 | 72 | Tai Vietnam |
0 BMP | U+AAE0..U+AAFF | Extensiones de Meetei Mayek | 32 | 23 | Meetei Mayek |
0 BMP | U+AB00..U+AB2F | Etíope ampliado-A | 48 | 32 | Etíope |
0 BMP | U+AB30..U+AB6F | Latín extendido-E | 64 | 60 | Latín (56 caracteres), Griego (1 carácter), Común (3 caracteres) |
0 BMP | U+AB70..U+ABBF | Suplemento Cherokee | 80 | 80 | Cherokee |
0 BMP | U+ABC0..U+ABFF | Meetei Mayek | 64 | 56 | Meetei Mayek |
0 BMP | U+AC00..U+D7AF | Sílabas del hangul | 11,184 | 11,172 | Hangul |
0 BMP | U+D7B0..U+D7FF | Hangul Jamo Extendido-B | 80 | 72 | Hangul |
0 BMP | U+D800..U+DB7F | Sustitutos elevados | 896 | 0 | Desconocido |
0 BMP | U+DB80..U+DBFF | Subrogantes de alto uso privado | 128 | 0 | Desconocido |
0 BMP | U+DC00..U+DFFF | Sustitutos bajos | 1.024 | 0 | Desconocido |
0 BMP | U+E000..U+F8FF | Área de uso privado | 6.400 | 6.400 | Desconocido |
0 BMP | U+F900..U+FAFF | Ideogramas de compatibilidad CJK | 512 | 472 | Han |
0 BMP | U+FB00..U+FB4F | Formularios de presentación alfabéticos | 80 | 58 | Armenio (5 caracteres), hebreo (46 caracteres), latín (7 caracteres) |
0 BMP | U+FB50..U+FDFF | Formularios de presentación en árabe-A | 688 | 631 | Árabe (629 caracteres), común (2 caracteres) |
0 BMP | U+FE00..U+FE0F | Selectores de variación | 16 | 16 | Heredado |
0 BMP | U+FE10..U+FE1F | Formas verticales | 16 | 10 | Común |
0 BMP | U+FE20..U+FE2F | Combinando medias marcas | 16 | 16 | Cirílico (2 caracteres), Heredado (14 caracteres) |
0 BMP | U+FE30..U+FE4F | Formularios de compatibilidad CJK | 32 | 32 | Común |
0 BMP | U+FE50..U+FE6F | Variantes de formato pequeño | 32 | 26 | Común |
0 BMP | U+FE70..U+FEFF | Formularios de presentación en árabe-B | 144 | 141 | Árabe (140 caracteres), común (1 carácter) |
0 BMP | U+FF00..U+FFEF | Formularios de ancho medio y ancho completo | 240 | 225 | Hangul (52 caracteres), Katakana (55 caracteres), Latín (52 caracteres), Común (66 caracteres) |
0 BMP | U+FFF0..U+FFFF | Especiales | 16 | 5 | Común |
1 paquete de leche desnatada | U+10000..U+1007F | Silabario lineal B | 128 | 88 | Lineal B |
1 paquete de leche desnatada | U+10080..U+100FF | Ideogramas lineales B | 128 | 123 | Lineal B |
1 paquete de leche desnatada | U+10100..U+1013F | Números del Egeo | 64 | 57 | Común |
1 paquete de leche desnatada | U+10140..U+1018F | Números griegos antiguos | 80 | 79 | Griego |
1 paquete de leche desnatada | U+10190..U+101CF | Símbolos antiguos | 64 | 14 | Griego (1 carácter), Común (13 caracteres) |
1 paquete de leche desnatada | U+101D0..U+101FF | Disco de Festos | 48 | 46 | Común (45 caracteres), Heredado (1 carácter) |
1 paquete de leche desnatada | U+10280..U+1029F | Licio | 32 | 29 | Licio |
1 paquete de leche desnatada | U+102A0..U+102DF | Cariano | 64 | 49 | Cariano |
1 paquete de leche desnatada | U+102E0..U+102FF | Números coptos de Epact | 32 | 28 | Común (27 caracteres), Heredado (1 carácter) |
1 paquete de leche desnatada | U+10300..U+1032F | cursiva antigua | 48 | 39 | cursiva antigua |
1 paquete de leche desnatada | U+10330..U+1034F | gótico | 32 | 27 | gótico |
1 paquete de leche desnatada | U+10350..U+1037F | Pérmico antiguo | 48 | 43 | Pérmico antiguo |
1 paquete de leche desnatada | U+10380..U+1039F | Ugarítico | 32 | 31 | Ugarítico |
1 paquete de leche desnatada | U+103A0..U+103DF | Persa antiguo | 64 | 50 | Persa antiguo |
1 paquete de leche desnatada | U+10400..U+1044F | Desierto | 80 | 80 | Desierto |
1 paquete de leche desnatada | U+10450..U+1047F | Shaviano | 48 | 48 | Shaviano |
1 paquete de leche desnatada | U+10480..U+104AF | Osmania | 48 | 40 | Osmania |
1 paquete de leche desnatada | U+104B0..U+104FF | Osage | 80 | 72 | Osage |
1 paquete de leche desnatada | U+10500..U+1052F | Elbasan | 48 | 40 | Elbasan |
1 paquete de leche desnatada | U+10530..U+1056F | Albanés caucásico | 64 | 53 | Albanés caucásico |
1 paquete de leche desnatada | U+10570..U+105BF | Vithkuqi | 80 | 70 | Vithkuqi |
1 paquete de leche desnatada | U+105C0..U+105FF | Todhri | 64 | 52 | Todhri |
1 paquete de leche desnatada | U+10600..U+1077F | Lineal A | 384 | 341 | Lineal A |
1 paquete de leche desnatada | U+10780..U+107BF | Latín extendido-F | 64 | 57 | latín |
1 paquete de leche desnatada | U+10800..U+1083F | Silabario chipriota | 64 | 55 | Chipriota |
1 paquete de leche desnatada | U+10840..U+1085F | Arameo imperial | 32 | 31 | Arameo imperial |
1 paquete de leche desnatada | U+10860..U+1087F | Palmira | 32 | 32 | Palmira |
1 paquete de leche desnatada | U+10880..U+108AF | Nabateo | 48 | 40 | Nabateo |
1 paquete de leche desnatada | U+108E0..U+108FF | Hatran | 32 | 26 | Hatran |
1 paquete de leche desnatada | U+10900..U+1091F | Fenicio | 32 | 29 | Fenicio |
1 paquete de leche desnatada | U+10920..U+1093F | Lidio | 32 | 27 | Lidio |
1 paquete de leche desnatada | U+10980..U+1099F | Jeroglíficos meroíticos | 32 | 32 | Jeroglíficos meroíticos |
1 paquete de leche desnatada | U+109A0..U+109FF | Cursiva meroítica | 96 | 90 | Cursiva meroítica |
1 paquete de leche desnatada | U+10A00..U+10A5F | Kharoshti (Jaroshti) | 96 | 68 | Kharoshti (Jaroshti) |
1 paquete de leche desnatada | U+10A60..U+10A7F | Antiguo sur de Arabia | 32 | 32 | Antiguo sur de Arabia |
1 paquete de leche desnatada | U+10A80..U+10A9F | Antiguo norte de Arabia | 32 | 32 | Antiguo norte de Arabia |
1 paquete de leche desnatada | U+10AC0..U+10AFF | maniqueo | 64 | 51 | maniqueo |
1 paquete de leche desnatada | U+10B00..U+10B3F | Avestano | 64 | 61 | Avestano |
1 paquete de leche desnatada | U+10B40..U+10B5F | Parto inscriptivo | 32 | 30 | Parto inscriptivo |
1 paquete de leche desnatada | U+10B60..U+10B7F | Pahlavi inscriptivo | 32 | 27 | Pahlavi inscriptivo |
1 paquete de leche desnatada | U+10B80..U+10BAF | Salterio Pahlavi | 48 | 29 | Salterio Pahlavi |
1 paquete de leche desnatada | U+10C00..U+10C4F | Turco antiguo | 80 | 73 | Turco antiguo |
1 paquete de leche desnatada | U+10C80..U+10CFF | Húngaro antiguo | 128 | 108 | Húngaro antiguo |
1 paquete de leche desnatada | U+10D00..U+10D3F | Rohingyas hanifi | 64 | 50 | Rohingyas hanifi |
1 paquete de leche desnatada | U+10D40..U+10D8F | Garay | 80 | 69 | Garay |
1 paquete de leche desnatada | U+10E60..U+10E7F | Símbolos numéricos de Rumi | 32 | 31 | árabe |
1 paquete de leche desnatada | U+10E80..U+10EBF | Yezidí | 64 | 47 | Yezidí |
1 paquete de leche desnatada | U+10EC0..U+10EFF | Árabe extendido-C | 64 | 7 | árabe |
1 paquete de leche desnatada | U+10F00..U+10F2F | Sogdiano antiguo | 48 | 40 | Sogdiano antiguo |
1 paquete de leche desnatada | U+10F30..U+10F6F | Sogdiano | 64 | 42 | Sogdiano |
1 paquete de leche desnatada | U+10F70..U+10FAF | Viejo uigur | 64 | 26 | Viejo uigur |
1 paquete de leche desnatada | U+10FB0..U+10FDF | Corasmiano | 48 | 28 | Corasmiano |
1 paquete de leche desnatada | U+10FE0..U+10FFF | Elímaco | 32 | 23 | Elímaco |
1 paquete de leche desnatada | U+11000..U+1107F | Brahmi | 128 | 115 | Brahmi |
1 paquete de leche desnatada | U+11080..U+110CF | Kaithi | 80 | 68 | Kaithi |
1 paquete de leche desnatada | U+110D0..U+110FF | Sora Sompeng | 48 | 35 | Sora Sompeng |
1 paquete de leche desnatada | U+11100..U+1114F | Chakma | 80 | 71 | Chakma |
1 paquete de leche desnatada | U+11150..U+1117F | Mahajani | 48 | 39 | Mahajani |
1 paquete de leche desnatada | U+11180..U+111DF | Sharada | 96 | 96 | Sharada |
1 paquete de leche desnatada | U+111E0..U+111FF | Números arcaicos cingaleses | 32 | 20 | Cingalés |
1 paquete de leche desnatada | U+11200..U+1124F | Khojki | 80 | 65 | Khojki |
1 paquete de leche desnatada | U+11280..U+112AF | Multaní | 48 | 38 | Multaní |
1 paquete de leche desnatada | U+112B0..U+112FF | Judawadi | 80 | 69 | Judawadi |
1 paquete de leche desnatada | U+11300..U+1137F | Grantha | 128 | 86 | Grantha (85 caracteres), Heredado (1 carácter) |
1 paquete de leche desnatada | U+11380..U+113FF | Tulu-Tigalari | 128 | 80 | Tulu Tigalari |
1 paquete de leche desnatada | U+11400..U+1147F | Nueva | 128 | 97 | Nueva |
1 paquete de leche desnatada | U+11480..U+114DF | Tirhuta | 96 | 82 | Tirhuta |
1 paquete de leche desnatada | U+11580..U+115FF | Siddham | 128 | 92 | Siddham |
1 paquete de leche desnatada | U+11600..U+1165F | Modificar | 96 | 79 | Modificar |
1 paquete de leche desnatada | U+11660..U+1167F | Suplemento de Mongolia | 32 | 13 | mongol |
1 paquete de leche desnatada | U+11680..U+116CF | Takri | 80 | 68 | Takri |
1 paquete de leche desnatada | U+116D0..U+116FF | Myanmar ampliado-C | 48 | 20 | Birmania |
1 paquete de leche desnatada | U+11700..U+1174F | Ahom | 80 | 65 | Ahom |
1 paquete de leche desnatada | U+11800..U+1184F | Perro | 80 | 60 | Perro |
1 paquete de leche desnatada | U+118A0..U+118FF | Ciudad del centro | 96 | 84 | Ciudad del centro |
1 paquete de leche desnatada | U+11900..U+1195F | Inmersiones en Akuru | 96 | 72 | Inmersiones en Akuru |
1 paquete de leche desnatada | U+119A0..U+119FF | Nandinagari | 96 | 65 | Nandinagari |
1 paquete de leche desnatada | U+11A00..U+11A4F | Plaza Zanabazar | 80 | 72 | Plaza Zanabazar |
1 paquete de leche desnatada | U+11A50..U+11AAF | Soyombo | 96 | 83 | Soyombo |
1 paquete de leche desnatada | U+11AB0..U+11ABF | Sílabas aborígenes canadienses unificadas extendidas-A | 16 | 16 | Aborigen canadiense |
1 paquete de leche desnatada | U+11AC0..U+11AFF | Pau Cin Hau | 64 | 57 | Pau Cin Hau |
1 paquete de leche desnatada | U+11B00..U+11B5F | Devanagari ampliado-A | 96 | 10 | Devanagari |
1 paquete de leche desnatada | U+11BC0..U+11BFF | Sunuwar | 64 | 44 | Sunuwar |
1 paquete de leche desnatada | U+11C00..U+11C6F | Bhaiksuki | 112 | 97 | Bhaiksuki |
1 paquete de leche desnatada | U+11C70..U+11CBF | Márquen | 80 | 68 | Márquen |
1 paquete de leche desnatada | U+11D00..U+11D5F | Masaram Gondi | 96 | 75 | Masaram Gondi |
1 paquete de leche desnatada | U+11D60..U+11DAF | Gondi de Gunjala | 80 | 63 | Gondi de Gunjala |
1 paquete de leche desnatada | U+11EE0..U+11EFF | Makasar | 32 | 25 | Makasar |
1 paquete de leche desnatada | U+11F00..U+11F5F | Kawi | 96 | 87 | Kawi |
1 paquete de leche desnatada | U+11FB0..U+11FBF | Suplemento de Lisu | 16 | 1 | Lisu |
1 paquete de leche desnatada | U+11FC0..U+11FFF | Suplemento tamil | 64 | 51 | Tamil |
1 paquete de leche desnatada | U+12000..U+123FF | Cuneiforme | 1.024 | 922 | Cuneiforme |
1 paquete de leche desnatada | U+12400..U+1247F | Números cuneiformes y puntuación | 128 | 116 | Cuneiforme |
1 paquete de leche desnatada | U+12480..U+1254F | Escritura cuneiforme dinástica temprana | 208 | 196 | Cuneiforme |
1 paquete de leche desnatada | U+12F90..U+12FFF | Cipro-minoico | 112 | 99 | Chipre minoico |
1 paquete de leche desnatada | U+13000..U+1342F | Jeroglíficos egipcios | 1.072 | 1.072 | Jeroglíficos egipcios |
1 paquete de leche desnatada | U+13430..U+1345F | Controles del formato de jeroglíficos egipcios | 48 | 38 | Jeroglíficos egipcios |
1 paquete de leche desnatada | U+13460..U+143FF | Jeroglíficos egipcios ampliados-A | 4.000 | 3.995 | Jeroglíficos egipcios |
1 paquete de leche desnatada | U+14400..U+1467F | Jeroglíficos de Anatolia | 640 | 583 | Jeroglíficos de Anatolia |
1 paquete de leche desnatada | U+16100..U+1613F | Gurung Khema | 64 | 58 | Gurung Khema |
1 paquete de leche desnatada | U+16800..U+16A3F | Suplemento de bambú | 576 | 569 | Bambú |
1 paquete de leche desnatada | U+16A40..U+16A6F | Señor | 48 | 43 | Señor |
1 paquete de leche desnatada | U+16A70..U+16ACF | Tangsa | 96 | 89 | Tangsa |
1 paquete de leche desnatada | U+16AD0..U+16AFF | Bajo Vah | 48 | 36 | Bajo Vah |
1 paquete de leche desnatada | U+16B00..U+16B8F | Hmong pahawh | 144 | 127 | Hmong pahawh |
1 paquete de leche desnatada | U+16D40..U+16D7F | Kirat Rai | 64 | 58 | Kirat Rai |
1 paquete de leche desnatada | U+16E40..U+16E9F | Medefaidrina | 96 | 91 | Medefaidrina |
1 paquete de leche desnatada | U+16F00..U+16F9F | Miao | 160 | 149 | Miao |
1 paquete de leche desnatada | U+16FE0..U+16FFF | Símbolos ideográficos y puntuación | 32 | 7 | Han (4 caracteres), escritura pequeña khitan (1 carácter), nushu (1 carácter), tangut (1 carácter) |
1 paquete de leche desnatada | U+17000..U+187FF | Tangut | 6,144 | 6.136 | Tangut |
1 paquete de leche desnatada | U+18800..U+18AFF | Componentes de Tangut | 768 | 768 | Tangut |
1 paquete de leche desnatada | U+18B00..U+18CFF | Escritura pequeña khitan | 512 | 471 | Escritura pequeña khitan |
1 paquete de leche desnatada | U+18D00..U+18D7F | Suplemento Tangut | 128 | 9 | Tangut |
1 paquete de leche desnatada | U+1AFF0..U+1AFFF | Kana extendida-B | 16 | 13 | Katakana |
1 paquete de leche desnatada | U+1B000..U+1B0FF | Suplemento de Kana | 256 | 256 | Hiragana (255 caracteres), Katakana (1 carácter) |
1 paquete de leche desnatada | U+1B100..U+1B12F | Kana Extendido-A | 48 | 35 | Hiragana (32 caracteres), Katakana (3 caracteres) |
1 paquete de leche desnatada | U+1B130..U+1B16F | Pequeña extensión de Kana | 64 | 9 | Hiragana (4 caracteres), Katakana (5 caracteres) |
1 paquete de leche desnatada | U+1B170..U+1B2FF | Nushu | 400 | 396 | Nushu |
1 paquete de leche desnatada | U+1BC00..U+1BC9F | Duployan | 160 | 143 | Duployan |
1 paquete de leche desnatada | U+1BCAF0..U+1BCAF | Controles de formato abreviado | 16 | 4 | Común |
1 paquete de leche desnatada | U+1CC00..U+1CEBF | Suplemento de símbolos para computación heredada | 704 | 686 | Común |
1 paquete de leche desnatada | U+1CF00..U+1CFCF | Notación musical Znamenny | 208 | 185 | Común (116 caracteres), Heredado (69 caracteres) |
1 paquete de leche desnatada | U+1D000..U+1D0FF | Símbolos musicales bizantinos | 256 | 246 | Común |
1 paquete de leche desnatada | U+1D100..U+1D1FF | Símbolos musicales | 256 | 233 | Común (211 caracteres), Heredado (22 caracteres) |
1 paquete de leche desnatada | U+1D200..U+1D24F | Notación musical griega antigua | 80 | 70 | Griego |
1 paquete de leche desnatada | U+1D2C0..U+1D2DF | Numerales de Kaktovik | 32 | 20 | Común |
1 paquete de leche desnatada | U+1D2E0..U+1D2FF | Numerales mayas | 32 | 20 | Común |
1 paquete de leche desnatada | U+1D300..U+1D35F | Símbolos del Tai Xuan Jing | 96 | 87 | Común |
1 paquete de leche desnatada | U+1D360..U+1D37F | Contando numerales de varilla | 32 | 25 | Común |
1 paquete de leche desnatada | U+1D400..U+1D7FF | Símbolos Alfanuméricos Matemáticos | 1.024 | 996 | Común |
1 paquete de leche desnatada | U+1D800..U+1DAAF | Escritura de letreros de Sutton | 688 | 672 | Escritura de signos |
1 paquete de leche desnatada | U+1DF00..U+1DFFF | Latín G extendido | 256 | 37 | latín |
1 paquete de leche desnatada | U+1E000..U+1E02F | Suplemento glagolítico | 48 | 38 | Glagolítico |
1 paquete de leche desnatada | U+1E030..U+1E08F | Cirílico extendido-D | 96 | 63 | cirílico |
1 paquete de leche desnatada | U+1E100..U+1E14F | Pueblo hmong de Nyiakeng Puachue | 80 | 71 | Pueblo hmong de Nyiakeng Puachue |
1 paquete de leche desnatada | U+1E290..U+1E2BF | Toto | 48 | 31 | Toto |
1 paquete de leche desnatada | U+1E2C0..U+1E2FF | Wancho | 64 | 59 | Wancho |
1 paquete de leche desnatada | U+1E4D0..U+1E4FF | Nag Mundari | 48 | 42 | Mundari |
1 paquete de leche desnatada | U+1E5D0..U+1E5FF | Ol Onal | 48 | 44 | Ol Onal |
1 paquete de leche desnatada | U+1E7E0..U+1E7FF | Etíope ampliado-B | 32 | 28 | Etíope |
1 paquete de leche desnatada | U+1E800..U+1E8DF | Mende Kikakui | 224 | 213 | Mende Kikakui |
1 paquete de leche desnatada | U+1E900..U+1E95F | Adlam | 96 | 88 | Adlam |
1 paquete de leche desnatada | U+1EC70..U+1ECBF | Números de Siyaq índicos | 80 | 68 | Común |
1 paquete de leche desnatada | U+1ED00..U+1ED4F | Números de Siyaq otomanos | 80 | 61 | Común |
1 paquete de leche desnatada | U+1EE00..U+1EEFF | Símbolos alfabéticos matemáticos árabes | 256 | 143 | árabe |
1 paquete de leche desnatada | U+1F000..U+1F02F | Fichas de Mahjong | 48 | 44 | Común |
1 paquete de leche desnatada | U+1F030..U+1F09F | Fichas de dominó | 112 | 100 | Común |
1 paquete de leche desnatada | U+1F0A0..U+1F0FF | Naipes | 96 | 82 | Común |
1 paquete de leche desnatada | U+1F100..U+1F1FF | Suplemento alfanumérico adjunto | 256 | 200 | Común |
1 paquete de leche desnatada | U+1F200..U+1F2FF | Suplemento ideográfico adjunto | 256 | 64 | Hiragana (1 carácter), común (63 caracteres) |
1 paquete de leche desnatada | U+1F300..U+1F5FF | Símbolos y pictogramas varios | 768 | 768 | Común |
1 paquete de leche desnatada | U+1F600..U+1F64F | Emoticones | 80 | 80 | Común |
1 paquete de leche desnatada | U+1F650..U+1F67F | Dingbats ornamentales | 48 | 48 | Común |
1 paquete de leche desnatada | U+1F680..U+1F6FF | Símbolos de transporte y mapas | 128 | 118 | Común |
1 paquete de leche desnatada | U+1F700..U+1F77F | Símbolos alquímicos | 128 | 124 | Común |
1 paquete de leche desnatada | U+1F780..U+1F7FF | Formas geométricas extendidas | 128 | 103 | Común |
1 paquete de leche desnatada | U+1F800..U+1F8FF | Flechas suplementarias-C | 256 | 162 | Común |
1 paquete de leche desnatada | U+1F900..U+1F9FF | Símbolos y pictogramas complementarios | 256 | 256 | Común |
1 paquete de leche desnatada | U+1FA00..U+1FA6F | Símbolos del ajedrez | 112 | 98 | Común |
1 paquete de leche desnatada | U+1FA70..U+1FAFF | Símbolos y pictogramas ampliados-A | 144 | 114 | Común |
1 paquete de leche desnatada | U+1FB00..U+1FBFF | Símbolos para la informática tradicional | 256 | 249 | Común |
2 sorbos | U+20000..U+2A6DF | Ideogramas unificados del CJK, extensión B | 42.720 | 42.720 | Han |
2 sorbos | U+2A700..U+2B73F | Extensión C de los ideogramas unificados del CJK | 4.160 | 4.154 | Han |
2 sorbos | U+2B740..U+2B81F | Extensión D de los ideogramas unificados del CJK | 224 | 222 | Han |
2 sorbos | U+2B820..U+2CEAF | Extensión E de los ideogramas unificados del CJK | 5.776 | 5.762 | Han |
2 sorbos | U+2CEB0..U+2EBEF | Extensión F de los ideogramas unificados del CJK | 7,488 | 7,473 | Han |
2 sorbos | U+2EBF0..U+2EE5F | Extensión I de los ideogramas unificados del CJK | 624 | 622 | Han |
2 sorbos | U+2F800..U+2FA1F | Suplemento de ideogramas de compatibilidad CJK | 544 | 542 | Han |
3 CONSEJO | U+30000..U+3134F | Extensión G de los ideogramas unificados del CJK | 4.944 | 4.939 | Han |
3 CONSEJO | U+31350..U+323AF | Extensión H de los ideogramas unificados del CJK | 4.192 | 4.192 | Han |
14 SSP | U+E0000..U+E007F | Etiquetas | 128 | 97 | Común |
14 SSP | U+E0100..U+E01EF | Suplemento de selectores de variación | 240 | 240 | Heredado |
15 PUA-A | U+F0000..U+FFFFF | Área de uso privado suplementario-A | 65.536 | 65.534 | Desconocido |
16 PUA-B | U+100000..U+10FFFF | Área de Uso Privado Suplementario-B | 65.536 | 65.534 | Desconocido |
|
Cada carácter asignado puede tener un único valor para su propiedad "Script", que indica a qué script pertenece. [20] El valor es un código de cuatro letras en el rango Aaaa-Zzzz, tal como está disponible en ISO 15924, que se asigna a un sistema de escritura . Aparte de cuando se describe el contexto y el uso de un script, Unicode no utiliza una conexión entre un script y los idiomas que lo utilizan. Por lo tanto, "hebreo" se refiere al script hebreo, no al idioma hebreo.
El código especial Zyyy para "Común" permite un valor único para un carácter que se utiliza en múltiples escrituras. El código Zinh "Escritura heredada", utilizado para combinar caracteres y otros puntos de código de propósito especial, indica que un carácter "hereda" su identidad de escritura del carácter con el que se combina. (Unicode anteriormente utilizaba el código privado Qaai para este propósito). El código Zzzz "Desconocido" se utiliza para todos los caracteres que no pertenecen a una escritura (es decir, el valor predeterminado), como símbolos y caracteres de formato. En general, los caracteres de una sola escritura pueden estar dispersos en varios bloques, como los caracteres latinos . Y al revés también: pueden estar presentes varias escrituras en un solo bloque, por ejemplo, el bloque Símbolos similares a letras contiene caracteres de las escrituras latina, griega y común.
Cuando el Script está en blanco, según Unicode el carácter no pertenece a un script. Esto se aplica a los símbolos, porque los códigos de script ISO existentes "Zmth" (notación matemática), "Zsym" (símbolo) y "Zsye" (símbolo, variante de emoji) no se utilizan en Unicode. La propiedad "Script" también está en blanco para los puntos de código que no son un carácter tipográfico, como controles, sustitutos y puntos de código de uso privado.
Si hay un nombre de alias de script específico en ISO 15924, se utiliza en el nombre del carácter: U+0041 A LETRA MAYÚSCULA LATINA A , y U+05D0 א LETRA HEBREA ALEF .
ISO 15924 | Escritura en Unicode [e] | |||||||
---|---|---|---|---|---|---|---|---|
Código | Número ISO | Nombre formal ISO | Direccionalidad | Alias Unicode [f] | Versión | Personajes | Notas | Descripción |
Adlm | 166 | Adlam | escritura de derecha a izquierda | Adlam | 9.0 | 88 | Cap. 19.9 | |
Que se joda | 439 | Afaka | varía | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Aghb | 239 | Albanés caucásico | De izquierda a derecha | Albanés caucásico | 7.0 | 53 | Antiguo/histórico | Cap. 8.11 |
Ahom | 338 | Ahom, Tai Ahom | De izquierda a derecha | Ahom | 8.0 | 65 | Antiguo/histórico | Cap. 15.16 |
árabe | 160 | árabe | escritura de derecha a izquierda | árabe | 1.0 | 1.373 | Cap. 9.2 | |
Arán | 161 | Árabe (variante nastaliq) | mezclado | ZZ — Variante tipográfica del árabe (véase § Árabe) | ||||
Armas | 124 | Arameo imperial | escritura de derecha a izquierda | Arameo imperial | 5.2 | 31 | Antiguo/histórico | Cap. 10.4 |
Armonía | 230 | armenio | De izquierda a derecha | armenio | 1.0 | 96 | Cap. 7.6 | |
Adelante | 134 | Avestano | escritura de derecha a izquierda | Avestano | 5.2 | 61 | Antiguo/histórico | Cap. 10.7 |
Bali | 360 | balinés | De izquierda a derecha | balinés | 5.0 | 127 | Cap. 17.3 | |
Bamú | 435 | Bambú | De izquierda a derecha | Bambú | 5.2 | 657 | Cap. 19.6 | |
Bajo | 259 | Bajo Vah | De izquierda a derecha | Bajo Vah | 7.0 | 36 | Antiguo/histórico | Cap. 19.7 |
Murciélago | 365 | Batak | De izquierda a derecha | Batak | 6.0 | 56 | Cap. 17.6 | |
Ben | 325 | Bengalí (Bangla) | De izquierda a derecha | bengalí | 1.0 | 96 | Cap. 12.2 | |
BHKS | 334 | Bhaiksuki | De izquierda a derecha | Bhaiksuki | 9.0 | 97 | Antiguo/histórico | Cap. 14.3 |
Felicidad | 550 | Símbolos de felicidad | varía | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Bopo | 285 | Bopomofo | escritura de izquierda a derecha, de derecha a izquierda | Bopomofo | 1.0 | 77 | Cap. 18.3 | |
hermano | 300 | Brahmi | De izquierda a derecha | Brahmi | 6.0 | 115 | Antiguo/histórico | Cap. 14.1 |
Cerdo | 570 | Braille | De izquierda a derecha | Braille | 3.0 | 256 | Cap. 21.1 | |
Error | 367 | buginés | De izquierda a derecha | buginés | 4.1 | 30 | Cap. 17.2 | |
Buhd | 372 | Buhid | De izquierda a derecha | Buhid | 3.2 | 20 | Cap. 17.1 | |
Cakm | 349 | Chakma | De izquierda a derecha | Chakma | 6.1 | 71 | Cap. 13.11 | |
Latas | 440 | Sílabas aborígenes canadienses unificadas | De izquierda a derecha | Aborigen canadiense | 3.0 | 726 | Cap. 20.2 | |
Cari | 201 | Cariano | escritura de izquierda a derecha, de derecha a izquierda | Cariano | 5.1 | 49 | Antiguo/histórico | Cap. 8.5 |
Cham | 358 | Cham | De izquierda a derecha | Cham | 5.1 | 83 | Cap. 16.10 | |
Querida | 445 | Cherokee | De izquierda a derecha | Cherokee | 3.0 | 172 | Cap. 20.1 | |
Chis | 298 | Chisoo | De izquierda a derecha | ZZ — No está en Unicode, la propuesta está madura [ii] | ||||
Cristos | 109 | Corasmiano | escritura de derecha a izquierda , de arriba a abajo | Corasmiano | 13.0 | 28 | Antiguo/histórico | Cap. 10.8 |
Circo | 291 | Circo | varía | ZZ — No está en Unicode | ||||
copto | 204 | copto | De izquierda a derecha | copto | 1.0 | 137 | Antiguo/histórico, desunificado del griego en 4.1 | Cap. 7.3 |
Cpmn | 402 | Cipro-minoico | De izquierda a derecha | Chipre minoico | 14.0 | 99 | Antiguo/histórico | Cap. 8.4 |
Cprt | 403 | Silabario chipriota | escritura de derecha a izquierda | Chipriota | 4.0 | 55 | Antiguo/histórico | Cap. 8.3 |
Cirilo | 220 | cirílico | De izquierda a derecha | cirílico | 1.0 | 508 | Incluye la variante tipográfica del antiguo eslavo eclesiástico (véase § Cyrs) | Cap. 7.4 |
Ciros | 221 | Cirílico (variante del antiguo eslavo eclesiástico) | varía | ZZ — Variante tipográfica del cirílico (véase § Cyrl); antiguo/histórico | ||||
Deva | 315 | Devanagari (Nagari) | De izquierda a derecha | Devanagari | 1.0 | 164 | Cap. 12.1 | |
Diak | 342 | Inmersiones en Akuru | De izquierda a derecha | Inmersiones en Akuru | 13.0 | 72 | Antiguo/histórico | Cap. 15.15 |
Perro | 328 | Perro | De izquierda a derecha | Perro | 11.0 | 60 | Antiguo/histórico | Cap. 15.18 |
Dr. | 250 | Deseret (mormón) | De izquierda a derecha | Desierto | 3.1 | 80 | Cap. 20.4 | |
Duplicar | 755 | Taquigrafía Duployan, taquigrafía Duployan | De izquierda a derecha | Duployan | 7.0 | 143 | Cap. 21.6 | |
Egipcio | 070 | Demótico egipcio | mezclado | ZZ — No está en Unicode | ||||
Egipcio | 060 | Hierático egipcio | mezclado | ZZ — No está en Unicode | ||||
Egipto | 050 | Jeroglíficos egipcios | escritura de derecha a izquierda , de izquierda a derecha | Jeroglíficos egipcios | 5.2 | 5,105 | Antiguo/histórico | Cap. 11.4 |
Elba | 226 | Elbasan | De izquierda a derecha | Elbasan | 7.0 | 40 | Antiguo/histórico | Cap. 8.10 |
Elym | 128 | Elímaco | escritura de derecha a izquierda | Elímaco | 12.0 | 23 | Antiguo/histórico | Cap. 10.9 |
Eti | 430 | Etíope (Ge'ez) | De izquierda a derecha | Etíope | 3.0 | 523 | Cap. 19.1 | |
Gara | 164 | Garay | De derecha a izquierda | Garay | 16.0 | 69 | ||
Geok | 241 | Khutsuri (Asomtavruli y Nuskhuri) | De izquierda a derecha | georgiano | Unicode agrupa a Khutsori, Asomtavruli y Nuskhuri en 'georgiano' (ver § Geok). De manera similar, Mkhedruli y Mtavruli son 'georgianos' (ver § Geor) | Cap. 7.7 | ||
Geor | 240 | Georgiano (Mkhedruli y Mtavruli) | De izquierda a derecha | georgiano | 1.0 | 173 | En Unicode esto también incluye Nuskhuri ( Geok ). | Cap. 7.7 |
Glaciar | 225 | Glagolítico | De izquierda a derecha | Glagolítico | 4.1 | 134 | Antiguo/histórico | Cap. 7.5 |
Gong | 312 | Gondi de Gunjala | De izquierda a derecha | Gondi de Gunjala | 11.0 | 63 | Cap. 13.15 | |
Gonm | 313 | Masaram Gondi | De izquierda a derecha | Masaram Gondi | 10.0 | 75 | Cap. 13.14 | |
godo | 206 | gótico | De izquierda a derecha | gótico | 3.1 | 27 | Antiguo/histórico | Cap. 8.9 |
Gran | 343 | Grantha | De izquierda a derecha | Grantha | 7.0 | 85 | Antiguo/histórico | Cap. 15.14 |
griego | 200 | Griego | De izquierda a derecha | Griego | 1.0 | 518 | Direccionalidad a veces como bustrofedón | Cap. 7.2 |
Gujr | 320 | Gujarati | De izquierda a derecha | Gujarati | 1.0 | 91 | Cap. 12.4 | |
Gukh | 397 | Gurung Khema | De izquierda a derecha | Gurung Khema | 16.0 | 58 | ||
Gurú | 310 | Gurmukhi | De izquierda a derecha | Gurmukhi | 1.0 | 80 | Cap. 12.3 | |
Hanb | 503 | Han con Bopomofo (alias de Han + Bopomofo) | mezclado | ZZ — Véase § Hani, § Bopo | ||||
Colgar | 286 | Hangul (Hangul, Hangeul) | De izquierda a derecha, vertical de derecha a izquierda | Hangul | 1.0 | 11.739 | Sílabas del hangul reubicadas en 2.0 | Cap. 18.6 |
Hani | 500 | Han (Hanzi, Kanji, Hanja) | De arriba a abajo, columnas de derecha a izquierda (históricamente) | Han | 1.0 | 99.030 | Cap. 18.1 | |
Hano | 371 | Hanunoo (Hanunóo) | De izquierda a derecha, de abajo a arriba | Hanunoo | 3.2 | 21 | Cap. 17.1 | |
Hans | 501 | Han (variante simplificada) | varía | ZZ - Subconjunto de Han (Hanzi, Kanji, Hanja) (ver § Hani) | ||||
Hant | 502 | Han (variante tradicional) | varía | ZZ — Subconjunto de § Hani | ||||
Odio | 127 | Hatran | escritura de derecha a izquierda | Hatran | 8.0 | 26 | Antiguo/histórico | Cap. 10.12 |
Hebreo | 125 | hebreo | escritura de derecha a izquierda | hebreo | 1.0 | 134 | Cap. 9.1 | |
Hira | 410 | Hiragana | vertical de derecha a izquierda, de izquierda a derecha | Hiragana | 1.0 | 381 | Cap. 18.4 | |
Hluw | 080 | Jeroglíficos de Anatolia (jeroglíficos luvitas, jeroglíficos hititas) | De izquierda a derecha | Jeroglíficos de Anatolia | 8.0 | 583 | Antiguo/histórico | Cap. 11.6 |
Hmmm | 450 | Hmong pahawh | De izquierda a derecha | Hmong pahawh | 7.0 | 127 | Cap. 16.11 | |
Hmpp | 451 | Pueblo hmong de Nyiakeng Puachue | De izquierda a derecha | Pueblo hmong de Nyiakeng Puachue | 12.0 | 71 | Cap. 16.12 | |
Hrkt | 412 | Silabarios japoneses (alias Hiragana + Katakana) | vertical de derecha a izquierda, de izquierda a derecha | Katakana o Hiragana | Véase § Hira, § Kana | Cap. 18.4 | ||
Colgado | 176 | Húngaro antiguo (rúnico húngaro) | escritura de derecha a izquierda | Húngaro antiguo | 8.0 | 108 | Antiguo/histórico | Cap. 8.8 |
Inds | 610 | Indo (Harappa) | mezclado | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
italiano | 210 | Itálico antiguo (etrusco, osco, etc.) | escritura de derecha a izquierda , de izquierda a derecha | cursiva antigua | 3.1 | 39 | Antiguo/histórico | Cap. 8.6 |
Jamón | 284 | Jamo (alias del subconjunto Jamo de Hangul) | varía | ZZ — Subconjunto de § Hang | ||||
Java | 361 | javanés | De izquierda a derecha | javanés | 5.2 | 90 | Cap. 17.4 | |
Japón | 413 | Japonés (alias de Han + Hiragana + Katakana) | varía | ZZ — Véase § Hani, § Hira y § Kana | ||||
Jurásico | 510 | Jurchen | De izquierda a derecha | ZZ — No está en Unicode | ||||
Cali | 357 | Kayah Li | De izquierda a derecha | Kayah Li | 5.1 | 47 | Cap. 16.9 | |
Kana | 411 | Katakana | vertical de derecha a izquierda, de izquierda a derecha | Katakana | 1.0 | 321 | Cap. 18.4 | |
Kawi | 368 | Kawi | De izquierda a derecha | Kawi | 15.0 | 87 | Antiguo/histórico | Cap. 17.9 |
Khar | 305 | Kharoshti (Jaroshti) | escritura de derecha a izquierda | Kharoshti (Jaroshti) | 4.1 | 68 | Antiguo/histórico | Cap. 14.2 |
Jemer | 355 | Jemer | De izquierda a derecha | Jemer | 3.0 | 146 | Cap. 16.4 | |
Khoj | 322 | Khojki | De izquierda a derecha | Khojki | 7.0 | 65 | Antiguo/histórico | Cap. 15.7 |
Kitl | 505 | Escritura Khitan grande | De izquierda a derecha | ZZ — No está en Unicode | ||||
Kits | 288 | Escritura pequeña khitan | vertical de derecha a izquierda | Escritura pequeña khitan | 13.0 | 472 | Antiguo/histórico | Cap. 18.12 |
Knda | 345 | Canarés | De izquierda a derecha | Canarés | 1.0 | 91 | Cap. 12.8 | |
Corea | 287 | Coreano (alias de Hangul + Han) | De izquierda a derecha | ZZ — Véase § Hani, § Hang | ||||
Kpel | 436 | Kpelle | De izquierda a derecha | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Krai | 396 | Kirat Rai | De izquierda a derecha | Kirat Rai | 16.0 | 58 | ||
Kti | 317 | Kaithi | De izquierda a derecha | Kaithi | 5.2 | 68 | Antiguo/histórico | Cap. 15.2 |
Lana | 351 | Tai Tham (Lanna) | De izquierda a derecha | Tai Tham | 5.2 | 127 | Cap. 16.7 | |
Lao | 356 | Laosiano | De izquierda a derecha | Laosiano | 1.0 | 83 | Cap. 16.2 | |
Latf | 217 | Latín (variante Fraktur) | varía | ZZ — Variante tipográfica del latín (véase § Latn) | ||||
Latg | 216 | Latín (variante gaélica) | De izquierda a derecha | ZZ — Variante tipográfica del latín (véase § Latn) | ||||
Latín | 215 | latín | De izquierda a derecha | latín | 1.0 | 1,487 | Véase también: Escritura latina en Unicode | Cap. 7.1 |
Leke | 364 | Leke | De izquierda a derecha | ZZ — No está en Unicode | ||||
Lepc | 335 | Lepcha (Róng) | De izquierda a derecha | Lepcha | 5.1 | 74 | Cap. 13.12 | |
Miembro | 336 | Limbu | De izquierda a derecha | Limbu | 4.0 | 68 | Cap. 13.6 | |
Lina | 400 | Lineal A | De izquierda a derecha | Lineal A | 7.0 | 341 | Antiguo/histórico | Cap. 8.1 |
Lino | 401 | Lineal B | De izquierda a derecha | Lineal B | 4.0 | 211 | Antiguo/histórico | Cap. 8.2 |
Lisu | 399 | Lisu (Fraser) | De izquierda a derecha | Lisu | 5.2 | 49 | Cap. 18.9 | |
Loma | 437 | Loma | De izquierda a derecha | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Lici | 202 | Licio | De izquierda a derecha | Licio | 5.1 | 29 | Antiguo/histórico | Cap. 8.5 |
Lidi | 116 | Lidio | escritura de derecha a izquierda | Lidio | 5.1 | 27 | Antiguo/histórico | Cap. 8.5 |
Mahj | 314 | Mahajani | De izquierda a derecha | Mahajani | 7.0 | 39 | Antiguo/histórico | Cap. 15.6 |
Maca | 366 | Makasar | De izquierda a derecha | Makasar | 11.0 | 25 | Antiguo/histórico | Cap. 17.8 |
Mand | 140 | Mandaico, mandeo | escritura de derecha a izquierda | Mandaico | 6.0 | 29 | Cap. 9.5 | |
Mani | 139 | maniqueo | escritura de derecha a izquierda | maniqueo | 7.0 | 51 | Antiguo/histórico | Cap. 10.5 |
Bagazo | 332 | Márquen | De izquierda a derecha | Márquen | 9.0 | 68 | Antiguo/histórico | Cap. 14.5 |
maya | 090 | Jeroglíficos mayas | mezclado | ZZ — No está en Unicode | ||||
Medf | 265 | Medefaidrina (Oberi Okaime, Oberi Ɔkaimɛ) | De izquierda a derecha | Medefaidrina | 11.0 | 91 | Cap. 19.10 | |
Remiendo | 438 | Mende Kikakui | escritura de derecha a izquierda | Mende Kikakui | 7.0 | 213 | Cap. 19.8 | |
Merc | 101 | Cursiva meroítica | escritura de derecha a izquierda | Cursiva meroítica | 6.1 | 90 | Antiguo/histórico | Cap. 11.5 |
Mero | 100 | Jeroglíficos meroíticos | escritura de derecha a izquierda | Jeroglíficos meroíticos | 6.1 | 32 | Antiguo/histórico | Cap. 11.5 |
Mlim | 347 | Malabar | De izquierda a derecha | Malabar | 1.0 | 118 | Cap. 12.9 | |
Modificar | 324 | Modi, Modi | De izquierda a derecha | Modificar | 7.0 | 79 | Antiguo/histórico | Cap. 15.12 |
Mongol | 145 | mongol | vertical de izquierda a derecha, de izquierda a derecha | mongol | 3.0 | 168 | Mong incluye escrituras claras y manchúes | Cap. 13.5 |
Luna | 218 | Luna (Código lunar, Escritura lunar, Tipo lunar) | mezclado | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Señor | 264 | Señor, señor | De izquierda a derecha | Señor | 7.0 | 43 | Cap. 13.8 | |
Mtei | 337 | Meitei Mayek (Meitei, Meetei) | De izquierda a derecha | Meetei Mayek | 5.2 | 79 | Cap. 13.7 | |
Multiplicar | 323 | Multaní | De izquierda a derecha | Multaní | 8.0 | 38 | Antiguo/histórico | Cap. 15.10 |
Mi señor | 350 | Myanmar (Birmano) | De izquierda a derecha | Birmania | 3.0 | 243 | Cap. 16.3 | |
No me gusta | 295 | Nag Mundari | De izquierda a derecha | Nag Mundari | 15.0 | 42 | ||
NANDA | 311 | Nandinagari | De izquierda a derecha | Nandinagari | 12.0 | 65 | Antiguo/histórico | Cap. 15.13 |
Narb | 106 | Antiguo norte de Arabia (antiguo norte de Arabia) | escritura de derecha a izquierda | Antiguo norte de Arabia | 7.0 | 32 | Antiguo/histórico | Cap. 10.1 |
NBA | 159 | Nabateo | escritura de derecha a izquierda | Nabateo | 7.0 | 40 | Antiguo/histórico | Cap. 10.10 |
Nueva | 333 | Newa, Newar, Newari, Nepāla lipi | De izquierda a derecha | Nueva | 9.0 | 97 | Cap. 13.3 | |
Nkdb | 085 | Naxi Dongba (na²¹ɕi³³ to³³ba²¹, Nakhi Tomba) | De izquierda a derecha | ZZ — No está en Unicode | ||||
Nkgb | 420 | Naxi Geba (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-¹baw, Nakhi Geba) | De izquierda a derecha | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Nkoo | 165 | N'Ko | escritura de derecha a izquierda | Nko | 5.0 | 62 | Cap. 19.4 | |
Nshu | 499 | Nushu | vertical de derecha a izquierda | Nushu | 10.0 | 397 | Cap. 18.8 | |
Ogam | 212 | Ogam | De abajo a arriba, de izquierda a derecha | Ogam | 3.0 | 29 | Antiguo/histórico | Cap. 8.14 |
Olor | 261 | Ol Chiki (Ol Cemet', Ol, Santali) | De izquierda a derecha | Ol Chiki | 5.1 | 48 | Cap. 13.10 | |
Onao | 296 | Ol Onal | De izquierda a derecha | Ol Onal | 16.0 | 44 | ||
Orkh | 175 | Turco antiguo, rúnico orkhon | escritura de derecha a izquierda | Turco antiguo | 5.2 | 73 | Antiguo/histórico | Cap. 14.8 |
Orya | 327 | Oriya (Odia) | De izquierda a derecha | Oriya | 1.0 | 91 | Cap. 12.5 | |
Osge | 219 | Osage | De izquierda a derecha | Osage | 9.0 | 72 | Cap. 20.3 | |
Osma | 260 | Osmania | De izquierda a derecha | Osmania | 4.0 | 40 | Cap. 19.2 | |
Ougr | 143 | Viejo uigur | mezclado | Viejo uigur | 14.0 | 26 | Antiguo/histórico | Cap. 14.11 |
Palmera | 126 | Palmira | escritura de derecha a izquierda | Palmira | 7.0 | 32 | Antiguo/histórico | Cap. 10.11 |
Pauc | 263 | Pau Cin Hau | De izquierda a derecha | Pau Cin Hau | 7.0 | 57 | Cap. 16.13 | |
Pcun | 015 | Proto-cuneiforme | De izquierda a derecha | ZZ — No está en Unicode | ||||
Pelma | 016 | Protoelamita | De izquierda a derecha | ZZ — No está en Unicode | ||||
Permanente | 227 | Pérmico antiguo | De izquierda a derecha | Pérmico antiguo | 7.0 | 43 | Antiguo/histórico | Cap. 8.13 |
Fago | 331 | Fags-pa | vertical de izquierda a derecha | Fags-pa | 5.0 | 56 | Antiguo/histórico | Cap. 14.4 |
Fili | 131 | Pahlavi inscriptivo | escritura de derecha a izquierda | Pahlavi inscriptivo | 5.2 | 27 | Antiguo/histórico | Cap. 10.6 |
Phlp | 132 | Salterio Pahlavi | escritura de derecha a izquierda | Salterio Pahlavi | 7.0 | 29 | Antiguo/histórico | Cap. 10.6 |
Phlv | 133 | Libro Pahlavi | mezclado | ZZ — No está en Unicode | ||||
Phnx | 115 | Fenicio | escritura de derecha a izquierda | Fenicio | 5.0 | 29 | Antiguo/histórico [g] | Cap. 10.3 |
Piqd | 293 | Klingon (KLI pIqaD) | De izquierda a derecha | ZZ — Rechazado para su inclusión en Unicode [iii] [iv] | ||||
Por favor | 282 | Miao (pollo) | De izquierda a derecha | Miao | 6.1 | 149 | Cap. 18.10 | |
Parte | 130 | Parto inscriptivo | escritura de derecha a izquierda | Parto inscriptivo | 5.2 | 30 | Antiguo/histórico | Cap. 10.6 |
Psina | 103 | Protosinaítico | mezclado | ZZ — No está en Unicode | ||||
Qaaa-Qabx | 900-949 | Reservado para uso privado (rango) | ZZ — No está en Unicode | |||||
Ranja | 303 | Ranjana | De izquierda a derecha | ZZ — No está en Unicode | ||||
Rjng | 363 | Rejang (Redjang, Kaganga) | De izquierda a derecha | Reenganche | 5.1 | 37 | Cap. 17.5 | |
Rohg | 167 | Rohingyas hanifi | escritura de derecha a izquierda | Rohingyas hanifi | 11.0 | 50 | Cap. 16.14 | |
Ro-ro | 620 | Rongorongo | mezclado | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Correr | 211 | Rúnico | De izquierda a derecha, bustrofedón | Rúnico | 3.0 | 86 | Antiguo/histórico | Cap. 8.7 |
Samr | 123 | samaritano | escritura de derecha a izquierda , de arriba a abajo | samaritano | 5.2 | 61 | Cap. 9.4 | |
Sara | 292 | Sarati | mezclado | ZZ — No está en Unicode | ||||
Sarb | 105 | Antiguo sur de Arabia | escritura de derecha a izquierda | Antiguo sur de Arabia | 5.2 | 32 | Antiguo/histórico | Cap. 10.2 |
Saurio | 344 | Saurastra | De izquierda a derecha | Saurastra | 5.1 | 82 | Cap. 13.13 | |
Señal | 095 | Escritura de signos | vertical de izquierda a derecha | Escritura de signos | 8.0 | 672 | Cap. 21.7 | |
Shaw | 281 | Shavian (Shaw) | De izquierda a derecha | Shaviano | 4.0 | 48 | Cap. 8.15 | |
Triturar | 319 | Sharada, Sarada | De izquierda a derecha | Sharada | 6.1 | 96 | Cap. 15.3 | |
Shui | 530 | shui shu | De izquierda a derecha | ZZ — No está en Unicode | ||||
Sidd | 302 | Siddham, Siddhaṃ, Siddhamātṛkā | De izquierda a derecha | Siddham | 7.0 | 92 | Antiguo/histórico | Cap. 15.5 |
Sid | 180 | Sidetico | De derecha a izquierda | ZZ — No está en Unicode, la propuesta está madura [ii] | ||||
Sind | 318 | Khudawadi, sindhi | De izquierda a derecha | Judawadi | 7.0 | 69 | Cap. 15.9 | |
Sinh | 348 | Cingalés | De izquierda a derecha | Cingalés | 3.0 | 111 | Cap. 13.2 | |
Sogd | 141 | Sogdiano | Escritura horizontal y vertical en escrituras del este de Asia , de arriba a abajo. | Sogdiano | 11.0 | 42 | Antiguo/histórico | Cap. 14.10 |
Sogo | 142 | Sogdiano antiguo | escritura de derecha a izquierda | Sogdiano antiguo | 11.0 | 40 | Antiguo/histórico | Cap. 14.9 |
Sora | 398 | Sora Sompeng | De izquierda a derecha | Sora Sompeng | 6.1 | 35 | Cap. 15.17 | |
Soy | 329 | Soyombo | De izquierda a derecha | Soyombo | 10.0 | 83 | Antiguo/histórico | Cap. 14.7 |
Sol | 362 | Sundanés | De izquierda a derecha | Sundanés | 5.1 | 72 | Cap. 17.7 | |
Sueño | 274 | Sunuwar | De izquierda a derecha | Sunuwar | 16.0 | 44 | ||
Silòn | 316 | Syloti Nagri | De izquierda a derecha | Syloti Nagri | 4.1 | 45 | Antiguo/histórico | Cap. 15.1 |
Sirc | 135 | Siríaco | escritura de derecha a izquierda | Siríaco | 3.0 | 88 | Incluye variantes tipográficas Estrangelo (véase § Syre), occidental (§ Syrj) y oriental (§ Syrn) | Cap. 9.3 |
Sirena | 138 | Siríaco (variante de Estrangelo) | mezclado | ZZ — Variante tipográfica del siríaco (véase § Syrc) | ||||
Siri | 137 | Siríaco (variante occidental) | mezclado | ZZ — Variante tipográfica del siríaco (véase § Syrc) | ||||
Sírvase | 136 | Siríaco (variante oriental) | mezclado | ZZ — Variante tipográfica del siríaco (véase § Syrc) | ||||
Etiqueta | 373 | Tagbanwa | De izquierda a derecha | Tagbanwa | 3.2 | 18 | Cap. 17.1 | |
Takr | 321 | Takri, Ṭākrī, Ṭāṅkrī | De izquierda a derecha | Takri | 6.1 | 68 | Cap. 15.4 | |
Cuento | 353 | Tai Le | De izquierda a derecha | Tai Le | 4.0 | 35 | Cap. 16.5 | |
Talú | 354 | Nuevo Tai Lue | De izquierda a derecha | Nuevo Tai Lue | 4.1 | 83 | Cap. 16.6 | |
Tamil | 346 | Tamil | De izquierda a derecha | Tamil | 1.0 | 123 | Cap. 12.6 | |
Espiga | 520 | Tangut | vertical de derecha a izquierda, de izquierda a derecha | Tangut | 9.0 | 6,914 | Antiguo/histórico | Cap. 18.11 |
Tavt | 359 | Tai Vietnam | De izquierda a derecha | Tai Vietnam | 5.2 | 72 | Cap. 16.8 | |
Tayo | 380 | Taiyo | De arriba a abajo, columnas de derecha a izquierda | ZZ — No está en Unicode, la propuesta está madura [ii] | ||||
Telú | 340 | Télugu | De izquierda a derecha | Télugu | 1.0 | 100 | Cap. 12.7 | |
Teng | 290 | Tengwar | De izquierda a derecha | ZZ — No está en Unicode | ||||
Travesura | 120 | Tifinagh (bereber) | escritura de izquierda a derecha, de derecha a izquierda , de arriba a abajo, de abajo a arriba | Tifinagh | 4.1 | 59 | Cap. 19.3 | |
Tglg | 370 | Tagalo (Baybayin, Alibata) | De izquierda a derecha | Tagalo | 3.2 | 23 | Cap. 17.1 | |
Gracias | 170 | Taana | escritura de derecha a izquierda | Taana | 3.0 | 50 | Cap. 13.1 | |
tailandés | 352 | tailandés | De izquierda a derecha | tailandés | 1.0 | 86 | Cap. 16.1 | |
Tibio | 330 | tibetano | De izquierda a derecha | tibetano | 2.0 | 207 | Agregado en 1.0, eliminado en 1.1 y reintroducido en 2.0 | Cap. 13.4 |
Tirh | 326 | Tirhuta | De izquierda a derecha | Tirhuta | 7.0 | 82 | Cap. 15.11 | |
Tnsa | 275 | Tangsa | De izquierda a derecha | Tangsa | 14.0 | 89 | Cap. 13.18 | |
Todr | 229 | Todhri | De derecha a izquierda | Todhri | 16.0 | 52 | Antiguo/histórico | |
Tols | 299 | Tolong Siki | De izquierda a derecha | ZZ — No está en Unicode, la propuesta está madura [ii] | ||||
Toto | 294 | Toto | De izquierda a derecha | Toto | 14.0 | 31 | Cap. 13.17 | |
Tutg | 341 | Tulu-Tigalari | De izquierda a derecha | Tulu Tigalari | 16.0 | 80 | ||
Ugar | 040 | Ugarítico | De izquierda a derecha | Ugarítico | 4.0 | 31 | Antiguo/histórico | Cap. 11.2 |
Vaii | 470 | Vai | De izquierda a derecha | Vai | 5.1 | 300 | Cap. 19.5 | |
Visera | 280 | Discurso visible | De izquierda a derecha | ZZ — No está en Unicode | ||||
Con | 228 | Vithkuqi | De izquierda a derecha | Vithkuqi | 14.0 | 70 | Antiguo/histórico | Cap. 8.12 |
Guerra | 262 | Barrio Citi (Varang Kshiti) | De izquierda a derecha | Ciudad del centro | 7.0 | 84 | Cap. 13.9 | |
¿Quién? | 283 | Wancho | De izquierda a derecha | Wancho | 12.0 | 59 | Cap. 13.16 | |
Lobo | 480 | Woleai | mezclado | ZZ — No está en Unicode, se explora la propuesta [i] | ||||
Xpeo | 030 | Persa antiguo | De izquierda a derecha | Persa antiguo | 4.1 | 50 | Antiguo/histórico | Cap. 11.3 |
Xsux | 020 | Cuneiforme, sumero-acadio | De izquierda a derecha | Cuneiforme | 5.0 | 1.234 | Antiguo/histórico | Cap. 11.1 |
Yezi | 192 | Yezidí | escritura de derecha a izquierda | Yezidí | 13.0 | 47 | Antiguo/histórico | Cap. 9.6 |
Yiii | 460 | Y | De izquierda a derecha | Y | 3.0 | 1.220 | Cap. 18.7 | |
Zanb | 339 | Plaza Zanabazar (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, escritura cuadrada horizontal) | De izquierda a derecha | Plaza Zanabazar | 10.0 | 72 | Antiguo/histórico | Cap. 14.6 |
Zinh | 994 | Código para script heredado | Heredado | 657 | ||||
Zmth | 995 | Notación matemática | ZZ — No es un 'script' en Unicode | |||||
Zsym | 996 | Símbolos | ZZ — No es un 'script' en Unicode | |||||
Zsye | 993 | Símbolos (variante emoji) | ZZ — No es un 'script' en Unicode | |||||
Zxxx | 997 | Código para documentos no escritos | ZZ — No es un 'script' en Unicode | |||||
Zyyy | 998 | Código para script indeterminado | Común | 9,053 | ||||
Zzzzz | 999 | Código para script sin codificar | Desconocido | 959.049 | En Unicode: todos los demás puntos de código | |||
Notas
| ||||||||
Referencias
|
Descomposiciones, tipo de descomposición, clase de combinación canónica, exclusiones de composición y más.
Esta sección necesita ser ampliada . Puedes ayudar agregándole algo. ( Marzo de 2022 ) |
Age es la versión del estándar en la que se designó por primera vez el punto de código. El número de versión se abrevia con la numeración major.minor, aunque se utilizan números de versión más detallados: las versiones 4.0.0 y 4.0.1 se denominan 4.0 como Age. Según las versiones, Age puede ser del rango: 1.1, 2.0, 2.1, 3.0, 3.1, 3.2, 4.0, 4.1, 5.0, 5.1, 5.2, 6.0, 6.1, 6.2, 6.3, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0, 12.1, 13.0, 14.0, 15.0, 15.1 y 16.0. [21] Los valores largos para Edad comienzan con una V y utilizan un guión bajo en lugar de un punto: V1_1, por ejemplo. [2] Los puntos de código sin un valor de edad asignado específicamente tienen el valor "NA", con la forma larga "Sin asignar".
Una vez que se ha definido un carácter, no se eliminará ni se reasignará. [22] Sin embargo, un carácter puede quedar obsoleto , lo que significa que "se desaconseja enérgicamente su uso". [23] A partir de la versión 15.1 de Unicode, los siguientes quince caracteres están obsoletos: [24]
Caracteres obsoletos en Unicode | ||||
---|---|---|---|---|
Punto de código | Nombre del personaje | Alternativa recomendada | Observaciones | |
U+0149 | LETRA N MINÚSCULA LATINA PRECEDIDA POR APÓSTROFE | U+02BC U+006E | norte | |
U+0673 | LETRA ÁRABE ALEF CON HAMZA ONDULADA DEBAJO | U+0627U+065F | اٟ | |
U+0F77 | SIGNO VOCAL TIBETANO VOCÁLICA RR | U+0FB2U+0F81 [a] | ྲཱྀ | |
U+0F79 | SIGNO VOCAL TIBETANO VOCÁLICA LL | U+0FB3U+0F81 [a] | ླཱྀ | |
U+17A3 | VOCAL INDEPENDIENTE KHMER QAQ | U+17A2 | អ | |
U+17A4 | VOCAL INDEPENDIENTE KHMER QAA | U+17A2 U+17B6 | Sí | |
U+206A | INHIBIR EL INTERCAMBIO SIMÉTRICO | Ninguna [b] | ||
U+206B | ACTIVAR EL INTERCAMBIO SIMÉTRICO | Ninguna [b] | ||
U+206C | INHIBIR LA CONFORMACIÓN DE FORMAS ÁRABES | Ninguna [b] | ||
U+206D | ACTIVAR LA FORMA ÁRABE | Ninguna [b] | ||
U+206E | FORMAS DE DÍGITOS NACIONALES | Ninguna [b] | ||
U+206F | FORMAS DE DÍGITOS NOMINALES | Ninguna [b] | ||
U+2329 | SOPORTE ANGULAR QUE APUNTA A LA IZQUIERDA | U+3008 [c] | 〈 | U+27E8 ⟨ El SOPORTE ANGULAR IZQUIERDO MATEMÁTICO se recomienda para usos matemáticos y otros usos técnicos. |
U+232A | SOPORTE ANGULAR CON ORIENTACIÓN A LA DERECHA | U+3009 [c] | 〉 | El soporte de ángulo recto U+27E9 ⟩ se recomienda para usos matemáticos y otros usos técnicos. |
U+E0001 | ETIQUETA DE IDIOMA | Ninguna [d] | ||
|
El estándar Unicode especifica las siguientes propiedades relacionadas con los límites:
Unicode puede asignar nombres de alias a los puntos de código. Estos nombres son únicos respecto de todos los nombres (incluidos los normales), por lo que se pueden utilizar como identificadores. Existen cinco posibles motivos para añadir un alias:
Una vez que se codifica un carácter, no se moverá ni se eliminará.