Formularios de ancho medio y ancho completo

Caracteres de ancho alternativo en la tipografía del este de Asia
Un símbolo del sistema ( cmd.exe ) con localización en coreano, que muestra caracteres de ancho medio y ancho completo

En la informática CJK (chino, japonés y coreano), los caracteres gráficos se clasifican tradicionalmente en caracteres de ancho completo [a] y de medio ancho [b] . A diferencia de las fuentes monoespaciadas , un carácter de medio ancho ocupa la mitad del ancho de un carácter de ancho completo, de ahí el nombre.

Formas de ancho medio y ancho completo es también el nombre de un bloque Unicode U+FF00–FFEF, proporcionado para que las codificaciones más antiguas que contienen caracteres de ancho medio y ancho completo puedan tener una traducción sin pérdida hacia y desde Unicode.

Razón fundamental

Los caracteres que aparecen tanto en JIS X 0201 (un solo byte) como en JIS X 0208 / JIS X 0213 (doble byte) tienen un formato de medio ancho y de ancho completo en Shift JIS .

En la época de la informática en modo texto , los caracteres occidentales se presentaban normalmente en una cuadrícula en la pantalla, a menudo de 80 columnas por 24 o 25 líneas. Cada carácter se mostraba como una pequeña matriz de puntos , a menudo de unos 8 píxeles de ancho, y generalmente se utilizaba un SBCS (conjunto de caracteres de un solo byte) para codificar caracteres de idiomas occidentales.

Por razones estéticas y de legibilidad, es preferible que los caracteres chinos tengan una forma aproximadamente cuadrada, es decir, el doble de ancho que estos caracteres SBCS de ancho fijo. Como estos se codificaban normalmente en un DBCS (conjunto de caracteres de doble byte), esto también significaba que su ancho en pantalla en una fuente duoespaciada era proporcional a su longitud en bytes. Algunas terminales y programas de edición no podían manejar caracteres de doble byte que comenzaran en columnas impares, solo en las pares (algunos ni siquiera podían poner caracteres de doble byte y de un solo byte en la misma línea). Por lo tanto, los conjuntos DBCS generalmente también incluían caracteres romanos y dígitos, para usar junto con los caracteres CJK en la misma línea.

Por otra parte, la informática japonesa temprana utilizaba una página de códigos de un solo byte llamada JIS X 0201 para katakana . Estos se representaban con el mismo ancho que los otros caracteres de un solo byte, lo que los convertía en caracteres kana de ancho medio en lugar de kana de proporciones normales. Aunque el estándar JIS X 0201 en sí no especificaba la visualización de ancho medio para katakana, esto se convirtió en la característica visual distintiva en Shift JIS entre el JIS X 0201 de un solo byte y el JIS X 0208 de doble byte . Algunas páginas de códigos de IBM utilizaban un tratamiento similar para el jamo coreano , [1] basado en el código Hangul de N bytes y su traducción EBCDIC .

En Unicode

Para lograr la compatibilidad con los conjuntos de caracteres existentes que contenían versiones de ancho completo y medio del mismo carácter, Unicode asignó un único bloque en U+FF00–FFEF que contenía los caracteres de "ancho alternativo" necesarios. Esto incluye una versión de ancho completo de todos los caracteres ASCII y algunos signos de puntuación no ASCII como el signo del yen, versiones de ancho medio de katakana y hangul , y versiones de ancho medio de algunos otros símbolos como los círculos. Solo se asignaron los caracteres necesarios para el viaje de ida y vuelta sin pérdida a los conjuntos de caracteres existentes, en lugar de (por ejemplo) hacer una versión de ancho completo de cada carácter acentuado en latín.

Unicode asigna a cada punto de código una propiedad de "ancho de Asia oriental" . Esta puede ser: [2]

Propiedades de caracteres Unicode basadas en el ancho
AbreviaturaNombreDescripción
YoAnchoCarácter naturalmente amplio, por ejemplo Hiragana .
N / AAngostoCarácter naturalmente estrecho, por ejemplo, alfabeto latino básico ISO .
FAncho completoVariante amplia con normalización de compatibilidad para caracteres naturalmente estrechos, por ejemplo, escritura latina de ancho completo.
yoMedio anchoVariante estrecha con normalización de compatibilidad para caracteres naturalmente anchos, p. ej., kana de ancho medio . Incluye U+20A9 ( ) como excepción.
AAmbiguoCaracteres incluidos en los códigos DBCS de Asia oriental, pero también en los códigos SBCS europeos, por ejemplo, el alfabeto griego . El comportamiento duoespaciado puede variar en consecuencia.
norteNeutralCaracteres que no aparecen en los códigos DBCS del este de Asia, por ejemplo, Devanagari .

Los emuladores de terminal pueden usar esta propiedad para decidir si un carácter debe consumir una o dos "columnas" al determinar las tabulaciones y la posición del cursor.

En OpenType

OpenType tiene las fwidetiquetas de características halt, hwid, y vhalque se utilizan para reproducir la forma de ancho completo o medio ancho de un carácter. CSS proporciona control sobre estas características mediante las propiedades font-variant-east-asiany font-feature-settings. [3]

Véase también

Notas

  1. ^ En Taiwán y Hong Kong : 全形; en CJK: 全角.
  2. ^ En Taiwán y Hong Kong : 半形; en CJK: 半角.

Referencias

  1. ^ "Demostración de la UCI: explorador de convertidores". demo.icu-project.org . Consultado el 7 de mayo de 2018 .
  2. ^ Lunde, Ken (25 de enero de 2019). "Anexo n.° 11 del estándar Unicode®: Ancho de Asia oriental". Consorcio Unicode .
  3. ^ "Sintaxis para funciones OpenType en CSS". Adobe . Consultado el 20 de septiembre de 2023 .
  • Anexo n.° 11 del estándar Unicode de ancho de Asia oriental
Obtenido de "https://es.wikipedia.org/w/index.php?title=Formatos_de_ancho_medio_y_ancho_completo&oldid=1222443138"