En la informática CJK (chino, japonés y coreano), los caracteres gráficos se clasifican tradicionalmente en caracteres de ancho completo [a] y de medio ancho [b] . A diferencia de las fuentes monoespaciadas , un carácter de medio ancho ocupa la mitad del ancho de un carácter de ancho completo, de ahí el nombre.
Formas de ancho medio y ancho completo es también el nombre de un bloque Unicode U+FF00–FFEF, proporcionado para que las codificaciones más antiguas que contienen caracteres de ancho medio y ancho completo puedan tener una traducción sin pérdida hacia y desde Unicode.
Esta sección necesita citas adicionales para su verificación . ( Abril de 2021 ) |
En la época de la informática en modo texto , los caracteres occidentales se presentaban normalmente en una cuadrícula en la pantalla, a menudo de 80 columnas por 24 o 25 líneas. Cada carácter se mostraba como una pequeña matriz de puntos , a menudo de unos 8 píxeles de ancho, y generalmente se utilizaba un SBCS (conjunto de caracteres de un solo byte) para codificar caracteres de idiomas occidentales.
Por razones estéticas y de legibilidad, es preferible que los caracteres chinos tengan una forma aproximadamente cuadrada, es decir, el doble de ancho que estos caracteres SBCS de ancho fijo. Como estos se codificaban normalmente en un DBCS (conjunto de caracteres de doble byte), esto también significaba que su ancho en pantalla en una fuente duoespaciada era proporcional a su longitud en bytes. Algunas terminales y programas de edición no podían manejar caracteres de doble byte que comenzaran en columnas impares, solo en las pares (algunos ni siquiera podían poner caracteres de doble byte y de un solo byte en la misma línea). Por lo tanto, los conjuntos DBCS generalmente también incluían caracteres romanos y dígitos, para usar junto con los caracteres CJK en la misma línea.
Por otra parte, la informática japonesa temprana utilizaba una página de códigos de un solo byte llamada JIS X 0201 para katakana . Estos se representaban con el mismo ancho que los otros caracteres de un solo byte, lo que los convertía en caracteres kana de ancho medio en lugar de kana de proporciones normales. Aunque el estándar JIS X 0201 en sí no especificaba la visualización de ancho medio para katakana, esto se convirtió en la característica visual distintiva en Shift JIS entre el JIS X 0201 de un solo byte y el JIS X 0208 de doble byte . Algunas páginas de códigos de IBM utilizaban un tratamiento similar para el jamo coreano , [1] basado en el código Hangul de N bytes y su traducción EBCDIC .
Para lograr la compatibilidad con los conjuntos de caracteres existentes que contenían versiones de ancho completo y medio del mismo carácter, Unicode asignó un único bloque en U+FF00–FFEF que contenía los caracteres de "ancho alternativo" necesarios. Esto incluye una versión de ancho completo de todos los caracteres ASCII y algunos signos de puntuación no ASCII como el signo del yen, versiones de ancho medio de katakana y hangul , y versiones de ancho medio de algunos otros símbolos como los círculos. Solo se asignaron los caracteres necesarios para el viaje de ida y vuelta sin pérdida a los conjuntos de caracteres existentes, en lugar de (por ejemplo) hacer una versión de ancho completo de cada carácter acentuado en latín.
Unicode asigna a cada punto de código una propiedad de "ancho de Asia oriental" . Esta puede ser: [2]
Abreviatura | Nombre | Descripción |
---|---|---|
Yo | Ancho | Carácter naturalmente amplio, por ejemplo Hiragana . |
N / A | Angosto | Carácter naturalmente estrecho, por ejemplo, alfabeto latino básico ISO . |
F | Ancho completo | Variante amplia con normalización de compatibilidad para caracteres naturalmente estrechos, por ejemplo, escritura latina de ancho completo. |
yo | Medio ancho | Variante estrecha con normalización de compatibilidad para caracteres naturalmente anchos, p. ej., kana de ancho medio . Incluye U+20A9 ( ₩ ) como excepción. |
A | Ambiguo | Caracteres incluidos en los códigos DBCS de Asia oriental, pero también en los códigos SBCS europeos, por ejemplo, el alfabeto griego . El comportamiento duoespaciado puede variar en consecuencia. |
norte | Neutral | Caracteres que no aparecen en los códigos DBCS del este de Asia, por ejemplo, Devanagari . |
Los emuladores de terminal pueden usar esta propiedad para decidir si un carácter debe consumir una o dos "columnas" al determinar las tabulaciones y la posición del cursor.
OpenType tiene las fwid
etiquetas de características halt
, hwid
, y vhal
que se utilizan para reproducir la forma de ancho completo o medio ancho de un carácter. CSS proporciona control sobre estas características mediante las propiedades font-variant-east-asian
y font-feature-settings
. [3]