Carácter de espacio en blanco

Un carácter de archivo de texto de computadora que representa un espacio en blanco

Un carácter de espacio en blanco es un elemento de datos de carácter que representa un espacio en blanco cuando se procesa texto para su visualización en una computadora .

Por ejemplo, un carácter de espacio ( U+0020 ESPACIO , ASCII 32) representa un espacio en blanco, como un divisor de palabras en una escritura occidental . 

Un carácter imprimible genera una salida cuando se representa, pero un carácter de espacio en blanco no. En cambio, los caracteres de espacio en blanco definen la disposición del texto en un grado limitado, interrumpiendo la secuencia normal de representación de caracteres uno al lado del otro. La salida de los caracteres subsiguientes normalmente se desplaza hacia la derecha (o hacia la izquierda para la escritura de derecha a izquierda ) o hacia el comienzo de la siguiente línea. El efecto de múltiples caracteres de espacio en blanco secuenciales es acumulativo, de modo que el siguiente carácter imprimible se representa en una ubicación basada en el efecto acumulado de los caracteres de espacio en blanco anteriores.

El término espacio en blanco tiene su origen en la práctica común de representar texto en papel blanco . Normalmente, un carácter de espacio en blanco no se representa como blanco. Afecta a la representación, pero no se representa en sí mismo.

Descripción general

Ancho de varios caracteres de espacio Unicode

Un carácter de espacio generalmente inserta un espacio horizontal que tiene aproximadamente el mismo ancho que una letra. En el caso de una fuente monoespaciada, el ancho es el ancho de una letra y, en el caso de una fuente de ancho variable, el ancho es específico de la fuente. Algunas fuentes admiten varios caracteres de espacio que tienen diferentes anchos.

Un carácter de tabulación generalmente inserta un espacio horizontal que se basa en paradas de tabulación que varían según la aplicación .

Una secuencia de caracteres de nueva línea normalmente mueve la ubicación de salida de la representación al comienzo de la siguiente línea. Si una secuencia va después del texto, en realidad no genera espacios en blanco. Sin embargo, dos secuencias de nueva línea secuenciales entre bloques de texto generan una línea en blanco entre los bloques. La altura de la línea en blanco varía según la aplicación.

El uso de caracteres de espacio en blanco para diseñar texto es una convención . En ocasiones, las aplicaciones representan caracteres de espacio en blanco como marcado visible para que el usuario pueda ver lo que normalmente no es visible.

Normalmente, un usuario escribe un carácter de espacio presionando spacebar, un carácter de tabulación presionando y una nueva línea presionando .Tab ↹↵ Enter

Unicode

La siguiente tabla enumera los veinticinco caracteres definidos como espacios en blanco ("WSpace=Y", "WS") en la base de datos de caracteres Unicode . [1] Diecisiete utilizan una definición de espacio en blanco coherente con el algoritmo de escritura bidireccional ("Bidirectional Character Type=WS") y se conocen como caracteres "Bidi-WS". Los caracteres restantes también se pueden utilizar, pero no son de este tipo "Bidi".

Nota: Dependiendo del navegador y las fuentes utilizadas para ver la siguiente tabla, es posible que no todos los espacios se muestren correctamente.

NombrePunto de códigoCaja de ancho¿ Puede romperse ?¿ En
IDN ?
GuionBloquear
Categoría general
Notas
tabulación de caracteresU+00099NoComúnLatín básicoOtros,
control
HT, pestaña horizontal . Entidad con nombre HTML/XML : 	, LaTeX : \tab, escape C :\t
avance de líneaU+000A10Es un salto de líneaComúnLatín básicoOtros,
control
LF, Salto de línea . Entidad con nombre HTML/XML: 
, Escape C:\n
tabulación de líneaU+000B11Es un salto de líneaComúnLatín básicoOtros,
control
VT, Tabulación vertical . C escape:\v
avance de formularioU+000C12Es un salto de líneaComúnLatín básicoOtros,
control
FF, Avance de página . Escape C:\f
retorno de carroU+000D13Es un salto de líneaComúnLatín básicoOtros,
control
CR, Retorno de carro . C escape:\r
espacioU+002032 NoComúnLatín básicoSeparador,
espacio
El más común (espacio ASCII normal). LaTeX:
siguiente lineaU+0085133Es un salto de líneaComún
Suplemento de latín-1
Otros,
control
NEL, Siguiente línea . LaTeX:\\
espacio sin interrupciónU+00A0160 NoNoComún
Suplemento de latín-1
Separador,
espacio
Espacio indivisible : idéntico a U+0020, pero no es un punto en el que se pueda dividir una línea.
Entidad con nombre HTML/XML:  ,  , LaTeX:~
marca espacial oghamU+16805760NoOgamOgamSeparador,
espacio
Se utiliza para separar palabras en textos Ogham . Normalmente, se trata de una línea vertical en texto vertical o de una línea horizontal en texto horizontal, pero también puede ser un espacio en blanco en fuentes "sin tallo". Requiere una fuente Ogham.
en quadU+20008192 NoComún
Puntuación general
Separador,
espacio
Ancho de un en . U+2002 es canónicamente equivalente a este carácter; se prefiere U+2002.
en cuadriláteroU+20018193NoComún
Puntuación general
Separador,
espacio
También conocido como "mutton quad". Ancho de un em . U+2003 es canónicamente equivalente a este carácter; se prefiere U+2003.
en el espacioU+20028194NoComún
Puntuación general
Separador,
espacio
También conocido como "nut". Ancho de un en . U+2000 En Quad es canónicamente equivalente a este carácter; se prefiere U+2002.
Entidad con nombre HTML/XML:  , LaTeX: \enspace(el espacio en LaTeX es un espacio sin interrupción)
espacio emU+20038195NoComún
Puntuación general
Separador,
espacio
También conocido como "mutton". Ancho de un em . U+2001 Em Quad es canónicamente equivalente a este carácter; se prefiere U+2003.
Entidad con nombre HTML/XML:  , LaTeX:\quad
espacio de tres por emU+20048196NoComún
Puntuación general
Separador,
espacio
También conocido como "espacio grueso". Un tercio de un em de ancho.
Entidad con nombre HTML/XML:  , LaTeX: \;(el espacio grueso de LaTeX es un espacio sin interrupción)
espacio de cuatro por emU+20058197NoComún
Puntuación general
Separador,
espacio
También conocido como "espacio intermedio". Un cuarto de un em de ancho.
Entidad con nombre HTML/XML: 
espacio de seis por emU+20068198NoComún
Puntuación general
Separador,
espacio
Un sexto de un em de ancho. En tipografía informática, a veces se lo equipara a U+2009.
espacio de figuraU+20078199NoNoComún
Puntuación general
Separador,
espacio
Espacio entre cifras . En fuentes con dígitos monoespaciados, igual al ancho de un dígito.
Entidad con nombre HTML/XML: 
espacio de puntuaciónU+20088200NoComún
Puntuación general
Separador,
espacio
Tan ancho como la puntuación estrecha en una fuente, es decir, el ancho avanzado del punto o la coma. [2]
Entidad nombrada HTML/XML: 
espacio delgadoU+20098201NoComún
Puntuación general
Separador,
espacio
Espacio fino ; un quinto (a veces un sexto) de un em de ancho. Recomendado para usar como separador de miles para medidas hechas con unidades del SI . A diferencia de U+2002 a U+2008, su ancho puede ajustarse en la composición tipográfica. [3]
Entidad con nombre HTML/XML:  ,  , LaTeX: \,(el espacio fino LaTeX es un espacio sin saltos)
espacio para el cabelloU+200A8202NoComún
Puntuación general
Separador,
espacio
Más delgado que un espacio delgado. Entidad con nombre HTML/XML:  , 
separador de líneaU+20288232Es un salto de líneaComún
Puntuación general
Separador,
línea
separador de párrafoU+20298233Es un salto de líneaComún
Puntuación general
Separador,
párrafo
espacio estrecho sin interrupciónU+202F8239NoNoComún
Puntuación general
Separador,
espacio
Espacio estrecho sin interrupción . Similar en función al espacio sin interrupción U+00A0. Cuando se utiliza con mongol, su ancho suele ser un tercio del espacio normal; en otros contextos, su ancho a veces se asemeja al del espacio delgado (U+2009). LaTeX:\,
espacio matemático medioU+205F8287NoComún
Puntuación general
Separador,
espacio
MMSP. Se utiliza en fórmulas matemáticas. Cuatro dieciochoavos de un em. [4] En tipografía matemática, los anchos de los espacios se dan normalmente en múltiplos enteros de un dieciochoavo de un em, y 4/18 em se puede utilizar en varias situaciones, por ejemplo entre la a y el + y entre el + y la b en la expresión a + b . [5]
Entidad nombrada HTML/XML:  , LaTeX: \:(el espacio medio LaTeX es un espacio sin interrupción)
espacio ideográficoU+300012288 NoComúnSímbolos
y
puntuación del CJK
Separador,
espacio
Tan ancho como una celda de carácter CJK ( ancho completo ). Se utiliza, por ejemplo, en tai tou .
 Nombre Punto de códigoCaja de ancho¿ Puede romperse ?¿ En
IDN ?
GuionBloquear
Categoría general
Notas
separador de vocales mongolU+180E6158NomongolmongolOtro,
Formato
MVS. Carácter de espacio angosto, utilizado en mongol para hacer que los dos últimos caracteres de una palabra adopten formas diferentes. [6] Ya no se clasifica como carácter de espacio (es decir, en la categoría Zs) en Unicode 6.3.0, aunque lo estaba en versiones anteriores del estándar.
espacio de ancho ceroU+200B8203No?
Puntuación general
Otro,
Formato
ZWSP, espacio de ancho cero . Se utiliza para indicar límites de palabras a los sistemas de procesamiento de texto cuando se utilizan scripts que no utilizan espaciado explícito. Es similar al guión suave , con la diferencia de que este último se utiliza para indicar límites de sílabas y debe mostrar un guión visible cuando la línea se divide en él. Entidad nombrada
HTML/XML : [7] [c]​
Sin unión de ancho ceroU+200C8204Depende del contexto [12]?
Puntuación general
Otro,
Formato
ZWNJ, non-joiner de ancho cero . Cuando se coloca entre dos caracteres que de otro modo estarían conectados, un ZWNJ hace que se impriman en sus formas final e inicial, respectivamente.
Entidad con nombre HTML/XML:‌
ensamblador de ancho ceroU+200D8205Depende del contexto [13]?
Puntuación general
Otro,
Formato
ZWJ, conector de ancho cero . Cuando se coloca entre dos caracteres que de otro modo no estarían conectados, un ZWJ hace que se impriman en sus formas conectadas. También se puede utilizar para mostrar formas de unión de forma aislada. Dependiendo de si se espera una ligadura o conjunción de forma predeterminada, puede inducir (como en emoji y en cingalés ) o suprimir (como en devanagari ) la sustitución con un solo glifo, al tiempo que permite el uso de formas de unión individuales (a diferencia de ZWNJ).
Entidad nombrada HTML/XML:‍
ensamblador de palabrasU+20608288NoNo?
Puntuación general
Otro,
Formato
WJ, conector de palabras . Similar a U+200B, pero no es un punto en el que se pueda dividir una línea.
Entidad con nombre HTML/XML:⁠
espacio irrompible de ancho ceroU+FEFF65279NoNo?
Formularios de presentación en árabe
-B
Otro,
Formato
Espacio indivisible de ancho cero . Se utiliza principalmente como marca de orden de bytes . Su uso como indicación de indivisible está en desuso a partir de Unicode 3.2; consulte U+2060 en su lugar.
  1. ^ White_Space es una propiedad binaria Unicode. [14]
  2. ^ "PropList-16.0.0.txt". Unicode . 2024-05-31 . Consultado el 2024-09-13 .
  3. ^ Aunque ​es una entidad nombrada HTML5 para U+200B, los nombres adicionales NegativeMediumSpace, NegativeThickSpace, NegativeThinSpacey NegativeVeryThinSpace(que son nombres utilizados en el lenguaje Wolfram para espacios de avance negativo, que asigna al Área de uso privado ) [8] [9] [10] [11] también están definidos por HTML5 como alias para U+200B (por ejemplo ​). [7]

Imágenes sustitutivas

Unicode también proporciona algunos caracteres visibles que pueden usarse para representar varios caracteres de espacio en blanco, en contextos donde se debe mostrar un símbolo visible:

Caracteres que ilustran espacios Unicode (visibles)
CódigoDecimalNombreBloquearMostrarDescripción
U+00B7183Punto medioSuplemento de latín-1·
Entidad nombrada Interpunct :·
U+21A18609Flecha de dos puntas hacia abajoFlechasSímbolo ECMA-17 / ISO 2047 para avance de página (salto de página) [15]
U+22618810Idéntico a
Operadores matemáticos
Entre otros usos, se encuentra el símbolo ECMA-17 / ISO 2047 para avance de línea [15]
U+237D9085Caja abierta con hombros descubiertosVarios TécnicosSe utiliza para indicar un NBSP
U+23CE9166Símbolo de retornoVarios TécnicosSímbolo de una tecla de retorno , que introduce un salto de línea
U+24099225Símbolo para tabulación horizontalImágenes de controlSustitutos de un carácter de tabulación
U+240A9226Símbolo de avance de líneaImágenes de controlSustitutos de un avance de línea
U+240B9227Símbolo para tabulación verticalImágenes de controlSustitutos de una tabulación vertical (tabulación de línea)
U+240C9228Símbolo para avance de páginaImágenes de controlSustitutos de un salto de página
U+240D9229Símbolo de retorno de carroImágenes de controlSustitutos de un retorno de carro
U+24209248Símbolo del espacioImágenes de controlSustitutos de un espacio ASCII
U+24229250Símbolo en blancoImágenes de controlTambién conocido como "espacio en blanco sustituto", [16] utilizado en BCDIC , [16] EBCDIC , [16] ASCII-1963 [16] [17] etc. como símbolo para el separador de palabras.
U+24239251Caja abiertaImágenes de controlSe utiliza en la escritura a mano con letras de imprenta al menos desde la década de 1980 cuando es necesario indicar explícitamente el número de caracteres de espacio (por ejemplo, al programar con lápiz y papel). Se utiliza en un libro de texto (publicado en 1982, 1984, 1985, 1988 por Springer-Verlag) sobre Modula-2 , [18] un lenguaje de programación donde los códigos de espacio requieren una indicación explícita. También se utiliza en el teclado [n 1] de la serie de calculadoras gráficas TI-8 x de Texas Instruments . Entidad nombrada:
␣
U+24249252Símbolo de nueva líneaImágenes de controlSustitutos de un salto de línea
U+25B39651Triángulo blanco que apunta hacia arribaFormas geométricasEntre otros usos, se encuentra el símbolo ECMA-17 / ISO 2047 para el espacio ASCII [15]
U+2A5B10843Lógico O con raíz mediaOperadores
matemáticos suplementarios
Entre otros usos, se encuentra el símbolo ECMA-17 / ISO 2047 para tabulación vertical (tabulación de línea) [15]
U+2AAA10922Más pequeño queOperadores
matemáticos suplementarios
Entre otros usos, se encuentra el símbolo ECMA-17 / ISO 2047 para retorno de carro [15]
U+2AAB10923Más grande queOperadores
matemáticos suplementarios
Entre otros usos, se encuentra el símbolo ECMA-17 / ISO 2047 para el carácter de tabulación [15]
U+303712343
Símbolo separador de avance de línea del telégrafo ideográfico
Símbolos
y puntuación del CJK
Gráfico utilizado para el código 9999 en el código telegráfico chino , que representa un salto de línea.
  1. ^ Encima del cero aparece la tecla "0" o negativa "(‒)".
Espacio exacto
  • El Cambridge Z88 proporcionaba un "espacio exacto" especial (punto de código 160, también conocido como 0xA0) (invocable mediante el atajo de teclado + [19] ), que el controlador de pantalla del sistema operativo mostraba como "...". [20] [21] Por lo tanto, también se lo conocía como "espacio de puntos" en conjunción con BBC BASIC . [20] [21]SPACE
  • Bajo el punto de código 224 (0xE0), la computadora también proporcionó un símbolo especial de ESPACIO de tres celdas de ancho "SPC"(análogo al U+2420 de una sola celda de Unicode). [20] [21]

Espacios en blanco sin espacio

  • El bloque Unicode de patrones Braille contiene U+2800BRAILLE PATTERN BLANK , un patrón Braille sin puntos en relieve. Algunas fuentes muestran el carácter como un espacio en blanco de ancho fijo, sin embargo, el estándar Unicode establece explícitamente que no actúa como un espacio. [22]
  • La cobertura de Unicode del alfabeto coreano incluye varios puntos de código que representan la ausencia de una letra escrita y, por lo tanto, no muestran un glifo:
    • Unicode incluye un carácter de relleno Hangul en el bloque Jamo de compatibilidad Hangul ( U+3164HANGUL FILLER ). Este carácter se clasifica como una letra, pero se muestra como un espacio vacío, como un bloque Hangul que no contiene jamo. Se utiliza en las secuencias de combinación Hangul KS X 1001 para introducirlas o indicar la ausencia de una letra en una posición, pero no en el sistema de combinación jamo de Unicode. [23]
    • El sistema jamo combinatorio de Unicode utiliza caracteres similares Hangul Choseong Filler y Hangul Jungseong Filler para indicar la ausencia de una letra en posición inicial o medial dentro de un bloque de sílabas, que están incluidos en el bloque Hangul Jamo ( U+115FHANGUL CHOSEONG FILLER , U+1160HANGUL JUNGSEONG FILLER ). [24]
    • Además, se incluye un relleno Hangul de ancho medio en los formatos de ancho medio y ancho completo ( U+FFA0HALFWIDTH HANGUL FILLER ), que se utiliza al realizar asignaciones desde codificaciones que incluyen caracteres tanto de Johab (o Wansung ) como de Hangul de N bytes (o su contraparte EBCDIC ), como IBM-933, que incluye rellenos tanto de Johab como de EBCDIC. [25] [26]

Espacios en blanco y tipografía digital

El Manual de estilo de Chicago tiene reglas para utilizar espacios en blanco de diferentes tamaños.

Visualización en pantalla

Los editores de texto , los procesadores de texto y el software de autoedición difieren en la forma en que representan los espacios en blanco en la pantalla y en cómo representan los espacios al final de las líneas más largas que la pantalla o el ancho de la columna. En algunos casos, los espacios se muestran simplemente como espacios en blanco; en otros casos, pueden representarse mediante un punto u otros símbolos. Se pueden utilizar muchos caracteres diferentes (descritos a continuación) para producir espacios, y las funciones que no son caracteres (como los márgenes y las configuraciones de tabulación) también pueden afectar a los espacios en blanco.

Muchos de los caracteres espaciales Unicode se crearon para ser compatibles con la tipografía impresa clásica. [27]

Incluso si la tipografía digital tiene kerning y justificación algorítmicos, esos caracteres de espacio se pueden usar para complementar el formato electrónico cuando sea necesario.

Espacio de uso general de ancho variable

En las codificaciones de caracteres de computadora , existe un espacio normal de uso general (carácter Unicode U+0020) cuyo ancho variará según el diseño de la tipografía. Los valores típicos varían de 1/5 em a 1/3 em (en tipografía digital, un em es igual al tamaño nominal de la fuente, por lo que para una fuente de 10 puntos, el espacio probablemente será de entre 2 y 3,3 puntos). Las fuentes sofisticadas pueden tener espacios de diferentes tamaños para negrita, cursiva y mayúsculas pequeñas, y a menudo los compositores ajustarán manualmente el ancho del espacio según el tamaño y la prominencia del texto.

Además de este espacio de uso general, es posible codificar un espacio de un ancho específico. Consulte la tabla a continuación para obtener una lista completa.

Espacios para el cabello alrededor de los guiones

Los guiones largos utilizados como separadores entre paréntesis, y los guiones cortos cuando se utilizan como uniones de palabras, normalmente se establecen de forma continua con el texto. [28] Sin embargo, dicho guión puede estar opcionalmente rodeado por un espacio de pelo , U+200A, o un espacio fino , U+2009. El espacio de pelo se puede escribir en HTML utilizando las referencias de caracteres numéricos   o  , o la entidad nombrada  , aunque esto no es universalmente compatible en los navegadores a partir de 2016. [ necesita actualización ] El espacio fino es entidad nombrada y referencias numéricas o . Estos espacios son mucho más delgados que un espacio normal (excepto en una fuente monoespaciada (no proporcional) ), siendo el espacio de pelo en particular el más delgado de los caracteres de espacio en blanco horizontales.[actualizar]   

Espacio normal versus espacios delgados y de cabello (tal como los muestra su navegador)
Espacio normal con guión largoizquierda — derecha
Espacio fino con guión largoizquierda derecha
Espacio para el cabello con guión largoizquierda — derecha
Sin espacio con guión largoizquierda—derecha

Aplicaciones informáticas

Lenguajes de programación

En la sintaxis de la mayoría de los lenguajes de programación , los caracteres de espacio en blanco se pueden usar para separar tokens . En un lenguaje de formato libre , los procesadores de código (es decir, el compilador ) ignoran los caracteres de espacio en blanco . Incluso cuando la sintaxis del lenguaje requiere espacios en blanco, a menudo varios caracteres de espacio en blanco se tratan de la misma manera que uno solo. En un lenguaje de reglas fuera de juego , el espacio en blanco de sangría es sintácticamente significativo. En el lenguaje satírico y contrario llamado Whitespace , los caracteres de espacio en blanco son los únicos caracteres significativos y se ignora el texto normal.

El uso adecuado de los espacios en blanco en el código fuente permite agrupar la lógica relacionada y hacer que el código sea más fácil de entender. El uso excesivo de espacios en blanco, incluso al final de una línea donde no proporcionan ningún comportamiento de representación, se considera una molestia.

La mayoría de los lenguajes solo reconocen caracteres de espacio en blanco que tienen un código ASCII. No permiten la mayoría o la totalidad de los códigos Unicode enumerados anteriormente. El lenguaje C define los caracteres de espacio en blanco como "espacio, tabulación horizontal, nueva línea, tabulación vertical y avance de página". [29] El protocolo de red HTTP requiere que se utilicen diferentes tipos de espacios en blanco en diferentes partes del protocolo, como: solo el carácter de espacio en la línea de estado , CRLF al final de una línea y "espacio en blanco lineal" en los valores de encabezado. [30]

Análisis de línea de comandos

Los analizadores de línea de comandos típicos utilizan el carácter de espacio para delimitar los argumentos . Un valor con un carácter de espacio incrustado es problemático, ya que hace que el valor se analice como múltiples argumentos. Normalmente, un analizador permite escapar del análisis normal de argumentos encerrando el texto entre comillas.

Supongamos que se desea enumerar los archivos del directorio denominado "foo bar". Este comando enumera los archivos que coinciden con "foo" o "bar":

barra de  foo 

Este comando especifica correctamente un único argumento:

¿Es "foo bar"? 

Lenguajes de marcado

Algunos lenguajes de marcado , como SGML , conservan los espacios en blanco tal como están escritos.

Los lenguajes de marcado web como XML y HTML tratan los caracteres de espacio en blanco de forma especial, incluidos los caracteres de espacio, para la comodidad de los programadores. Uno o más caracteres de espacio leídos por los procesadores de tiempo de visualización de dichos lenguajes de marcado se reducen a 0 o 1 espacio, según su contexto semántico. Por ejemplo, los espacios dobles (o más) dentro del texto se reducen a un solo espacio, y los espacios que aparecen a ambos lados del " =" que separa el nombre de un atributo de su valor no tienen ningún efecto en la interpretación del documento. Las etiquetas de fin de elemento pueden contener espacios finales, y las etiquetas de elemento vacío en XML pueden contener espacios antes del " />". En estos lenguajes, los espacios en blanco innecesarios aumentan el tamaño del archivo, por lo que pueden ralentizar las transferencias de red. Por otro lado, los espacios en blanco innecesarios también pueden marcar código de forma discreta, de forma similar a los comentarios en el código, pero menos obvia. Esto puede ser deseable para demostrar una infracción de la licencia o los derechos de autor que se cometió al copiar y pegar .

En los valores de atributos XML, las secuencias de caracteres de espacio en blanco se tratan como un solo espacio cuando un analizador lee el documento. [31] El analizador no modifica de esta manera los espacios en blanco en el contenido de un elemento XML, pero una aplicación que recibe información del analizador puede optar por aplicar reglas similares al contenido del elemento. Un autor de un documento XML puede utilizar el xml:space="preserve"atributo en un elemento para indicar al analizador que desaconseje a la aplicación posterior la modificación de los espacios en blanco en el contenido de ese elemento.

En la mayoría de los elementos HTML , una secuencia de caracteres de espacio en blanco se trata como un único separador entre palabras , que puede manifestarse como un único carácter de espacio al representar texto en un lenguaje que normalmente inserta dicho espacio entre palabras. [32] Se requiere que los renderizadores HTML que cumplen con las normas apliquen un tratamiento más literal de los espacios en blanco dentro de unos pocos elementos prescritos, como la preetiqueta y cualquier elemento para el que se haya utilizado CSSpre para aplicar un procesamiento de espacios en blanco similar a -. En tales elementos, los caracteres de espacio no se "contraerán" en separadores entre palabras.

Tanto en XML como en HTML, el carácter de espacio indivisible , junto con otros espacios no "estándar", no se trata como un "espacio en blanco" colapsable, por lo que no está sujeto a las reglas anteriores.

Nombres de archivos

Este uso es similar a los nombres de archivos de varias palabras escritos para sistemas operativos y aplicaciones que se confunden con los códigos de espacio integrados; dichos nombres de archivos utilizan en cambio un guión bajo (_) como separador de palabras, como_en_esta_frase.

Otro símbolo similar era U+2422SÍMBOLO EN BLANCO . Este símbolo se utilizó en los primeros años de la programación informática al escribir en formularios de codificación. Los operadores de las máquinas perforadoras reconocían inmediatamente el símbolo como un "espacio explícito". [16] Se utilizó en BCDIC , [16] EBCDIC , [16] y ASCII-1963 . [16]

Véase también

Referencias

  1. ^ "El estándar Unicode". Consorcio Unicode.
  2. ^ "Estándares de diseño de personajes: personajes espaciales". Estándares de diseño de personajes . Microsoft . 1998–1999. Archivado desde el original el 14 de marzo de 2010 . Consultado el 18 de mayo de 2009 .
  3. ^ El estándar Unicode 5.0, edición impresa, pág. 205; también disponible en «Capítulo 6: sistemas de escritura y puntuación» (PDF) . El estándar Unicode 5.0, edición electrónica. Consorcio Unicode . 14 de julio de 2006. pág. 11 (205) . Consultado el 22 de diciembre de 2022 .
  4. ^ "Puntuación general" (PDF) . El estándar Unicode 5.1 . Unicode Inc . 1991–2008 . Consultado el 13 de mayo de 2009 .
  5. ^ Sargent, Murray III (29 de agosto de 2006). "Unicode Nearly Plain Text Encoding of Mathematics (Version 2)" (Codificación de texto casi sin formato Unicode de matemáticas (versión 2)). Nota técnica Unicode n.° 28. Unicode Inc. , págs. 19-20 . Consultado el 19 de mayo de 2009 .
  6. ^ Gillam, Richard (2002). Unicode desmitificado: una guía práctica para programadores sobre el estándar de codificación . Addison-Wesley. ISBN 0-201-70052-2.
  7. ^ ab Hickson, Ian . "12.5 Referencias de caracteres con nombre". Estándar HTML . WHATWG .
  8. ^ Wolfram . "\[NegativeThickSpace]". Documentación del lenguaje Wolfram .
  9. ^ Wolfram . "\[EspacioMedioNegativo]". Documentación del lenguaje Wolfram .
  10. ^ Wolfram . "\[NegativeThinSpace]". Documentación del lenguaje Wolfram .
  11. ^ Wolfram . "\[NegativeVeryThinSpace]". Documentación del lenguaje Wolfram .
  12. ^ Faltstrom, P., ed. (agosto de 2010). "Zero Width Non-Joiner". Puntos de código Unicode y nombres de dominio internacionalizados para aplicaciones (IDNA). IETF . sec. A.1. doi : 10.17487/RFC5892 . RFC 5892 . Consultado el 4 de septiembre de 2019 .
  13. ^ Faltstrom, P., ed. (agosto de 2010). "Zero Width Joiner". Puntos de código Unicode y nombres de dominio internacionalizados para aplicaciones (IDNA). IETF . sec. A.2. doi : 10.17487/RFC5892 . RFC 5892 . Consultado el 4 de septiembre de 2019 .
  14. ^ "Anexo n.° 44 del estándar Unicode, base de datos de caracteres Unicode".
  15. ^ abcdef Asociación Europea de Fabricantes de Computadoras (28 de noviembre de 1968). Representación gráfica de los caracteres de control del conjunto de caracteres codificados de 7 bits de la ECMA para el intercambio de información (PDF) . ECMA-17.
  16. ^ abcdefgh Mackenzie, Charles E. (1980). Conjuntos de caracteres codificados, historia y desarrollo (PDF) . The Systems Programming Series (1.ª edición). Addison-Wesley Publishing Company, Inc. , págs. 41, 47, 52, 102-103, 117, 119, 130, 132, 141, 148, 150-151, 212, 424. ISBN 978-0-201-14460-4. LCCN  77-90165. Archivado (PDF) del original el 26 de mayo de 2016. Consultado el 25 de agosto de 2019 .
  17. ^ "Código estándar estadounidense para el intercambio de información, ASA X3.4-1963". Asociación Estadounidense de Normalización (ASA). 17 de junio de 1963.
  18. ^ Wirth, Niklaus (1988). Programación en Modula-2 (PDF) . doi :10.1007/978-3-642-83565-0. ISBN 978-3-642-83567-4.
  19. ^ "Guía del usuario de Cambridge Z88". 4.7 (4.ª ed.). Cambridge Computer Limited . 2016 [1987]. Conceptos básicos: el teclado. Archivado desde el original el 12 de diciembre de 2016. Consultado el 12 de diciembre de 2016 .
  20. ^ abc "Cambridge Z88 User Guide". 4.0 (4.ª ed.). Cambridge Computer Limited . 1987. Apéndice D. Archivado desde el original el 2016-12-12 . Consultado el 2016-12-12 .
  21. ^ abc "Cambridge Z88 User Guide". 4.7 (4.ª ed.). Cambridge Computer Limited . 2015 [1987]. Apéndice D. Archivado desde el original el 12 de diciembre de 2016. Consultado el 12 de diciembre de 2016 .
  22. ^ Tabla Unicode U+2800, patrones braille
  23. ^ Chung, Jaemin (30 de marzo de 2017). Propuesta para añadir una nota informativa al código U+3164 HANGUL FILLER (PDF) . Consorcio Unicode . UTC L2/17-081.
  24. ^ Hangul Jamo (PDF) . Consorcio Unicode . 2020-10-25.
  25. ^ "ibm-933_P110-1995". Demostración de ICU - Explorador de convertidores . Componentes internacionales para Unicode .
  26. ^ "ibm-933_P110-1995 (bytes iniciales 0E84)". Demostración de ICU - Explorador de convertidores . Componentes internacionales para Unicode .
  27. ^ "Capítulo 6 — Sistemas de escritura y puntuación" (PDF) . El estándar Unicode 15.0, edición electrónica. Consorcio Unicode . 2022-09-13. págs. 12-13 (267-268) . Consultado el 23 de diciembre de 2022 . Los caracteres de espacio de ancho fijo (U+2000..U+200A) se derivan de la tipografía convencional (de plomo caliente). El kerning algorítmico y la justificación en la tipografía computarizada no utilizan estos caracteres. Sin embargo, cuando se utilizan (por ejemplo, en la composición tipográfica de fórmulas matemáticas), su ancho generalmente está especificado por la fuente y, por lo general, no se expanden durante la justificación. La excepción es el espacio fino U+2009, que a veces se ajusta.
  28. ^ El uso de los diferentes tipos de guiones se ilustra, por ejemplo, en The Chicago Manual of Style , §§ 6.80, 6.83–6.86
  29. ^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Sección 6.4, párrafo 3
  30. ^ Fielding, R.; et al. (junio de 1999), "2.2 Reglas básicas", Protocolo de transferencia de hipertexto—HTTP/1.1 , doi :10.17487/RFC2616, RFC 2616 
  31. ^ "3.3.3 Normalización atributo-valor". Lenguaje de marcado extensible (XML) 1.0 (quinta edición) . Consorcio World Wide Web.
  32. ^ "9.1 Espacios en blanco". Especificación W3CHTML 4.01 . Consorcio World Wide Web.
  • Lista de propiedades de la base de datos de caracteres Unicode
Obtenido de "https://es.wikipedia.org/w/index.php?title=Carácter_de_espacio_en_blanco&oldid=1246739973"