Ventanas-1251

Conjunto de caracteres de Windows para el alfabeto cirílico
Ventanas-1251
MIME / IANAventanas-1251
Alias(es)cp1251 ( página de código 1251)
Idioma(s)Ruso , ucraniano , bielorruso , búlgaro , cirílico serbio , cirílico bosnio , macedonio , rotokas , rusino , inglés
Creado porMicrosoft
EstándarEstándar de codificación WHATWG
ClasificaciónASCII extendido , Windows-125x
Otras codificaciones relacionadasAmiga-1251, KZ-1048,
RFC 1345, "ECMA-Cyrillic"

Windows-1251 es una codificación de caracteres de 8 bits , diseñada para cubrir idiomas que utilizan el alfabeto cirílico , como el ruso , el ucraniano , el bielorruso , el búlgaro , el cirílico serbio , el macedonio y otros idiomas.

En la web, es la segunda codificación de caracteres de un solo byte más utilizada (o la tercera codificación de caracteres más utilizada en general) y la más utilizada de las codificaciones de un solo byte que admiten el cirílico. A enero de 2024 [actualizar], el 0,3% de todos los sitios web utilizan Windows-1251. [1] [2] Se utiliza principalmente para el ruso, mientras que una pequeña minoría de sitios web rusos lo utilizan, con el 94,6% de los sitios web rusos (.ru) que utilizan UTF-8 , [3] [4] [5] y la codificación heredada de 8 bits ocupa el segundo lugar. En Linux, la codificación se conoce como cp1251. [6] IBM utiliza la página de códigos 1251 ( CCSID 1251 y CCSID extendido del signo del euro 5347) para Windows-1251. [7] [8] [9] [10] [11] [12] [13]

Windows-1251 y KOI8-R (o su variante ucraniana KOI8-U ) se utilizan mucho más comúnmente que ISO 8859-5 (que se utiliza en menos del 0,0004 % de los sitios web). [14] A diferencia de Windows-1252 e ISO 8859-1 , Windows-1251 no está estrechamente relacionado con ISO 8859-5.

En las aplicaciones modernas, especialmente en Internet, se prefiere Unicode (por ejemplo, UTF-8) a Windows-1251 u otras codificaciones cirílicas, lo que convierte a UTF-8 en la codificación dominante para páginas web. (Para obtener más información sobre la cobertura completa de Unicode, de 436 letras/puntos de código cirílicos, incluido el cirílico antiguo , y sobre cómo las codificaciones de caracteres de un solo byte, como Windows-1251 y KOI8-R , no pueden proporcionar esto, consulte Escritura cirílica en Unicode ).

Conjunto de caracteres

La siguiente tabla muestra Windows-1251. Cada carácter se muestra con su equivalente Unicode y su código Alt .

Ventanas-1251 [15]
0123456789ABdoDmiF
0xNuloSOLTxETXETEENQAcuse de reciboBELLicenciatura en CienciasaltaSiVermontFFESENTONCESSI
1xDLEDC1DC2DC3DC4No se puedeSINÓNIMOETBPODEREnSUBESCEsGSR.R.A NOSOTROS
2x ES !"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABdoDmiFGRAMOyoIYoKyoMETROnorteOh
5xPAGQRSyoVYoincógnitaYO[\]^_
6x`abdodmiFgramoyoiyoayometronorteo
7xpagqasaenelincógnitayel{|}~DEL
8xEnA"es"yoYoYoYoYo
9xђ''""yoyoyoћџ
HachaPNBSPYoўYo¤Ґ¦§Yo©Es«¬TÍMIDO®Yo
Bx°±Yoyoґµ·yoNo.є»yoYoesї
CxUnaBEnGDYYZYoYoKElMNoAcerca deP
DxRCTYoFXCCYoYoYoYoBYoYoYo
Exunaaenendyoyodesdeyyoparaelyoenop
Fxpconesyofxcyoyoyoyoyoyoyoyoyo
  Diferencias con Windows-1252

Variantes kazajas

En Kazajstán se estandarizó una versión modificada de Windows-1251 , denominada STRK1048, y se la conoce con la etiqueta KZ-1048. Se diferencia en las filas que se muestran a continuación:

KZ-1048 (STRK1048-2002) [16]
0123456789ABdoDmiF
8xEnA"es"yoYoҺYo
9xђ''""yoyoһџ
HachaPNBSPҰұ͘¤ͨ¦§Yo©Ғ«¬TÍMIDO®
Bx°±YoyoÑoµ·yoNo.ғ»øҢң
  Diferencias con Windows-1251

La página de códigos 1174 es otra variante creada para el idioma kazajo , que coincide con la versión 1251 de Windows para el subconjunto ruso de las letras cirílicas. Se diferencia de la versión 1048 de KZ porque traslada la letra cirílica Shha de 8E/9E a 8A/9A.

Página de código 1174 [17]
0123456789ABdoDmiF
8xEnA"es"ҺYoYoYo
9xђ''""һyoћџ
HachaPNBSPҰұ͘¤ͨ¦§Yo©Ғ«¬TÍMIDO®
Bx°±YoyoÑoµ·yoNo.ғ»øҢң
  Diferente de Windows-1251

Variante de Amiga

Amiga-1251
MIME / IANAAmiga-1251
Alias(es)Amigo1251
Idioma(s)Inglés , ruso
ClasificaciónASCII extendido
Residencia enWindows-1251, ISO-8859-1 , ISO-8859-15

Los sistemas operativos rusos Amiga utilizan una versión de la página de códigos 1251 que coincide con la de Windows 1251 para el subconjunto ruso de las letras cirílicas, pero que por lo demás sigue en su mayor parte la norma ISO-8859-1 . Esta versión se conoce como Amiga-1251 , [18] bajo cuyo nombre está registrada en la IANA . [19]

Amiga-1251 [18]
0123456789ABdoDmiF
8xXXXXXXHiperplasia prostática benigna (HPB)Nueva BAHÍAINDIANANoSSAESAAltos nivelesHTJVTSPartido Liberal DemocráticoMásRhode IslandSS2SS3
9xDCSPU1PU2Sistema de transmisión de señales (STS)CCHhombreSPAAgencia de Protección AmbientalLLAMADA DE SOCORROXXXLECTURA SCICSICALLECSCP.MVehículo blindado
HachaPNBSP¡¢£[a]¥¦§Yo©[b]«¬TÍMIDO®¯
Bx°±²³"µ·yo¹º»¼½¾¿
  Diferente de Windows-1251 para que coincida con ISO-8859-1
  Diferente tanto de Windows-1251 como de ISO-8859-1
  1. ^ Coincide con ISO-8859-15 ; en una ubicación diferente a la de Windows-1251
  2. ^ Presente en Windows-1251, pero en una ubicación diferente (ausente en ISO-8859-1/15)

Referencias

Véase también

Referencias

  1. ^ "Tendencias históricas en el uso de codificaciones de caracteres, enero de 2024" . Consultado el 1 de enero de 2024 .
  2. ^ "Preguntas frecuentes".
  3. ^ "Distribución de codificaciones de caracteres entre sitios web que utilizan .ru". w3techs.com . Consultado el 1 de enero de 2024 .
  4. ^ "Distribución de codificaciones de caracteres entre sitios web que utilizan el ruso". w3techs.com . Consultado el 16 de enero de 2023 .
  5. ^ "Distribución de codificaciones de caracteres entre sitios web que utilizan la Federación Rusa". w3techs.com . Consultado el 5 de noviembre de 2021 .
  6. ^ "cp1251(7) - Página del manual de Linux". man7.org . Consultado el 1 de julio de 2018 .
  7. ^ "Documento informativo de la página de códigos 1251". Archivado desde el original el 3 de marzo de 2016.
  8. ^ "Documento informativo del CCSID 1251". Archivado desde el original el 29 de noviembre de 2014.
  9. ^ "Documento informativo del CCSID 5347". Archivado desde el original el 29 de noviembre de 2014.
  10. ^ Página de códigos CPGID 01251 (pdf) (PDF) , IBM
  11. ^ Página de códigos CPGID 01251 (txt), IBM
  12. ^ Componentes internacionales para Unicode (ICU), ibm-1251_P100-1995.ucm, 3 de diciembre de 2002
  13. ^ Componentes internacionales para Unicode (ICU), ibm-5347_P100-1998.ucm, 3 de diciembre de 2002
  14. ^ "Estadísticas de uso de codificaciones de caracteres para sitios web". w3techs.com . Archivado desde el original el 30 de mayo de 2012.
  15. ^ Steele, Shawn (1998). Tabla de conversión de CP1251 a Unicode. Consorcio Unicode . CP1251.TXT.
  16. ^ Whistler, Ken (2007). KZ-1048 a Unicode. Consorcio Unicode . KZ1048.TXT.
  17. ^ ibm-1174_X100-2007.ucm, IBM
  18. ^ ab Malyshev, Michael (2003). "Tabla de Amiga-1251 a Unicode". Registro de un nuevo conjunto de caracteres [Amiga-1251]. IANA.
  19. ^ "Conjuntos de caracteres". IANA.

Lectura adicional

  • Kornai, András; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; cazador, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre CODIFICACIÓN CIRÍLICA Versión 1.3" . Consultado el 24 de junio de 2020 .
  • Cuadro de referencia de Windows 1251
  • Registro de nombres de conjuntos de caracteres de la IANA
  • Asignaciones Unicode de Windows 1251 con "mejor ajuste"
  • Descodificador cirílico universal, un programa en línea que puede ayudar a recuperar textos cirílicos ilegibles con codificaciones de caracteres rotas de Windows-1251 u otras .
Obtenido de "https://es.wikipedia.org/w/index.php?title=Windows-1251&oldid=1242296945"