Reconocimiento de caracteres de tinta magnética

Character-recognition technology

El código de reconocimiento de caracteres de tinta magnética , conocido en forma abreviada como código MICR , es una tecnología de reconocimiento de caracteres utilizada principalmente por la industria bancaria para agilizar el procesamiento y la compensación de cheques y otros documentos. La codificación MICR, llamada línea MICR , se encuentra en la parte inferior de los cheques y otros comprobantes y, por lo general, incluye el indicador de tipo de documento, el código bancario , el número de cuenta bancaria , el número de cheque, el monto del cheque (que generalmente se agrega después de que se presenta un cheque para el pago) y un indicador de control. El formato del código bancario y el número de cuenta bancaria es específico de cada país.

La tecnología permite a los lectores MICR escanear y leer la información directamente en un dispositivo de recopilación de datos. A diferencia de los códigos de barras y tecnologías similares, los caracteres MICR pueden ser leídos fácilmente por humanos. Los documentos codificados con MICR pueden procesarse mucho más rápido y con mayor precisión que los documentos codificados con OCR convencionales .

Representación estándar anterior a Unicode

La norma ISO 2033 :1983 y la correspondiente norma industrial japonesa JIS X 9010:1984 (originalmente JIS C 6229–1984) definen codificaciones de caracteres para OCR-A , OCR-B y E-13B .

Propagación internacional

Existen dos fuentes MICR principales en uso: E-13B y CMC-7. No existe un acuerdo internacional particular sobre qué países utilizan qué fuente. ^[1] En la práctica, esto no crea problemas particulares ya que los cheques y otros comprobantes no suelen salir de una jurisdicción en particular.

La fuente E-13B ha sido adoptada como estándar internacional en la norma ISO 1004-1:2013, y es el estándar en Australia, Canadá, el Reino Unido, los Estados Unidos, así como en América Central y gran parte de Asia, además de otros países. ^[1]

La fuente CMC-7 ha sido adoptada como estándar internacional en ISO 1004-2:2013 y se utiliza ampliamente en Europa, incluidos Francia e Italia, México y Sudamérica, incluidos Argentina, Brasil, Chile, además de otros países.

Israel es el único país que puede utilizar ambas fuentes simultáneamente, aunque esta práctica hace que el sistema sea significativamente menos eficiente. Esta situación es consecuencia de que los israelíes adoptaron la CMC-7, mientras que los palestinos optaron por la E-13B. ^[1]

Fuentes

E-13B

E-13B es un conjunto de 14 caracteres, que comprende los 10 dígitos decimales y los siguientes símbolos:

⑆ (tránsito: se utiliza para delimitar un código bancario );
⑈ (on-us: se utiliza para delimitar un número de cuenta de cliente);
⑇ (cantidad: se usa para delimitar una cantidad de transacción);
⑉ (Dash: utilizado para delimitar partes de números: EG, números de enrutamiento o números de cuenta).

En las industrias de impresión de cheques y banca, la línea MICR E-13B también se conoce comúnmente como la línea TOAD. Esta referencia proviene de los 4 caracteres: Transit, Onus, Amount y Dash. ^{[ cita requerida ]} En comparación con CMC-7, algunos pares de caracteres E-13B (en particular 2 y 5) pueden producir resultados relativamente similares cuando se escanean magnéticamente; sin embargo, como alternativa si falla la lectura magnética, E-13B también funciona bien con reconocimiento óptico de caracteres . ^[1]

El repertorio E-13B se puede representar en Unicode (ver más abajo). Antes de Unicode, se podía codificar según la norma ISO 2033 :1983, que codifica los dígitos en sus ubicaciones ASCII habituales , tránsito como 0x3A, en us como 0x3C, cantidad como 0x3B y guión como 0x3D. ^[2] Para EBCDIC , la página de códigos IBM 1001 codifica los dígitos en sus ubicaciones EBCDIC habituales, tránsito como 0xDB, en us como 0xEB, cantidad como 0xCB y guión como 0xFB. ^[3]

La página de códigos IBM 1032 amplía la página de códigos 1001 añadiendo codificaciones alternativas para tránsito en 0x5C, 0x7A y 0xC1, sobre nosotros en 0x4C, 0x61 y 0xC3, cantidad en 0x5B, 0x5E y 0xC2 y guión en 0x60, 0x7E y 0xC4, además de un espacio de ancho cero en 0x5A. ^[4] Estas representaciones alternativas se añadieron para la interoperabilidad con las impresoras Siemens y Océ . ^[5]

CMC-7

CMC-7 incluye 10 dígitos numéricos, 26 mayúsculas, ^[6]^[7] y 5 caracteres de control: S I ( interno ), ^{[ Cita necesaria ]} S II ( Terminator ), ^{[ Cita necesaria ]} S III ( Cantidad⁾, ^{[ Cita necesaria}^]^{S IV}⁽ un carácter no utilizado) y S V ( Ruta ).

El CMC-7 tiene un formato de código de barras , en el que cada carácter tiene dos espacios grandes y distintos en diferentes lugares, así como patrones distintos entre ellos, para minimizar cualquier posibilidad de confusión de caracteres durante la lectura magnética; sin embargo, estas barras están demasiado cerca y son demasiado estrechas para ser reconocidas de manera confiable con una resolución de escaneo típica si se recurre al escaneo óptico. El CMC-7 también puede producir escaneos superficialmente exitosos, pero incorrectos, de líneas MICR invertidas. ^[1]

Unicode does not include support for the CMC-7 control symbols. IBM code page 1033 encodes:^[8]

Dígitos y mayúsculas en sus ubicaciones EBCDIC habituales
S I ( interno ) como 0x5E, 0x61 o 0xCB;
S II ( terminador ) como 0x4C, 0x5B o 0xEB;
S III ( cantidad ) como 0x60, 0x7E o 0xFB;
S IV como 0x50, 0x7A o 0xDB;
S V ( enrutamiento ) como 0x5C, 0x6E o 0xBB.

Lector MICR

Los caracteres MICR se imprimen en los documentos en una de las dos fuentes MICR, utilizando tinta o tóner magnetizable (comúnmente conocido como magnético) , que generalmente contiene óxido de hierro . En el escaneo, el documento pasa a través de un lector MICR, que realiza dos funciones: magnetización de la tinta y detección de los caracteres. Los caracteres son leídos por un cabezal lector MICR, un dispositivo similar al cabezal de reproducción de una grabadora de cinta . A medida que cada carácter pasa por el cabezal, produce una forma de onda única que el sistema puede identificar fácilmente.

Los lectores MICR son la herramienta principal para la clasificación de cheques y se utilizan en toda la red de distribución de cheques en múltiples etapas. Por ejemplo, un comerciante utilizará un lector MICR para clasificar los cheques por banco y enviar los cheques clasificados a una cámara de compensación para su redistribución a esos bancos. Al recibirlos, los bancos realizan otra clasificación MICR para determinar la cuenta de qué cliente se cargará y a qué sucursal debe enviarse el cheque en su camino de regreso al cliente. Sin embargo, muchos bancos ya no ofrecen este último paso de devolver el cheque al cliente. En su lugar, los cheques se escanean y almacenan digitalmente. La clasificación de los cheques se realiza según la cobertura geográfica de los bancos en una nación. ^[9]

Unicode

Los caracteres OCR y MICR se han incluido en el estándar Unicode al menos desde la versión 1.1 (junio de 1993). Dado que la base de datos de caracteres Unicode solo rastrea caracteres a partir de la versión 1.1, es posible que también hayan estado presentes en Unicode 1.0 o 1.0.1. ^[10]

El bloque Unicode que incluye caracteres OCR y MICR se denomina Reconocimiento óptico de caracteres y abarca los caracteres U+2440–U+245F. De los caracteres de este bloque, cuatro son de la fuente MICR E-13B:

U+2446 ⑆ Identificación del banco de sucursales de OCR
U+2447 ⑇ OCR MONTO DEL CHEQUE
U+2448 ⑈ OCR DASH (alias corregido MICR ON US SYMBOL )^[11]
U+2449 ⑉ NÚMERO DE CUENTA DE CLIENTE DE OCR (alias corregido SÍMBOLO DE GUIÓN MICR )^[11]

Los nombres de los dos últimos caracteres se cambiaron inadvertidamente cuando se los nombró en la norma ISO/IEC 10646:1993 , ^[12] y se les han asignado nombres precisos como alias formales. ^[11] De acuerdo con la Política de estabilidad de Unicode, los nombres existentes permanecen, lo que permite su uso como identificadores estables. ^[13] Además, los cuatro caracteres tienen alias informativos (no formales) en las tablas Unicode: "transit", "amount", "on us" y "dash" respectivamente.

Antes de Unicode, estos símbolos se codificaban según la codificación ISO-IR-98 definida por la norma ISO 2033 :1983, en la que se los denominaba simplemente SÍMBOLO UNO a SÍMBOLO CUATRO . Se codificaban inmediatamente después de los dígitos, que se codificaban en sus ubicaciones ASCII . ^[2] Aunque la norma ISO 2033 también especifica la codificación para OCR-A y OCR-B , la codificación para E-13B se conoce simplemente como ISO_2033-1983por la IANA . ^[14]

Reconocimiento de caracteres ópticos^[1]^[2] Gráfico oficial del código del consorcio Unicode (PDF)
	0	1	2	3	4	5	6	7	8	9	A	B	do	D	mi	F
U+244x	⑀	⑁	⑂	⑃	⑄	⑅	⑆	⑇	⑈	⑉	⑊
U+245x
Notas 1. ^ AS de Unicode versión 16.0 2. ^ Las áreas grises indican puntos de código no asignados

Historia

Antes de mediados de la década de 1940, los cheques se procesaban manualmente utilizando el método Sort-A-Matic o Top Tab Key. El procesamiento y la compensación de cheques consumían mucho tiempo y suponían un coste significativo en la compensación de cheques y las operaciones bancarias. A medida que aumentaba el número de cheques, se buscaron formas de automatizar el proceso. Se desarrollaron normas para garantizar la uniformidad en las instituciones financieras. A mediados de la década de 1950, el Stanford Research Institute y el Laboratorio de Computación de General Electric ^[15] habían desarrollado el primer sistema automatizado para procesar cheques utilizando MICR. El mismo equipo también desarrolló la fuente MICR E-13B. "E" se refiere a que la fuente es la quinta considerada y "B" al hecho de que era la segunda versión. El "13" se refiere a la cuadrícula de caracteres de 0,013 pulgadas.

La prueba de la fuente MICR E-13B se mostró a la Asociación Bancaria Estadounidense (ABA) en julio de 1956, que la adoptó en 1958 como el estándar MICR para documentos negociables en los Estados Unidos . La ABA adoptó MICR como su estándar porque las máquinas podían leer MICR con precisión y MICR podía imprimirse utilizando la tecnología existente. Además, MICR seguía siendo legible por máquina, incluso a través de sobreestampado, marcado, mutilación y más. Los primeros cheques que usaban MICR se imprimieron a fines de 1959. Aunque el cumplimiento de los estándares MICR era voluntario en los Estados Unidos, había sido adoptado casi universalmente en los Estados Unidos en 1963. ^[16] En 1963, ANSI adoptó la fuente E-13B de la ABA como el estándar estadounidense para la impresión MICR, ^[17] y E-13B también se estandarizó como ISO 1004:1995.

Otros países establecen sus propios estándares, aunque los lectores MICR y la mayoría de los demás equipos fueron fabricados en Estados Unidos. La tecnología MICR se ha adoptado en muchos países, con algunas variaciones. La fuente E-13B se adoptó como estándar en Estados Unidos, Canadá, Reino Unido, Australia y muchos otros países. En Australia, el sistema está gestionado por la Red Australiana de Pagos .

La fuente CMC-7 fue desarrollada en Francia por Groupe Bull en 1957. Fue adoptada como estándar MICR en Argentina, Francia, Italia y algunos otros países europeos.

En la década de 1960, las fuentes MICR se convirtieron en un símbolo de modernidad o futurismo, lo que llevó a la creación de tipos de letra "informáticos" similares que imitaban la apariencia de las fuentes MICR, que a diferencia de las fuentes MICR reales, tenían un conjunto de caracteres completo.

El MICR E-13B también se utiliza para codificar información en otras aplicaciones, como promociones de ventas, cupones, tarjetas de crédito, billetes de avión, recibos de primas de seguros, tickets de depósito y más. El E-13b es la versión desarrollada específicamente para la impresión litográfica offset . Había una versión sutilmente diferente para impresión tipográfica , ^{[ cita requerida ]} llamada E-13a. Además, había un sistema rival llamado 'Fred' (Figure Reading Electronic Device) que utilizaba figuras que parecían más convencionales.

Véase también

Referencias

^ abcde "Batalla de las fuentes MICR: ¿cuál es mejor, E13B o CMC7?". Archivado desde el original el 2020-08-03 . Consultado el 2019-07-16 .
^ ab ISO/TC97/SC2 (1985-08-01). ISO-IR-98: Un conjunto de 14 caracteres gráficos de la fuente E-13B (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
^ "Página de códigos 01001" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015 . Consultado el 19 de octubre de 2021 .
^ "Página de códigos 01032" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015 . Consultado el 19 de octubre de 2021 .
^ "Fuentes para la información 4100 " .
^ "ConnectCode MicR CMC7" (PDF) .
^ Procesamiento de información — Reconocimiento de caracteres de tinta magnética — Parte 2: Especificaciones de impresión para CMC7. ISO . 2013-06-01. ISO 1004-2:2013.(Extracto de vista previa archivado el 24 de noviembre de 2022 en Wayback Machine )
^ " Código Página 01033 " ( PDF ) .
^ "Banco de la Reserva de la India - Publicaciones". rbi.org.in . Archivado desde el original el 2017-09-06 . Consultado el 2017-09-06 .
^ Consorcio Unicode (8 de septiembre de 2019). «Edad derivada». Base de datos de caracteres Unicode: datos de propiedades derivadas . Archivado desde el original el 20 de abril de 2023. Consultado el 10 de julio de 2020 .
^ abc Freytag, Asmus; McGowan, Rick; Whistler, Ken (10 de abril de 2017). Anomalías conocidas en los nombres de caracteres Unicode (4.ª ed.). Consorcio Unicode . Nota técnica Unicode n.º 27. Archivado desde el original el 20 de febrero de 2020. Consultado el 10 de julio de 2020 .
^ ISO/IEC JTC 1/SC 2/WG 2 (3 de enero de 2012). "T.3. Reconocimiento óptico de caracteres". Actas no confirmadas de la reunión 58 del WG 2 (PDF) . pág. 29. SC2 N4188 / WG2 N4103. Archivado (PDF) desde el original el 14 de junio de 2019. Consultado el 10 de julio de 2020 .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
^ "Políticas de estabilidad de codificación de caracteres Unicode". Consorcio Unicode. 23 de junio de 2017. Archivado desde el original el 14 de julio de 2022. Consultado el 10 de julio de 2020 .
^ "Conjuntos de caracteres". IANA. Archivado desde el original el 6 de marzo de 2023. Consultado el 10 de julio de 2020 .
^ "ARTÍCULOS: Reconocimiento de caracteres con tinta magnética" (PDF) . Computers and Automation . 5 (10): 10–16, 44 (12 - Otras sesiones ). Oct 1956. Archivado (PDF) desde el original el 2020-10-03 . Consultado el 2020-09-05 .
^ Mandell, Lewis (mayo de 1977). "Difusión del EFTS entre los bancos nacionales: notas". Journal of Money, Credit and Banking . 9 (2): 341–348. doi :10.2307/1991983. JSTOR 1991983.
^ Estándar ANSI X9.27-1995 y estándar ANSI ANS X9.7-1990.

Enlaces externos

Manual básico de MICR, Troy Group, Inc.
¿Cuál es mejor, E13B o CMC7?
Conjunto de caracteres Mic E13b
Experimento sencillo para detectar tinta magnética en los billetes (en francés)

[dc-1] "Batalla de las fuentes MICR: ¿cuál es mejor, E13B o CMC7?". Archivado desde el original el 2020-08-03 . Consultado el 2019-07-16 .

[iso-ir-98-2] ISO/TC97/SC2 (1985-08-01). ISO-IR-98: Un conjunto de 14 caracteres gráficos de la fuente E-13B (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )

[3] "Página de códigos 01001" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015 . Consultado el 19 de octubre de 2021 .

[4] "Página de códigos 01032" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015 . Consultado el 19 de octubre de 2021 .

[5] "Fuentes para la información 4100 " .

[6] "ConnectCode MicR CMC7" (PDF) .

[isocmc7-7] Procesamiento de información — Reconocimiento de caracteres de tinta magnética — Parte 2: Especificaciones de impresión para CMC7. ISO . 2013-06-01. ISO 1004-2:2013.(Extracto de vista previa archivado el 24 de noviembre de 2022 en Wayback Machine )

[8] " Código Página 01033 " ( PDF ) .

[9] "Banco de la Reserva de la India - Publicaciones". rbi.org.in . Archivado desde el original el 2017-09-06 . Consultado el 2017-09-06 .

[10] Consorcio Unicode (8 de septiembre de 2019). «Edad derivada». Base de datos de caracteres Unicode: datos de propiedades derivadas . Archivado desde el original el 20 de abril de 2023. Consultado el 10 de julio de 2020 .

[misnomers-11] Freytag, Asmus; McGowan, Rick; Whistler, Ken (10 de abril de 2017). Anomalías conocidas en los nombres de caracteres Unicode (4.ª ed.). Consorcio Unicode . Nota técnica Unicode n.º 27. Archivado desde el original el 20 de febrero de 2020. Consultado el 10 de julio de 2020 .

[12] ISO/IEC JTC 1/SC 2/WG 2 (3 de enero de 2012). "T.3. Reconocimiento óptico de caracteres". Actas no confirmadas de la reunión 58 del WG 2 (PDF) . pág. 29. SC2 N4188 / WG2 N4103. Archivado (PDF) desde el original el 14 de junio de 2019. Consultado el 10 de julio de 2020 .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )

[13] "Políticas de estabilidad de codificación de caracteres Unicode". Consorcio Unicode. 23 de junio de 2017. Archivado desde el original el 14 de julio de 2022. Consultado el 10 de julio de 2020 .

[iana-14] "Conjuntos de caracteres". IANA. Archivado desde el original el 6 de marzo de 2023. Consultado el 10 de julio de 2020 .

[15] "ARTÍCULOS: Reconocimiento de caracteres con tinta magnética" (PDF) . Computers and Automation . 5 (10): 10–16, 44 (12 - Otras sesiones ). Oct 1956. Archivado (PDF) desde el original el 2020-10-03 . Consultado el 2020-09-05 .

[16] Mandell, Lewis (mayo de 1977). "Difusión del EFTS entre los bancos nacionales: notas". Journal of Money, Credit and Banking . 9 (2): 341–348. doi :10.2307/1991983. JSTOR 1991983.

[17] Estándar ANSI X9.27-1995 y estándar ANSI ANS X9.7-1990.