Reconocimiento óptico de marcas

Captura de datos marcados por humanos a partir de formularios de documentos

El reconocimiento óptico de marcas ( OMR ) recopila datos de personas mediante la identificación de marcas en un papel . El OMR permite procesar cientos o incluso miles de documentos cada hora. Una aplicación común de esta tecnología se utiliza en exámenes, donde los estudiantes marcan celdas como sus respuestas. Esto permite una calificación automatizada muy rápida de las hojas de examen.

Fondo

Formulario de pruebas OMR, con marcas de registro y colores omitidos, diseñado para ser escaneado por un dispositivo OMR dedicado

Muchos dispositivos OMR tienen un escáner que proyecta una luz sobre un formulario. El dispositivo observa la reflectividad contrastante de la luz en ciertas posiciones del formulario. Detectará las marcas negras porque reflejan menos luz que las áreas en blanco del formulario.

Algunos dispositivos OMR utilizan formularios impresos en papel transóptico. El dispositivo puede medir la cantidad de luz que pasa a través del papel. Detectará cualquier marca negra en ambos lados del papel porque reducen la cantidad de luz que pasa a través de él.

A diferencia del dispositivo OMR dedicado, el software OMR de escritorio permite al usuario crear sus propios formularios en un procesador de textos o en una computadora e imprimirlos en una impresora láser . El software OMR luego funciona con un escáner de imágenes de escritorio común con un alimentador de documentos para procesar los formularios una vez completados.

El OMR se distingue generalmente del reconocimiento óptico de caracteres (OCR) por el hecho de que no se requiere un motor de reconocimiento de patrones complicado . Es decir, las marcas se construyen de tal manera que hay pocas posibilidades de que el dispositivo OMR no las lea correctamente. Esto requiere que la imagen tenga un alto contraste y una forma fácilmente reconocible o irrelevante. Un campo relacionado con el OMR y el OCR es el reconocimiento de códigos de barras , como el código de barras UPC que se encuentra en los envases de los productos.

Una de las aplicaciones más conocidas de OMR es el uso de hojas de respuestas ópticas con burbujas y lápiz n.° 2 (HB en Europa) en exámenes con preguntas de opción múltiple . Los estudiantes marcan sus respuestas u otra información personal oscureciendo círculos en un formulario. Luego, la hoja se califica mediante una máquina de escaneo.

  • En los Estados Unidos y la mayoría de los países europeos , el tipo de formato OMR más comúnmente utilizado es una "marca" horizontal o vertical en un "rombo" rectangular;
  • El formato más conocido en el Reino Unido es el de la lotería nacional del Reino Unido. [ cita requerida ]

Las marcas en rombos representan una tecnología posterior que es más fácil de marcar y borrar. Las marcas de "burbujas" grandes son una tecnología heredada de las primeras máquinas OMR que eran tan insensibles que se requería una marca grande para que fueran confiables. En la mayoría de los países asiáticos, se utiliza un marcador especial para completar una hoja de respuestas ópticas . Los estudiantes, de la misma manera, marcan las respuestas u otra información oscureciendo los círculos marcados en una hoja preimpresa. Luego, la hoja se califica automáticamente mediante una máquina de escaneo.

Muchas de las aplicaciones actuales de OMR implican que las personas rellenen formularios especializados. Estos formularios están optimizados para escanearlos por ordenador, con un registro cuidadoso en la impresión y un diseño cuidadoso para reducir la ambigüedad al mínimo posible. Debido a su tasa de error extremadamente baja, su bajo coste y su facilidad de uso, OMR es un método popular para el recuento de votos. [1] [2] [3] [4] [5] [6] [7] [8] [9] [10]

Las marcas OMR también se añaden a los envíos de correo impreso para que se puedan utilizar equipos de inserción en plegadora. Las marcas se añaden a cada página (normalmente opuesta/impares) de un documento de correo y consisten en una secuencia de rayas negras que el equipo de inserción en plegadora escanea para determinar cuándo se debe doblar el correo y luego insertarlo en un sobre .

Hoja de respuestas de óptica

Una respuesta a una pregunta de matemáticas del SAT marcada en una hoja de respuestas óptica

Una hoja de respuestas ópticas o hoja de respuestas de burbuja es un tipo especial de formulario que se utiliza en exámenes con preguntas de opción múltiple. El OMR se utiliza para detectar las respuestas. Scantron Corporation crea muchas hojas de respuestas ópticas, aunque ciertos usos requieren su propio sistema personalizado. [ cita requerida ]

Las hojas de respuestas ópticas suelen tener un conjunto de óvalos o casillas en blanco que corresponden a cada pregunta, a menudo en hojas de papel separadas. Los códigos de barras pueden marcar la hoja para el procesamiento automático, y cada serie de óvalos llenos devolverá un valor determinado al leerse. De esta manera, las respuestas de los estudiantes pueden registrarse digitalmente o se puede proporcionar la identidad.

Lectura

Las primeras hojas de respuestas ópticas se leían haciendo pasar una luz a través de la hoja y midiendo qué cantidad de luz se bloqueaba utilizando fototubos en el lado opuesto. [11] Como algunos fototubos son principalmente sensibles al extremo azul del espectro visible , [12] no se podían utilizar bolígrafos azules, ya que las tintas azules reflejan y transmiten luz azul. Debido a esto, se tuvieron que utilizar lápices del número dos para rellenar las burbujas: el grafito es una sustancia muy opaca que absorbe o refleja la mayor parte de la luz que llega a él. [11]

Las hojas de respuestas ópticas modernas se leen en función de la luz reflejada, midiendo la claridad y la oscuridad. No es necesario rellenarlas con un lápiz del número dos, aunque se recomiendan en lugar de otros tipos (esto se debe a que los lápices de números más altos dejan marcas más claras y las manchas de los lápices del número 1). Se leerá la tinta negra, aunque muchos sistemas ignorarán las marcas que sean del mismo color en el que está impreso el formulario. [11] Esto también permite que las hojas de respuestas ópticas sean de doble cara porque las marcas hechas en el lado opuesto no interferirán con las lecturas de reflectancia tanto como con las lecturas de opacidad.

La mayoría de los sistemas tienen en cuenta el error humano al rellenar óvalos de forma imprecisa: siempre que no se desvíen hacia otros óvalos y el óvalo esté casi lleno, el escáner lo detectará como lleno.

Diseño e impresión

Existen dimensiones específicas para el diseño de láminas OMR con una precisión de 0,05 mm en la escala. Si las dimensiones no están a la altura de la escala de precisión, la precisión de la lámina OMR puede variar, por lo que la lámina debe diseñarse, imprimirse y cortarse a la perfección.

  • Parte única: las hojas se imprimen en papel de 105 g/m² a 120 g/m² en hojas A4/Legal.
  • Doble hoja (sin papel carbón): se imprimen dos hojas, una en papel de 105 g/m² y otra en papel de 60-70 g/m² en hojas A4. La parte inferior de la primera hoja y la parte superior de la segunda hoja se tratan químicamente para que la impresión de la primera hoja aparezca en la segunda.
  • Tres partes (sin papel carbón): se imprimen tres hojas en una de papel de 105 g/m² y las otras dos en papel de 60-70 g/m² en hojas A4. La parte inferior de la primera hoja, la parte superior e inferior de la segunda hoja y la parte superior de la tercera hoja se tratan químicamente para que la impresión de la primera hoja aparezca en la segunda y la tercera.

Errores

Es posible que las hojas de respuestas ópticas se impriman incorrectamente, de modo que todos los óvalos se lean como llenos. Esto ocurre si el contorno de los óvalos es demasiado grueso o irregular. Durante las elecciones presidenciales de Estados Unidos de 2008 , esto ocurrió con más de 19.000 papeletas de voto por correo en el condado de Gwinnett , en Georgia , y se descubrió después de que ya se habían devuelto unas 10.000. La ligera diferencia no era evidente a simple vista y no se detectó hasta que se realizó una prueba a finales de octubre. Esto requirió que todas las papeletas fueran transferidas a las correctamente impresas, por trabajadores secuestrados de la junta electoral , bajo la estrecha observación de miembros de los partidos políticos demócrata y republicano (pero no de otros ), y de los agentes del sheriff del condado . La transferencia, por ley, no podía ocurrir hasta el día de las elecciones (4 de noviembre). [ cita requerida ]

Software OMR

Formulario de encuesta OMR en papel simple, sin marcas de registro ni omisiones de colores, diseñado para ser escaneado por un escáner de imágenes y software OMR

El software OMR es una aplicación de software de computadora que hace posible la OMR en una computadora de escritorio mediante el uso de un escáner de imágenes para procesar encuestas, pruebas, hojas de asistencia, listas de verificación y otros formularios en papel normal impresos en una impresora láser.

El software OMR se utiliza para capturar datos de las hojas OMR. Si bien los dispositivos de escaneo para la captura de datos se centran en muchos factores, como el grosor del papel, las dimensiones de la hoja OMR y el patrón de diseño.

Software OMR comercial

Uno de los primeros paquetes de software OMR que utilizaba imágenes de escáneres de imágenes comunes fue Remark Office OMR, fabricado por Gravic, Inc. (originalmente llamada Principia Products, Inc.). Remark Office OMR 1.0 se lanzó en 1991.

La necesidad de software OMR surgió porque los primeros sistemas de reconocimiento óptico de marcas utilizaban escáneres dedicados y formularios preimpresos especiales con colores omitidos y marcas de registro. Dichos formularios suelen costar entre 0,10 y 0,19 dólares por página. [13] En cambio, los usuarios de software OMR diseñan sus propios formularios de reconocimiento de marcas con un procesador de textos o un editor de formularios integrado, los imprimen localmente en una impresora y pueden ahorrar miles de dólares en grandes cantidades de formularios. [14]

Desde finales de los años 80, muchas empresas de procesamiento de formularios (captura de transacciones por lotes) han ofrecido la posibilidad de identificar marcas ópticas dentro de un formulario, como las que se utilizan para procesar formularios del censo . En su mayoría, esto se basa en una imagen bitonal y un recuento de píxeles con recuentos de píxeles mínimos y máximos para eliminar marcas extrañas, como las que se borran con un borrador sucio y que, al convertirse en una imagen en blanco y negro (bitonal), pueden parecer una marca legítima. Por lo tanto, este método puede causar problemas cuando un usuario cambia de opinión, por lo que algunos productos comenzaron a utilizar la escala de grises para identificar mejor la intención del marcador; internamente, los escáneres Scantron y NCS utilizaban la escala de grises .

El software OMR también se utiliza para agregar marcas OMR a los documentos de correo para que puedan ser escaneados por equipos de inserción de carpetas. Un ejemplo de software OMR es Mail Markup del desarrollador británico Funasset Limited. Este software permite al usuario configurar y seleccionar una secuencia OMR y luego aplicar las marcas OMR a los documentos de correo antes de imprimirlos.

Historia

El reconocimiento óptico de marcas (OMR) es el escaneo de papel para detectar la presencia o ausencia de una marca en una posición predeterminada. [4] El reconocimiento óptico de marcas ha evolucionado a partir de varias otras tecnologías. A principios del siglo XIX y del siglo XX se otorgaron patentes para máquinas que ayudarían a los ciegos. [2]

En la actualidad, el OMR se utiliza como dispositivo de entrada para la entrada de datos. Dos de las primeras formas de OMR son la cinta de papel y las tarjetas perforadas , que utilizan agujeros reales perforados en el medio en lugar de círculos rellenos con lápiz sobre el medio. La cinta de papel se utilizó ya en 1857 como dispositivo de entrada para el telégrafo. [10] Las tarjetas perforadas se crearon en 1890 y se utilizaron como dispositivos de entrada para ordenadores. El uso de tarjetas perforadas disminuyó considerablemente a principios de la década de 1970 con la introducción de los ordenadores personales. [8] Con el OMR moderno, donde se reconoce la presencia de una burbuja rellena con lápiz, el reconocimiento se realiza a través de un escáner óptico.

El primer escáner de detección de marcas fue la máquina de puntuación de pruebas IBM 805 ; esta leía las marcas detectando la conductividad eléctrica de la mina de grafito del lápiz utilizando pares de cepillos de alambre que escaneaban la página. En la década de 1930, Richard Warren en IBM experimentó con sistemas de detección de marcas ópticas para la puntuación de pruebas, como se documenta en las patentes estadounidenses 2.150.256 (presentada en 1932, concedida en 1939) y 2.010.653 (presentada en 1933, concedida en 1935). El primer escáner de detección de marcas ópticas exitoso fue desarrollado por Everett Franklin Lindquist , como se documenta en la patente estadounidense 3.050.248 (presentada en 1955, concedida en 1962). Lindquist había desarrollado numerosas pruebas educativas estandarizadas y necesitaba una máquina de puntuación de pruebas mejor que el IBM 805, el estándar de ese momento. Los derechos de las patentes de Lindquist estuvieron en manos del Measurement Research Center hasta 1968, cuando la Universidad de Iowa vendió la operación a Westinghouse Corporation .

Durante el mismo período, IBM también desarrolló una exitosa máquina de calificación de pruebas con detección óptica de marcas, como se documenta en la patente estadounidense 2.944.734 (presentada en 1957, otorgada en 1960). IBM la comercializó como el lector de calificación de marcas ópticas IBM 1230 en 1962. Esta y una variedad de máquinas relacionadas permitieron a IBM migrar una amplia variedad de aplicaciones desarrolladas para sus máquinas de detección de marcas a la nueva tecnología óptica. Estas aplicaciones incluían una variedad de formularios de gestión de inventario y de notificación de problemas, la mayoría de los cuales tenían las dimensiones de una tarjeta perforada estándar .

Mientras que los demás actores del sector de las pruebas educativas se centraban en la venta de servicios de escaneo, Scantron Corporation, fundada en 1972, [15] tenía un modelo diferente: distribuía escáneres económicos a las escuelas y obtenía beneficios de la venta de los formularios de prueba. Como resultado, mucha gente empezó a pensar en todos los formularios de lectura por puntos (ya fueran de lectura óptica o no) como formularios de Scantron .

En 1983, Westinghouse Learning Corporation fue adquirida por National Computer Systems (NCS). En 2000, NCS fue adquirida por Pearson Education , donde la tecnología OMR formó el núcleo del grupo de Gestión de Datos de Pearson. En febrero de 2008, M&F Worldwide compró el grupo de Gestión de Datos de Pearson; el grupo ahora es parte de la marca Scantron. [16]

El OMR se ha utilizado en muchas situaciones, como se menciona a continuación. El uso del OMR en sistemas de inventario fue una transición entre las tarjetas perforadas y los códigos de barras y no se utiliza tanto para este propósito. [8] Sin embargo, el OMR todavía se utiliza ampliamente para encuestas y pruebas.

Uso

El uso de OMR no se limita a las escuelas o agencias de recopilación de datos ; muchas empresas y agencias de atención médica utilizan OMR para agilizar sus procesos de ingreso de datos y reducir los errores de ingreso. Las tecnologías OMR, OCR e ICR brindan un medio para recopilar datos de formularios en papel. La OMR también se puede realizar utilizando un escáner OMR (cabezal de lectura discreto) o un escáner de imágenes. [17]

Aplicaciones

Formulario de apuestas OMR utilizado en el hipódromo de Fukushima de la Asociación de Carreras de Japón , Japón.
Boleto de apuestas utilizando este formulario.

Existen muchas otras aplicaciones para OMR, por ejemplo:

Tipos de campos

OMR tiene diferentes campos para proporcionar el formato que desea el consultante. Estos campos incluyen:

  • Múltiple, donde hay varias opciones pero solo se elige una. Por ejemplo, el formulario podría pedir una de las opciones ABCDE; 12345; completamente en desacuerdo, en desacuerdo, indiferente, de acuerdo, completamente de acuerdo; o similares.
  • Cuadrícula: las burbujas o líneas se configuran en un formato de cuadrícula para que el usuario complete un número de teléfono, nombre, número de identificación, etc.
  • Sumar, totalizar las respuestas a un único valor
  • Booleano , respondiendo sí o no a todas las opciones que correspondan
  • Binario, responder sí o no a una sola pregunta
  • Los campos de líneas punteadas, desarrollados por Smartshoot OMR, permiten eliminar bordes como el método tradicional de eliminación de color. [ aclaración necesaria ]

Capacidades/requisitos

En el pasado y en la actualidad, algunos sistemas OMR requieren papel especial, tinta especial y un lector de entrada especial (Bergeron, 1998). Esto restringe los tipos de preguntas que se pueden hacer y no permite mucha variabilidad cuando se ingresa la información en el formulario. Los avances en OMR ahora permiten a los usuarios crear e imprimir sus propios formularios y usar un escáner (preferiblemente con un alimentador de documentos) para leer la información. [18] El usuario puede organizar las preguntas en un formato que se adapte a sus necesidades y al mismo tiempo poder ingresar los datos fácilmente. [19] Los sistemas OMR se acercan al cien por ciento de precisión y solo tardan 5 milisegundos en promedio en reconocer las marcas. [18] Los usuarios pueden usar cuadrados, círculos, elipses y hexágonos para la zona de marca. Luego, el software se puede configurar para que reconozca burbujas rellenas, cruces o marcas de verificación.

El OMR también se puede utilizar para uso personal. Existen en el mercado impresoras multifunción que imprimen las fotografías que el usuario selecciona rellenando los cuadros de selección de tamaño y papel en una hoja de índice que ya ha sido impresa. Una vez rellenada la hoja, el usuario coloca la hoja en el escáner para escanearla y la impresora imprimirá las fotografías según las marcas que se le hayan indicado. [ cita requerida ]

Desventajas

El OMR también tiene algunas desventajas y limitaciones. Si el usuario desea recopilar grandes cantidades de texto, el OMR complica la recopilación de datos. [20] También existe la posibilidad de que falten datos en el proceso de escaneo, y las páginas incorrectamente numeradas o sin numerar pueden hacer que se escaneen en el orden incorrecto. Además, a menos que se implementen medidas de seguridad, una página podría volver a escanearse, lo que generaría datos duplicados y distorsionaría los datos. [18]

Como resultado de la adopción generalizada y la facilidad de uso de OMR, los exámenes estandarizados pueden consistir principalmente en preguntas de opción múltiple, lo que cambia la naturaleza de lo que se está evaluando.

Véase también

Liza

Referencias

  1. ^ "Reconocimiento óptico de marcas". Archivado desde el original el 13 de junio de 2006 . Consultado el 13 de junio de 2006 .
  2. ^ ab Investigación sobre reconocimiento óptico de caracteres | Biblioteca científica Macmillan: Ciencias de la computación. Bookrags.com. 2010-11-02 . Consultado el 2015-07-03 .
  3. ^ "Sistemas de escaneo óptico —". Aceproject.org . Consultado el 3 de julio de 2015 .
  4. ^ ab Haag, S., Cummings, M., McCubbrey, D., Pinsonnault, A., Donovan, R. (2006). Sistemas de información gerencial para la era de la información (3.ª ed.). Canadá: McGraw-Hill Ryerson.
  5. ^ "Libraria de estadísticos: uso de escáneres y software OMR para la introducción de datos a bajo costo". Archivado desde el original el 10 de noviembre de 2005. Consultado el 13 de junio de 2006 .
  6. ^ "Recopilación de datos a bajo costo". Julio de 2015. Archivado desde el original (PPT) el 22 de julio de 2015. Consultado el 21 de julio de 2015 .
  7. ^ "Remark Office OMR, de Gravic (Principia Products), funciona con los escáneres de imágenes más populares para escanear encuestas, exámenes y otros formularios en papel normal". Omrsolutions.com . Consultado el 3 de julio de 2015 .
  8. ^ abc Palmer, Roger C. (1989, septiembre) Los fundamentos de la identificación automática [versión electrónica]. Canadian Datasystems, 21 (9), 30-33
  9. ^ "Tecnología de procesamiento de formularios". Tkvision.com. Archivado desde el original el 2008-05-11 . Consultado el 2015-07-03 .
  10. ^ Dispositivos de entrada de investigación | Biblioteca científica Macmillan: Ciencias de la computación. Bookrags.com. 2010-11-02 . Consultado el 2015-07-03 .
  11. ^ abc Bloomfield, Louis A (29 de mayo de 2006). "Pregunta 1529: ¿Por qué las pruebas tipo scantron solo leen lápices n.° 2? ¿Pueden funcionar otros lápices?". HowEverythingWorks.org.
  12. ^ Manual técnico de Mullard, volumen 4, sección 4: células fotoemisoras (edición de 1960)
  13. ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 20 de marzo de 2009. Consultado el 12 de marzo de 2009 .{{cite web}}: CS1 maint: archived copy as title (link)
  14. ^ Michael Wagenheim. "Calificación de exámenes de biología en una gran universidad estatal". RemarkSoftware.com . Consultado el 21 de julio de 2015 .
  15. ^ "El mercado de las pruebas educativas". Bc.edu . Consultado el 3 de julio de 2015 .
  16. ^ "NCS Pearson, Inc". Archivado desde el original el 14 de junio de 2010. Consultado el 14 de junio de 2010 .
  17. ^ http://datamanagement.scantron.com/pdf/icr-ocr-omr.pdf [ enlace roto ]
  18. ^ abc Bergeron, [ ¿quién? ]
  19. ^ LoPresti, 1996 [ ¿quién? ]
  20. ^ Green, 2000 [ ¿quién? ]
Retrieved from "https://en.wikipedia.org/w/index.php?title=Optical_mark_recognition&oldid=1248121598"