La digitalización de periódicos es el proceso de convertir periódicos antiguos de formato analógico a imágenes digitales. Los formatos analógicos más comunes para periódicos antiguos son el papel y el microfilm. Las imágenes digitalizadas de páginas de periódicos se analizan normalmente (aunque no siempre) con software de OCR para producir archivos de texto del contenido del periódico. La digitalización de periódicos es un caso especial de digitalización en general.
Los periódicos conservan un rico registro del pasado y, desde la llegada de los medios digitales, muchas instituciones de todo el mundo han comenzado a digitalizarlos y a poner a disposición del público los archivos digitales. Sin embargo, en 2015, más del 90 % de los periódicos seguían sin escanearse. [1] Los periódicos digitalizados pueden ponerse a disposición de forma gratuita o a cambio de una tarifa. Varias listas (que se indican a continuación) intentan catalogar los periódicos digitalizados de todo el mundo.
El escaneo exitoso de periódicos es una actividad compleja. Si bien es posible escanear desde papel, el escaneo en microfilm es más económico y se ha dicho que un buen microfilm es “el factor más crítico para el éxito de la digitalización de periódicos” [2] . El análisis OCR de páginas escaneadas presenta una serie de desafíos técnicos y el texto de periódicos antiguos suele ser difícil de leer, lo que introduce errores y complica la búsqueda. Adjuntar metadatos a las imágenes para que sean más fáciles de encontrar es otro paso importante. Por último, deben desarrollarse interfaces de búsqueda. Varias empresas se especializan en el escaneo de periódicos y algunas producen software especialmente diseñado para el proceso.
El coste de almacenar periódicos impresos y la demanda relativamente baja de originales después de microfilmarlos y escanearlos significa que los periódicos impresos, una vez microfilmados o escaneados, a menudo se desechan. Algunas personas sienten que esto es una pérdida para los investigadores, o simplemente que hay una emoción cuando desaparece la experiencia de leer el papel. El autor Nicholson Baker llegó al extremo de crear un archivo de periódicos en papel, al que llamó American Newspaper Repository , para preservar los periódicos en papel que de otro modo serían descartados.
Es posible que los periódicos más recientes hayan "nacido digitales", lo que significa que se imprimieron a partir de archivos de computadora en lugar de hacerlo mediante impresión tipográfica o fotocomposición. [ cita requerida ] Se pueden archivar almacenando los archivos digitales del editor de cada imagen de página en lugar de escanear las páginas.