This article needs additional citations for verification. (March 2009) |
El Proyecto del Millón de Libros (o la Biblioteca Universal ) fue un proyecto de digitalización de libros dirigido por la Facultad de Informática y las Bibliotecas Universitarias de la Universidad Carnegie Mellon [1] entre 2007 y 2008. En colaboración con el gobierno y socios de investigación de la India ( Biblioteca Digital de la India ) y China , el proyecto escaneó libros en muchos idiomas, utilizando OCR para permitir la búsqueda de texto completo y proporcionando acceso gratuito a los libros en la web. En 2007 [update], completaron el escaneo de 1 millón de libros y hicieron que todo el catálogo sea accesible en línea.
El Million Book Project era una organización benéfica 501(c)(3) con varios centros de escaneo en todo el mundo.
En diciembre de 2007, se habían escaneado más de 1,5 millones de libros en 20 idiomas: 970.000 en chino; 360.000 en inglés; 50.000 en telugu ; y 40.000 en árabe. [2] La mayoría de los libros son de dominio público , pero se ha obtenido permiso para incluir más de 60.000 libros con derechos de autor (aproximadamente 53.000 en inglés y 7.000 en idiomas indios). Los libros se reflejan en parte en sitios de la India, China, Carnegie Mellon, Internet Archive y la Biblioteca Alejandrina . Los libros que se han escaneado hasta la fecha aún no están todos disponibles en línea, y ningún sitio tiene copias de todos los libros que están disponibles en línea.
El proyecto del millón de libros fue una "prueba de concepto" que en gran medida fue reemplazada por los proyectos de escaneo de libros de HathiTrust , Google Book Search e Internet Archive.
Es posible que Internet Archive tenga algunos libros que Google no tiene (por ejemplo: Los poemas de Robert Frost publicados después de fines de 1922). [3] [4] [5]
La National Science Foundation (NSF) otorgó a Carnegie Mellon 3,63 millones de dólares a lo largo de cuatro años para equipos y viajes administrativos para el Million Book Project. India proporcionó 25 millones de dólares anuales para apoyar proyectos de investigación sobre traducción de idiomas. El Ministerio de Educación de China proporcionó 8,46 millones de dólares a lo largo de tres años. Internet Archive proporcionó equipos, personal y dinero. La biblioteca de la Universidad de California, Merced, financió el trabajo para obtener el permiso de copyright de las editoriales estadounidenses.
El programa finalizó en 2008. [6]
Las instituciones en China que participan en este proyecto incluyen: [1]
Las instituciones de la India que participan en este proyecto incluyen: [1]
Las instituciones en los EE.UU. que participan incluyen: [1]
Las instituciones de la UE que participan son: [1]