Tipo de sitio | Biblioteca digital |
---|---|
Dueño | |
URL | libros.google.com |
Lanzado | Octubre de 2004 ( 2004-10 ) | (como Google Print)
Estado actual | Activo |
Google Books (anteriormente conocido como Google Book Search , Google Print y por su nombre en código Project Ocean ) [1] es un servicio de Google que busca el texto completo de libros y revistas que Google ha escaneado, convertido a texto mediante reconocimiento óptico de caracteres (OCR) y almacenado en su base de datos digital. [2] Los libros son proporcionados por editores y autores a través del Programa de socios de Google Books, o por los socios de bibliotecas de Google a través del Proyecto de biblioteca. [3] Además, Google se ha asociado con varios editores de revistas para digitalizar sus archivos. [4] [5]
El Programa de Editores se conoció por primera vez como Google Print cuando se presentó en la Feria del Libro de Frankfurt en octubre de 2004. El Proyecto de Biblioteca de Google Libros, que escanea obras de las colecciones de las bibliotecas asociadas y las agrega al inventario digital, se anunció en diciembre de 2004.
La iniciativa Google Books ha sido elogiada por su potencial para ofrecer un acceso sin precedentes a lo que puede convertirse en el mayor cuerpo en línea de conocimiento humano [6] [7] y promover la democratización del conocimiento . [8] Sin embargo, también ha sido criticada por posibles violaciones de derechos de autor, [8] [9] y la falta de edición para corregir los muchos errores introducidos en los textos escaneados por el proceso de OCR.
En octubre de 2019 [actualizar], Google celebró los 15 años de Google Books y proporcionó la cantidad de libros escaneados como más de 40 millones de títulos. [10] Google estimó en 2010 que había alrededor de 130 millones de títulos distintos en el mundo, [11] y declaró que tenía la intención de escanearlos todos. [11] Sin embargo, el proceso de escaneo en las bibliotecas académicas estadounidenses se ha desacelerado desde la década de 2000. [12] [13] Los esfuerzos de escaneo de Google Books han sido objeto de litigios, incluido Authors Guild v. Google , una demanda colectiva en los Estados Unidos, decidida a favor de Google (ver a continuación). Este fue un caso importante que estuvo cerca de cambiar las prácticas de derechos de autor para obras huérfanas en los Estados Unidos. [14] Un estudio de 2023 realizado por académicos de las escuelas de negocios de la Universidad de California, Berkeley y la Universidad Northeastern encontró que la digitalización de libros de Google Books ha llevado a un aumento de las ventas de las versiones físicas de los libros. [15]
Los resultados de Google Books aparecen tanto en la Búsqueda universal de Google como en el sitio web de búsqueda dedicado a Google Books ( books.google.com ).
En respuesta a las consultas de búsqueda, Google Books permite a los usuarios ver páginas completas de libros en los que aparecen los términos de búsqueda si el libro ya no está protegido por derechos de autor o si el propietario de los derechos de autor ha otorgado su permiso. Si Google cree que el libro todavía está protegido por derechos de autor, el usuario ve "fragmentos" de texto alrededor de los términos de búsqueda consultados. Todas las instancias de los términos de búsqueda en el texto del libro aparecen resaltadas en amarillo.
Los cuatro niveles de acceso utilizados en Google Books son: [16]
En respuesta a las críticas de grupos como la Asociación Estadounidense de Editores y el Gremio de Autores , Google anunció en agosto de 2005 una política de exclusión voluntaria , mediante la cual los propietarios de derechos de autor podían proporcionar una lista de títulos que no querían que se escanearan, y la solicitud sería respetada. La empresa también declaró que no escanearía ningún libro protegido por derechos de autor entre agosto y el 1 de noviembre de 2005, para brindar a los propietarios la oportunidad de decidir qué libros excluir del Proyecto. Por lo tanto, los propietarios de derechos de autor tienen tres opciones con respecto a cualquier obra: [18]
La mayoría de las obras escaneadas ya no están impresas ni disponibles comercialmente. [19]
Además de adquirir libros de las bibliotecas, Google también obtiene libros de sus socios editores, a través del "Programa de socios", diseñado para ayudar a los editores y autores a promocionar sus libros. Los editores y autores envían una copia digital de su libro en formato EPUB o PDF , o una copia impresa a Google, que se pone a disposición en Google Books para su vista previa. El editor puede controlar el porcentaje del libro disponible para la vista previa, con un mínimo del 20%. También puede optar por hacer que el libro sea completamente visible e incluso permitir que los usuarios descarguen una copia en PDF. Los libros también pueden ponerse a la venta en Google Play. [3] A diferencia del Proyecto Biblioteca, esto no plantea ningún problema de derechos de autor, ya que se lleva a cabo de conformidad con un acuerdo con el editor. El editor puede optar por retirarse del acuerdo en cualquier momento. [18]
En el caso de muchos libros, Google Books muestra los números de página originales. Sin embargo, Tim Parks , en un artículo publicado en The New York Review of Books en 2014, señaló que Google había dejado de proporcionar números de página para muchas publicaciones recientes (probablemente las adquiridas a través del Programa de socios) "probablemente en alianza con los editores, para obligar a quienes necesitamos preparar notas a pie de página a comprar ediciones en papel". [20]
El proyecto comenzó en 2002 bajo el nombre clave de Project Ocean. El cofundador de Google, Larry Page, siempre había tenido interés en la digitalización de libros. Cuando él y Marissa Mayer comenzaron a experimentar con el escaneo de libros en 2002, les tomó 40 minutos digitalizar un libro de 300 páginas. Pero poco después la tecnología se había desarrollado hasta el punto de que los operadores de escaneo podían escanear hasta 6000 páginas por hora. [14]
Google estableció centros de escaneo designados a los que se transportaban los libros en camiones. Las estaciones podían digitalizar a un ritmo de 1.000 páginas por hora. Los libros se colocaban en una cuna mecánica hecha a medida que ajustaba el lomo del libro en su lugar mientras una serie de luces e instrumentos ópticos escaneaban las dos páginas abiertas. Cada página tendría dos cámaras dirigidas hacia ella que capturarían la imagen, mientras que un telémetro LIDAR superpondría una cuadrícula láser tridimensional sobre la superficie del libro para capturar la curvatura del papel. Un operador humano pasaría las páginas a mano, utilizando un pedal para tomar las fotografías. Sin necesidad de aplanar las páginas o alinearlas perfectamente, el sistema de Google no solo alcanzó una eficiencia y velocidad notables, sino que también ayudó a proteger las frágiles colecciones de una manipulación excesiva. Después, las imágenes crudas pasaron por tres niveles de procesamiento: primero, los algoritmos de deformación que usaban los datos LIDAR corrigieron la curvatura de las páginas. Luego, el software de reconocimiento óptico de caracteres (OCR) transformó las imágenes sin procesar en texto y, por último, otra ronda de algoritmos extrajo los números de página, notas a pie de página, ilustraciones y diagramas. [14]
Muchos de los libros se escanean utilizando una cámara Elphel 323 personalizada [21] [22] a una velocidad de 1.000 páginas por hora. [23] Una patente otorgada a Google en 2009 reveló que Google había ideado un sistema innovador para escanear libros que utiliza dos cámaras y luz infrarroja para corregir automáticamente la curvatura de las páginas de un libro. Al construir un modelo 3D de cada página y luego "desarmarla", Google puede presentar páginas de apariencia plana sin tener que hacer que las páginas sean realmente planas, lo que requiere el uso de métodos destructivos como desencuadernar o placas de vidrio para aplanar individualmente cada página, lo que es ineficiente para el escaneo a gran escala. [24] [25]
Google decidió omitir la información de color a favor de una mejor resolución espacial, ya que la mayoría de los libros que no estaban protegidos por derechos de autor en ese momento no contenían colores. Cada imagen de página se pasó por algoritmos que distinguieron las regiones de texto e ilustración. Las regiones de texto se procesaron luego mediante OCR para permitir la búsqueda de texto completo. Google gastó recursos considerables en encontrar técnicas de compresión óptimas, apuntando a una alta calidad de imagen manteniendo al mismo tiempo los tamaños de archivo mínimos para permitir el acceso a los usuarios de Internet con bajo ancho de banda. [26]
Para cada obra, Google Books genera automáticamente una página de resumen. Esta página muestra información extraída del libro (sus detalles de publicación, un mapa de palabras de alta frecuencia, la tabla de contenidos), así como material secundario, como resúmenes, reseñas de lectores (no legibles en la versión móvil del sitio web) y enlaces a otros textos relevantes. Un visitante de la página, por ejemplo, podría ver una lista de libros que comparten un género y tema similares, o podría ver una lista de trabajos académicos actuales sobre el libro. Este contenido, además, ofrece posibilidades interactivas para los usuarios que hayan iniciado sesión en su cuenta de Google . Pueden exportar los datos bibliográficos y las citas en formatos estándar , escribir sus propias reseñas, agregarlas a su biblioteca para etiquetarlas, organizarlas y compartirlas con otras personas. [27] [28] Por lo tanto, Google Books recopila estos elementos más interpretativos de una variedad de fuentes, incluidos los usuarios, sitios de terceros como Goodreads y, a menudo, el autor y el editor del libro. [29]
De hecho, para animar a los autores a subir sus propios libros, Google ha añadido varias funcionalidades al sitio web. Los autores pueden permitir a los visitantes descargar su ebook de forma gratuita, o pueden establecer su propio precio de compra. Pueden cambiar el precio en cualquier momento, ofreciendo descuentos cuando les convenga. Además, si el autor de un libro decide añadir un ISBN , LCCN o número de registro OCLC , el servicio actualizará la URL del libro para incluirlo. A continuación, el autor puede establecer una página específica como ancla del enlace. Esta opción hace que su libro sea más fácil de encontrar.
El Ngram Viewer es un servicio conectado a Google Books que grafica la frecuencia de uso de palabras en su colección de libros. El servicio es importante para historiadores y lingüistas, ya que puede proporcionar una mirada interna a la cultura humana a través del uso de palabras a lo largo de períodos de tiempo. [30] Este programa ha sido objeto de críticas debido a errores en los metadatos utilizados en el programa. [31]
El proyecto ha recibido críticas de que su objetivo declarado de preservar obras huérfanas y descatalogadas está en riesgo debido a que los datos escaneados tienen errores y estos problemas no se resuelven. [32] [33]
El proceso de escaneo está sujeto a errores. Por ejemplo, algunas páginas pueden ser ilegibles, estar al revés o en un orden incorrecto. Los académicos incluso han informado de páginas arrugadas, que oscurecen los pulgares y los dedos, y de imágenes borrosas o manchadas. [34] Sobre este tema, una declaración de Google al final de los libros escaneados dice:
La digitalización en su nivel más básico se basa en imágenes de las páginas de los libros físicos. Para que este libro esté disponible como un archivo con formato ePub, hemos tomado esas imágenes de las páginas y hemos extraído el texto mediante tecnología de reconocimiento óptico de caracteres (o OCR, por sus siglas en inglés). La extracción de texto de las imágenes de las páginas es una tarea de ingeniería difícil. Las manchas en las páginas de los libros físicos, las fuentes elegantes, las fuentes antiguas, las páginas rasgadas, etc. pueden provocar errores en el texto extraído. El OCR imperfecto es solo el primer desafío en el objetivo final de pasar de colecciones de imágenes de páginas a libros basados en texto extraído. Nuestros algoritmos informáticos también tienen que determinar automáticamente la estructura del libro (cuáles son los encabezados y pies de página, dónde se colocan las imágenes, si el texto es verso o prosa, etc.). Hacerlo correctamente nos permite reproducir el libro de una manera que siga el formato del libro original. A pesar de nuestros mejores esfuerzos, es posible que vea errores ortográficos, caracteres basura, imágenes extrañas o páginas faltantes en este libro. Según nuestras estimaciones, estos errores no deberían impedirle disfrutar del contenido del libro. Los desafíos técnicos que supone construir automáticamente un libro perfecto son abrumadores, pero seguimos mejorando nuestras tecnologías de OCR y de extracción de la estructura del libro. [35]
En 2009, Google anunció que comenzaría a utilizar reCAPTCHA para ayudar a corregir los errores detectados en los escaneos de Google Books. Este método solo mejoraría las palabras escaneadas que son difíciles de reconocer debido al proceso de escaneo y no puede resolver errores como páginas pasadas o palabras bloqueadas. [36]
Los errores de escaneo han inspirado obras de arte como colecciones publicadas de páginas anómalas y un blog de Tumblr . [37]
Los académicos han informado con frecuencia de errores generalizados en la información de metadatos de Google Books, incluidos autores mal atribuidos y fechas de publicación erróneas. Geoffrey Nunberg , un lingüista que investiga los cambios en el uso de las palabras a lo largo del tiempo, notó que una búsqueda de libros publicados antes de 1950 y que contuvieran la palabra "internet" arrojó unos resultados poco probables: 527. Woody Allen es mencionado en 325 libros aparentemente publicados antes de que él naciera. Google respondió a Nunberg culpando a contratistas externos de la mayor parte de los errores. [31]
Otros errores de metadatos reportados incluyen fechas de publicación anteriores al nacimiento del autor (por ejemplo, 182 obras de Charles Dickens antes de su nacimiento en 1812); clasificaciones de temas incorrectas (una edición de Moby Dick encontrada bajo "computadoras", una biografía de Mae West clasificada bajo "religión"), clasificaciones conflictivas (10 ediciones de Hojas de hierba de Whitman , todas clasificadas como "ficción" y "no ficción"), títulos, autores y editores mal escritos ( Moby Dick: o el "muro" blanco ) y metadatos para un libro incorrectamente añadidos a un libro completamente diferente (los metadatos de una obra matemática de 1818 conducen a una novela romántica de 1963). [38] [39]
Se realizó una revisión de los elementos de metadatos de autor, título, editorial y año de publicación de 400 registros de Google Books seleccionados al azar. Los resultados muestran que el 36% de los libros muestreados en el proyecto de digitalización contenían errores de metadatos. Esta tasa de error es más alta de lo que cabría esperar en un catálogo en línea de una biblioteca típica. [40]
La tasa de error general del 36,75 % encontrada en este estudio sugiere que los metadatos de Google Books tienen una alta tasa de error. Si bien los errores "importantes" y "menores" son una distinción subjetiva basada en el concepto algo indeterminado de "facilidad de búsqueda", los errores encontrados en los cuatro elementos de metadatos examinados en este estudio deberían considerarse todos importantes. [40]
Los errores de metadatos basados en fechas de escaneo incorrectas dificultan la investigación con la base de datos del Proyecto Google Books. Google ha mostrado un interés limitado en corregir estos errores. [41]
Algunos políticos e intelectuales europeos han criticado la iniciativa de Google por razones de imperialismo lingüístico . Argumentan que, como la gran mayoría de los libros que se propone escanear están en inglés, ello dará lugar a una representación desproporcionada de las lenguas naturales en el mundo digital. El alemán, el ruso, el francés y el español, por ejemplo, son idiomas populares en el ámbito académico. Sin embargo, el énfasis desproporcionado en línea en el inglés podría condicionar el acceso a la investigación histórica y, en última instancia, el crecimiento y la dirección de la investigación futura. Entre estos críticos se encuentra Jean-Noël Jeanneney , expresidente de la Biblioteca Nacional de Francia . [42] [43]
Aunque Google Books ha digitalizado una gran cantidad de números anteriores de revistas, sus escaneos no incluyen los metadatos necesarios para identificar artículos específicos en números específicos. Esto ha llevado a los creadores de Google Scholar a iniciar su propio programa para digitalizar y alojar artículos de revistas más antiguos (de acuerdo con sus editores). [44]
El proyecto de la biblioteca de libros de Google tiene como objetivo escanear y hacer que las colecciones de varias bibliotecas de investigación importantes sean consultables . [45] Junto con la información bibliográfica , a menudo se pueden ver fragmentos de texto de un libro. Si un libro ya no está protegido por derechos de autor y es de dominio público, está completamente disponible para leer o descargar . [16]
Los libros escaneados a través del Proyecto Biblioteca están disponibles en Google Books para su visualización en fragmentos. En cuanto a la calidad de los escaneos, Google reconoce que "no siempre son de la calidad suficiente" para ofrecerlos a la venta en Google Play. Además, debido a supuestas limitaciones técnicas, Google no reemplaza los escaneos con versiones de mayor calidad que puedan proporcionar los editores. [46]
El proyecto es objeto de la demanda Authors Guild v. Google , presentada en 2005 y falló a favor de Google en 2013, y nuevamente, en apelación, en 2015.
Los propietarios de derechos de autor pueden reclamar los derechos de un libro escaneado y ponerlo a disposición para vista previa o visualización completa ("transfiriéndolo" a su cuenta del Programa de Socios), o solicitar a Google que impida que se busque el texto del libro. [46]
El número de instituciones que participan en el Proyecto de Biblioteca ha crecido desde su inicio. [47]
Otros socios institucionales se han unido al proyecto desde que se anunció por primera vez la asociación: [54]
2002 : Un grupo de miembros del equipo de Google lanza oficialmente el "proyecto secreto 'libros'". [73] Los fundadores de Google, Sergey Brin y Larry Page, idearon la que más tarde se convertiría en Google Books cuando aún eran estudiantes de posgrado en Stanford en 1996. La página de historia en el sitio web de Google Books describe su visión inicial para este proyecto: "en un mundo futuro en el que se digitalizan vastas colecciones de libros, la gente usaría un ' rastreador web ' para indexar el contenido de los libros y analizar las conexiones entre ellos, determinando la relevancia y utilidad de cualquier libro dado al rastrear el número y la calidad de las citas de otros libros". [73] Este equipo visitó los sitios de algunos de los esfuerzos de digitalización más grandes en ese momento, incluido el Proyecto de Memoria Estadounidense de la Biblioteca del Congreso , el Proyecto Gutenberg y la Biblioteca Universal para averiguar cómo funcionan, así como la Universidad de Michigan, el alma mater de Page, y la base para proyectos de digitalización como JSTOR y Making of America. En una conversación con la entonces presidenta de la Universidad, Mary Sue Coleman , cuando Page descubrió que la estimación actual de la universidad para escanear todos los volúmenes de la biblioteca era de 1.000 años, Page supuestamente le dijo a Coleman que "cree que Google puede ayudar a que eso suceda en seis". [73]
2003 : El equipo trabaja para desarrollar un proceso de escaneo de alta velocidad, así como un software para resolver problemas con tamaños de letra extraños, fuentes inusuales y "otras peculiaridades inesperadas". [73]
Diciembre de 2004 : Google anunció una extensión de su iniciativa Google Print conocida como Google Print Library Project. [47] Google anunció asociaciones con varias bibliotecas públicas y universitarias de alto perfil, incluidas la Universidad de Michigan , Harvard ( Harvard University Library ), Stanford ( Green Library ), Oxford ( Bodleian Library ) y la Biblioteca Pública de Nueva York . Según comunicados de prensa y bibliotecarios universitarios, Google planeaba digitalizar y poner a disposición a través de su servicio Google Books aproximadamente 15 millones de volúmenes en una década. El anuncio pronto desencadenó controversia, ya que las asociaciones de editores y autores desafiaron los planes de Google de digitalizar, no solo libros de dominio público, sino también títulos que aún estaban bajo derechos de autor.
Septiembre-octubre de 2005 : Dos demandas contra Google acusan a la empresa de no haber respetado los derechos de autor y de no haber compensado adecuadamente a los autores y editores. Una es una demanda colectiva en nombre de los autores (Authors Guild v. Google, 20 de septiembre de 2005) y la otra es una demanda civil interpuesta por cinco grandes editores y la Asociación de Editores Estadounidenses (McGraw Hill v. Google, 19 de octubre de 2005) [9] [74] [75] [76 ] [77] [78]
Noviembre de 2005 : Google cambió el nombre de este servicio de Google Print a Google Book Search. [79] Su programa que permitía a los editores y autores incluir sus libros en el servicio pasó a llamarse Google Books Partner Program, [80] y la asociación con las bibliotecas se convirtió en Google Books Library Project.
2006 : Google agregó un botón para "descargar un PDF" a todos sus libros de dominio público que no están protegidos por derechos de autor. También agregó una nueva interfaz de navegación junto con nuevas páginas "Acerca de este libro". [73]
Agosto de 2006 : El Sistema Universitario de California anunció que se sumaría al proyecto de digitalización de libros. Esto incluye una parte de los 34 millones de volúmenes de las aproximadamente 100 bibliotecas que administra el Sistema. [81]
Septiembre de 2006 : La Universidad Complutense de Madrid se convirtió en la primera biblioteca en español en unirse al Proyecto de Biblioteca de Libros de Google. [82]
Octubre de 2006 : La Universidad de Wisconsin-Madison anunció que se uniría al proyecto de digitalización de Book Search junto con la Biblioteca de la Sociedad Histórica de Wisconsin . En conjunto, las bibliotecas cuentan con 7,2 millones de fondos. [83]
Noviembre de 2006 : La Universidad de Virginia se unió al proyecto. Sus bibliotecas contienen más de cinco millones de volúmenes y más de 17 millones de manuscritos, libros raros y archivos. [84]
Enero de 2007 : La Universidad de Texas en Austin anunció que se sumaría al proyecto de digitalización de Book Search. Se digitalizarían al menos un millón de volúmenes de las 13 bibliotecas de la universidad.
Marzo de 2007 : La Biblioteca Estatal de Baviera anunció una asociación con Google para escanear más de un millón de obras de dominio público y descatalogadas en alemán, así como en inglés, francés, italiano, latín y español. [85]
Mayo de 2007 : Google y la Biblioteca Cantonal y Universitaria de Lausana anuncian un proyecto conjunto de digitalización de libros . [86]
Mayo de 2007 : La Biblioteca Boekentoren de la Universidad de Gante anunció que participaría con Google en la digitalización y puesta a disposición en línea de versiones digitalizadas de libros del siglo XIX en francés y holandés. [87]
Mayo de 2007: La Universidad de Mysore anuncia que Google digitalizará más de 800.000 libros y manuscritos, incluidos alrededor de 100.000 manuscritos escritos en sánscrito o kannada, tanto en papel como en hojas de palma. [68]
Junio de 2007 : El Comité de Cooperación Institucional (rebautizado como Big Ten Academic Alliance en 2016) anunció que sus doce bibliotecas miembros participarían en el escaneo de 10 millones de libros en el transcurso de los próximos seis años. [58]
Julio de 2007 : la Universidad de Keio se convirtió en el primer socio bibliotecario de Google en Japón con el anuncio de que digitalizarían al menos 120.000 libros de dominio público. [88]
Agosto de 2007 : Google anunció que digitalizaría hasta 500.000 elementos protegidos por derechos de autor y de dominio público de la Biblioteca de la Universidad de Cornell . Google también proporcionaría una copia digital de todas las obras escaneadas para incorporarlas al sistema de biblioteca de la propia universidad. [89]
Septiembre de 2007 : Google agregó una función que permite a los usuarios compartir fragmentos de libros que son de dominio público. Los fragmentos pueden aparecer exactamente como aparecen en la versión escaneada del libro o como texto sin formato. [90]
Septiembre de 2007 : Google presentó una nueva función llamada "Mi biblioteca", que permite a los usuarios crear bibliotecas personales personalizadas, selecciones de libros que pueden etiquetar, revisar, calificar o buscar en el texto completo. [91]
Diciembre de 2007 : La Universidad de Columbia se sumó como socio en la digitalización de obras de dominio público. [92]
Mayo de 2008 : Microsoft redujo su producción y planeó finalizar su proyecto de escaneo , que había alcanzado los 750.000 libros y 80 millones de artículos de revistas. [93]
Octubre de 2008 : Tras dos años de negociaciones, la industria editorial y Google llegaron a un acuerdo . Google aceptó compensar a los autores y editores a cambio del derecho a poner millones de libros a disposición del público. [9] [94]
Octubre de 2008 : El "Repositorio digital compartido" de HathiTrust (más tarde conocido como la Biblioteca digital de HathiTrust) es lanzado conjuntamente por el Comité de Cooperación Institucional y las 11 bibliotecas universitarias del sistema de la Universidad de California , todas las cuales eran bibliotecas asociadas de Google, con el fin de archivar y proporcionar acceso académico a los libros de sus colecciones escaneados por Google y otros. [95]
Noviembre de 2008 : Google alcanzó la marca de 7 millones de libros escaneados por Google y sus socios editoriales. 1 millón estaban en modo de vista previa completa y 1 millón eran obras de dominio público totalmente visibles y descargables. Alrededor de cinco millones estaban agotados . [19] [96] [97]
Diciembre de 2008 : Google anunció la inclusión de revistas en Google Books. Entre los títulos se incluyen New York Magazine , Ebony y Popular Mechanics [98] [99]
Febrero de 2009 : Google lanzó una versión móvil de Google Book Search, que permite a los usuarios de teléfonos iPhone y Android leer más de 1,5 millones de obras de dominio público en los EE. UU. (y más de 500 000 fuera de los EE. UU.) mediante un navegador móvil. En lugar de imágenes de páginas, se muestra el texto sin formato del libro. [100]
Mayo de 2009 : En la convención anual BookExpo en Nueva York, Google señaló su intención de introducir un programa que permitiría a los editores vender versiones digitales de sus libros más nuevos directamente a los consumidores a través de Google. [101]
Diciembre de 2009 : Un tribunal francés prohibió el escaneo de libros protegidos por derechos de autor publicados en Francia, alegando que esto violaba las leyes de derechos de autor. Fue la primera gran derrota legal para el proyecto de escaneo. [102]
Abril de 2010 : Los artistas visuales no fueron incluidos en la demanda y el acuerdo previos, son los grupos demandantes en otra demanda y dicen que tienen la intención de poner bajo escrutinio más que solo Google Books. "La nueva demanda colectiva", se lee en la declaración, "va más allá del Proyecto Biblioteca de Google e incluye otras infracciones sistemáticas y generalizadas de los derechos de fotógrafos, ilustradores y otros artistas visuales por parte de Google". [103]
Mayo de 2010 : Se informó que Google lanzaría una tienda de libros digitales llamada Google Editions . [104] Competiría con Amazon, Barnes & Noble, Apple y otros minoristas de libros electrónicos con su propia tienda de libros electrónicos. A diferencia de otros, Google Editions sería completamente en línea y no requeriría un dispositivo específico (como Kindle, Nook o iPad).
Junio de 2010 : Google superó los 12 millones de libros escaneados. [11]
Agosto de 2010 : se anunció que Google tiene la intención de escanear los 129.864.880 libros conocidos existentes en una década, lo que suma un total de más de 4 mil millones de páginas digitales y 2 billones de palabras. [11]
Diciembre de 2010 : se lanzó Google eBooks (Google Editions) en los EE. UU. [105]
Diciembre de 2010 : Google lanzó Ngram Viewer, que recopila y grafica datos sobre el uso de palabras en su colección de libros. [30]
Marzo de 2011 : Un juez federal rechazó el acuerdo alcanzado entre la industria editorial y Google. [106]
Marzo de 2012 : Google superó los 20 millones de libros escaneados. [107] [108]
Marzo de 2012 : Google llegó a un acuerdo con los editores. [109]
Enero de 2013 : El documental Google and the World Brain se proyectó en el Festival de Cine de Sundance . [110]
Noviembre de 2013 : En el fallo de Authors Guild v. Google , el juez de distrito estadounidense Denny Chin se pone de parte de Google, alegando el uso legítimo. [111] Los autores dijeron que apelarían. [112]
Octubre de 2015 : El tribunal de apelaciones falló a favor de Google y declaró que Google no había violado la ley de derechos de autor. [113] Según el New York Times, Google ha escaneado más de 25 millones de libros. [12]
Abril de 2016 : La Corte Suprema de Estados Unidos se negó a escuchar la apelación del Gremio de Autores, lo que significa que la decisión del tribunal inferior se mantuvo y Google podría escanear libros de la biblioteca y mostrar fragmentos en los resultados de búsqueda sin violar la ley. [114]
Google ha sido bastante reservado en cuanto a sus planes sobre el futuro del proyecto Google Books. Las operaciones de escaneo se han ido ralentizando desde al menos 2012, como lo confirmaron los bibliotecarios de varias de las instituciones asociadas de Google. En la Universidad de Wisconsin, la velocidad se había reducido a menos de la mitad de lo que era en 2006. Sin embargo, los bibliotecarios han dicho que la disminución del ritmo podría ser un resultado natural de la maduración del proyecto: inicialmente, las pilas de libros se ocuparon por completo para escanear, mientras que ahora solo era necesario considerar los títulos que aún no se habían escaneado. [50] La propia página de la cronología de Google Books de la empresa no mencionó nada después de 2007 ni siquiera en 2017, y el blog de Google Books se fusionó con el blog de Google Search en 2012. [115]
A pesar de haber ganado el litigio que duró una década en 2017, The Atlantic ha dicho que Google "prácticamente ha cerrado su operación de escaneo". [14] En abril de 2017, Wired informó que solo había unos pocos empleados de Google trabajando en el proyecto y que todavía se escaneaban libros nuevos, pero a un ritmo significativamente menor. Comentó que la batalla legal que duró una década había hecho que Google perdiera su ambición. [115]
Gracias a este proyecto, los libros de las bibliotecas se digitalizaron de forma un tanto indiscriminada, independientemente de su estatus de copyright, lo que dio lugar a una serie de demandas contra Google. A finales de 2008, Google había digitalizado, según se informa, más de siete millones de libros, de los cuales sólo un millón eran obras de dominio público. Del resto, un millón estaban protegidos por derechos de autor y en circulación, y cinco millones estaban protegidos por derechos de autor pero agotados. En 2005, un grupo de autores y editores interpuso una importante demanda colectiva contra Google por infracción de las obras protegidas por derechos de autor. Google argumentó que estaba preservando "obras huérfanas", es decir, libros que todavía estaban protegidos por derechos de autor, pero cuyos titulares no podían ser localizados. [116]
El Gremio de Autores y la Asociación de Editores Estadounidenses demandaron por separado a Google en 2005 por su proyecto de libro, citando " violación masiva de derechos de autor ". [117] Google respondió que su proyecto representaba un uso justo y es el equivalente de la era digital de un catálogo de tarjetas con cada palabra de la publicación indexada. [9] Las demandas se consolidaron y, finalmente, se propuso un acuerdo . El acuerdo recibió críticas significativas por una amplia variedad de motivos, incluidos antimonopolio, privacidad e inadecuación de las clases propuestas de autores y editores. El acuerdo finalmente fue rechazado, [118] y los editores llegaron a un acuerdo con Google poco después. El Gremio de Autores continuó con su caso y en 2011 su clase propuesta fue certificada . Google apeló esa decisión, con varios amici afirmando la inadecuación de la clase, y el Segundo Circuito rechazó la certificación de la clase en julio de 2013, remitiendo el caso al Tribunal de Distrito para que considere la defensa de uso justo de Google. [119]
En 2015, Authors Guild presentó otra apelación contra Google para que la examinara el Tribunal de Apelaciones del Segundo Circuito de Estados Unidos en Nueva York. Google ganó el caso por unanimidad basándose en el argumento de que no estaban mostrando a la gente los textos completos, sino fragmentos, y que no estaban permitiendo que la gente leyera el libro ilegalmente. [120] En un informe, los tribunales afirmaron que no infringían las leyes de derechos de autor, ya que estaban protegidos por la cláusula de uso justo. [121]
En 2016, Authors Guild intentó apelar la decisión nuevamente y esta vez llevó su caso a la Corte Suprema. El caso fue rechazado, dejando intacta la decisión del Segundo Circuito sobre el caso, lo que significa que Google no violó las leyes de derechos de autor. [122] Este caso también sentó un precedente para otros casos similares en lo que respecta a las leyes de uso justo, ya que aclaró aún más la ley y la amplió. Tal aclaración afecta a otros proyectos de escaneo similares a Google. [120]
Otras demandas siguieron el ejemplo del Gremio de Autores. En 2006, una demanda alemana, presentada previamente, fue retirada. [123] En junio de 2006, Hervé de la Martinière, [124] un editor francés conocido como La Martinière y Éditions du Seuil , [125] anunció su intención de demandar a Google Francia. [126] En 2009, el Tribunal Civil de París otorgó 300.000 EUR (aproximadamente 430.000 USD ) en daños e intereses y ordenó a Google pagar 10.000 EUR por día hasta que elimine los libros del editor de su base de datos. [125] [127] El tribunal escribió: "Google violó las leyes de derechos de autor de los autores al reproducir y hacer accesibles íntegramente" libros que posee Seuil sin su permiso [125] y que Google "cometió actos de violación de los derechos de autor, que son perjudiciales para los editores". [124] Google dijo que apelará. [125] El Syndicat National de l'Edition, que se unió a la demanda, dijo que Google ha escaneado alrededor de 100.000 obras francesas protegidas por derechos de autor. [125]
En diciembre de 2009, la autora china Mian Mian presentó una demanda civil por 8.900 dólares contra Google por escanear su novela Acid Lovers . Esta es la primera demanda de este tipo que se presenta contra Google en China. [128] Además, en noviembre de ese año, la Sociedad de Derechos de Autor de Obras Escritas de China (CWWCS) acusó a Google de escanear 18.000 libros de 570 escritores chinos sin autorización. El 20 de noviembre, Google aceptó proporcionar una lista de los libros chinos que había escaneado, pero la empresa se negó a admitir que había "infringido" las leyes de derechos de autor. [129] [ ¿ Fuente poco fiable? ]
En marzo de 2007, Thomas Rubin, asesor general asociado de derechos de autor, marcas registradas y secretos comerciales de Microsoft, acusó a Google de violar la ley de derechos de autor con su servicio de búsqueda de libros. Rubin criticó específicamente la política de Google de copiar libremente cualquier obra hasta que el titular de los derechos de autor le notifique que deje de hacerlo. [130]
La concesión de licencias de Google para obras de dominio público también es un motivo de preocupación debido al uso de técnicas de marca de agua digital en los libros. Algunas obras publicadas que son de dominio público, como todas las obras creadas por el gobierno federal de los EE. UU ., todavía se tratan como otras obras sujetas a derechos de autor y, por lo tanto, están bloqueadas después de 1922. [131]
{{cite book}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite web}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite book}}
: CS1 maint: URL no apta ( enlace )Google, uno de los pioneros en este campo, afirma tener siete millones de libros disponibles para su proyecto "Google Book Search", que vio la luz a finales de 2004.
{{cite web}}
: CS1 maint: URL no apta ( enlace )