Parte de una serie sobre |
Lectura |
---|
La legibilidad es la facilidad con la que un lector puede comprender un texto escrito . El concepto existe tanto en el lenguaje natural como en los lenguajes de programación , aunque en diferentes formas. En el lenguaje natural , la legibilidad del texto depende de su contenido (la complejidad de su vocabulario y sintaxis ) y su presentación (como los aspectos tipográficos que afectan la legibilidad , como el tamaño de fuente , la altura de línea , el espaciado entre caracteres y la longitud de línea ). [1] En programación , cosas como los comentarios del programador , la elección de la estructura del bucle y la elección de los nombres pueden determinar la facilidad con la que los humanos pueden leer el código del programa de computadora .
Una mayor legibilidad de un texto facilita el esfuerzo y la velocidad de lectura para la población general de lectores. Para quienes no tienen una alta comprensión lectora , la legibilidad es necesaria para comprender y aplicar un texto determinado. Las técnicas para simplificar la legibilidad son esenciales para comunicar un conjunto de información a la audiencia a la que se dirige. [2] Ya sea que se trate de código, información de noticias o narración de historias, cada escritor tiene una audiencia objetivo a la que debe ajustar sus niveles de legibilidad.
El término "legibilidad" es inherentemente amplio y puede resultar confuso al examinar todas las definiciones posibles. [3] La legibilidad es un concepto que involucra a la audiencia, el contenido, la calidad, la legibilidad e incluso puede involucrar el formato y la estructura del diseño de un texto determinado. [4] Existen diferentes definiciones de legibilidad de diversas fuentes. La definición fluctúa según el tipo de audiencia a la que se presenta un determinado tipo de contenido. Por ejemplo, un escritor técnico podría centrarse en un lenguaje claro y conciso y en un formato que permita una lectura fácil. Por el contrario, una revista académica utilizaría una redacción sofisticada que atraería y tendría sentido para el tipo de audiencia a la que dirige la información.
La legibilidad es esencial para la claridad y accesibilidad de los textos utilizados en las aulas, los entornos laborales y la vida cotidiana. El gobierno también prioriza la legibilidad a través de las Leyes de Lenguaje Sencillo que exigen que los documentos importantes se redacten a un nivel de octavo grado. [5]
Muchas investigaciones se han centrado en adecuar la prosa a las habilidades de lectura, lo que ha dado lugar a fórmulas para su uso en la investigación, el gobierno, la enseñanza, la publicación, el ejército, la medicina y los negocios. [6] [7]
Las dos publicaciones con mayor circulación, TV Guide (13 millones) y Reader's Digest (12 millones), están escritas a nivel de noveno grado. [8] Las novelas más populares están escritas a nivel de séptimo grado. Esto respalda el hecho de que el adulto promedio lee a nivel de noveno grado. También muestra que, por recreación, las personas leen textos que están dos grados por debajo de su nivel de lectura real. [9]
Durante siglos, los maestros y educadores han visto la importancia de la organización, la coherencia y el énfasis en una buena redacción. En la década de 1880, el profesor de inglés LA Sherman descubrió que las oraciones en inglés se estaban acortando. En la época isabelina , la oración promedio tenía 50 palabras, mientras que en la época moderna de Sherman, era de 23 palabras.
El trabajo de Sherman estableció que:
Sherman escribió: “Ningún hombre debería hablar peor de lo que escribe, ningún hombre debería escribir mejor de lo que debería hablar…” Escribió esto queriendo enfatizar que cuanto más cerca está la escritura del habla, más claro y efectivo se vuelve el contenido. [10]
En 1889, en Rusia, el escritor Nikolai A. Rubakin publicó un estudio de más de 10.000 textos escritos por gente corriente. [11] De estos textos, tomó 1.500 palabras que creía que la mayoría de la gente entendía. Descubrió que los principales obstáculos para la comprensión son las palabras desconocidas y las oraciones largas . [12] A partir de su propio diario a la edad de 13 años, Rubakin publicó muchos artículos y libros sobre ciencia y muchos temas para la gran cantidad de nuevos lectores en toda Rusia. En opinión de Rubakin, la gente no era tonta. Simplemente eran pobres y necesitaban libros baratos, escritos a un nivel que pudieran comprender. [11]
La primera evaluación de la facilidad de lectura es el juicio subjetivo denominado nivelación del texto . Las fórmulas no abordan por completo los diversos contenidos, propósitos, diseño, aportes visuales y organización de un texto. [13] [14] La nivelación del texto se utiliza comúnmente para clasificar la facilidad de lectura de textos en áreas donde las dificultades de lectura son fáciles de identificar, como libros para niños pequeños. En niveles más altos, la clasificación de la facilidad de lectura se vuelve más difícil, ya que las dificultades individuales se vuelven más difíciles de identificar. Esto ha llevado a mejores formas de evaluar la facilidad de lectura.
En la década de 1920, el movimiento científico en educación buscó pruebas para medir el rendimiento de los estudiantes con el fin de ayudar en el desarrollo del plan de estudios. Los maestros y educadores sabían desde hacía mucho tiempo que, para mejorar la habilidad lectora, los lectores, especialmente los lectores principiantes, necesitan material de lectura que se ajuste lo más posible a su capacidad. Los psicólogos universitarios realizaron gran parte de la investigación inicial, que luego fue retomada por los editores de libros de texto. [15] En 1921, Harry D. Kitson publicó The Mind of the Buyer , uno de los primeros libros en aplicar la psicología al marketing. El trabajo de Kitson mostró que cada tipo de lector compraba y leía su propio tipo de texto. Al leer dos periódicos y dos revistas, descubrió que la longitud de las oraciones y las palabras cortas eran las que más contribuían a la facilidad de lectura. [16]
En 1923, Bertha A. Lively y Sidney L. Pressey publicaron la primera fórmula para medir la facilidad de lectura. Les preocupaba que los libros de texto de ciencias de la escuela secundaria tuvieran tantas palabras técnicas y que los profesores pasaran todo el tiempo de clase explicando estas palabras. Argumentaron que su fórmula ayudaría a medir y reducir la "carga de vocabulario" de los libros de texto. Su fórmula utilizaba cinco variables de entrada y seis constantes. Por cada mil palabras, contaba el número de palabras únicas, el número de palabras que no estaban en la lista de Thorndike y el número de índice medio de las palabras que se encontraban en la lista. De forma manual, se necesitaban tres horas para aplicar la fórmula a un libro. [17]
Después del estudio Lively-Pressey, la gente empezó a buscar fórmulas que fueran más precisas y fáciles de aplicar. En 1928, Carleton Washburne y Mabel Vogel crearon la primera fórmula moderna de legibilidad. La validaron utilizando un criterio externo y la correlacionaron con un 0,845 de los resultados de las pruebas de los estudiantes que habían leído y les habían gustado los libros de criterios. [18] También fue la primera en introducir la variable de interés en el concepto de legibilidad. [19]
Entre 1929 y 1939, Alfred Lewerenz del Distrito Escolar de Los Ángeles publicó varias fórmulas nuevas. [20] [21] [22] [23] [24]
En 1934, el psicólogo educativo Edward Thorndike de la Universidad de Columbia observó que, en Rusia y Alemania, los profesores utilizaban recuentos de frecuencia de palabras para hacer coincidir los libros con los estudiantes. La habilidad con las palabras era el mejor signo de desarrollo intelectual y el predictor más fuerte de la facilidad de lectura. En 1921, Thorndike publicó Teachers Word Book , que contenía las frecuencias de 10.000 palabras. [25] También publicó su fórmula de legibilidad. Escribió que las habilidades con las palabras pueden aumentar si el profesor introduce palabras nuevas y las repite a menudo. [26] En 1939, WW Patty y W. I Painter publicaron una fórmula para medir la carga de vocabulario de los libros de texto. Esta fue la última de las primeras fórmulas que utilizaban la lista de frecuencia de vocabulario de Thorndike. [27] Hasta que aparecieron las computadoras, las listas de frecuencia de palabras eran las mejores ayudas para calificar la facilidad de lectura de los textos. [9]
En 1981, la World Book Encyclopedia (Enciclopedia del Libro Mundial) enumeró los niveles de grado de 44.000 palabras. [28] Una estrategia popular entre los educadores en los tiempos modernos es el "aprendizaje incidental de vocabulario", que refuerza la eficiencia en el aprendizaje de vocabulario a corto plazo en lugar de repetir palabras y significados que los maestros esperan que se mantengan. [29] La táctica del aprendizaje incidental tiene como objetivo ayudar a los estudiantes a desarrollar la comprensión y las habilidades de aprendizaje en lugar de memorizar palabras. A través de esta estrategia, se espera que los estudiantes puedan navegar por varios niveles de legibilidad utilizando pistas de contexto y comprensión.
Durante la recesión de la década de 1930, el gobierno de Estados Unidos invirtió en educación para adultos . En 1931, Douglas Waples y Ralph Tyler publicaron What Adults Want to Read About. Se trataba de un estudio de dos años sobre los intereses de lectura de los adultos. Su libro mostraba no sólo lo que leía la gente, sino también lo que les gustaría leer. Descubrieron que muchos lectores carecían de materiales de lectura adecuados: les habría gustado aprender, pero los materiales de lectura eran demasiado difíciles para ellos. [30]
Lyman Bryson , del Teachers College de la Universidad de Columbia, descubrió que muchos adultos tenían una capacidad de lectura deficiente debido a una educación deficiente. Aunque las universidades habían intentado enseñar durante mucho tiempo a escribir de forma clara y legible, Bryson descubrió que era algo poco frecuente. Escribió que ese tipo de lenguaje es el resultado de una "... disciplina y un arte que pocas personas con ideas se tomarán la molestia de lograr... Si el lenguaje simple fuera fácil, muchos de nuestros problemas se habrían resuelto hace mucho tiempo". [9] Bryson ayudó a establecer el Laboratorio de Legibilidad en la universidad. Dos de sus estudiantes fueron Irving Lorge y Rudolf Flesch .
En 1934, Ralph Ojemann investigó las habilidades de lectura de los adultos, los factores que afectan más directamente la facilidad de lectura y las causas de cada nivel de dificultad. No inventó una fórmula, sino un método para evaluar la dificultad de los materiales para la educación de los padres . Fue el primero en evaluar la validez de este método utilizando 16 pasajes de revistas probados en lectores reales. Evaluó 14 factores medibles y tres informados que afectan la facilidad de lectura.
Ojemann enfatizó las características reportadas, como si el texto era coherente o excesivamente abstracto. Utilizó sus 16 pasajes para comparar y juzgar la facilidad de lectura de otros textos, un método ahora llamado escalamiento . Demostró que, aunque estos factores no se pueden medir, no se pueden ignorar. [31]
También en 1934, Ralph Tyler y Edgar Dale publicaron la primera fórmula para medir la facilidad de lectura de los adultos, basada en pasajes sobre temas de salud extraídos de una variedad de libros de texto y revistas. De los 29 factores que son importantes para los lectores jóvenes, encontraron diez que son importantes para los adultos. Utilizaron tres de ellos en su fórmula. [32]
En 1935, William S. Gray, de la Universidad de Chicago , y Bernice Leary, del Xavier College de Chicago, publicaron What Makes a Book Readable, uno de los libros más importantes en materia de investigación sobre legibilidad. Al igual que Dale y Tyler, se centraron en lo que hace que los libros sean legibles para adultos con capacidad de lectura limitada. Su libro incluía el primer estudio científico de las habilidades de lectura de los adultos estadounidenses. La muestra incluía a 1.690 adultos de una variedad de entornos y regiones. La prueba utilizó una serie de pasajes de periódicos , revistas y libros, así como una prueba de lectura estándar. Encontraron una puntuación media de 7,81 (octavo mes del séptimo grado ). Aproximadamente un tercio leía a un nivel de 2.º a 6.º grado , un tercio a un nivel de 7.º a 12.º grado y un tercio a un nivel de 13.º a 17.º grado. Los autores enfatizaron que la mitad de la población adulta en ese momento carecía de materiales de lectura adecuados. Escribieron: “Para ellos, los valores enriquecedores de la lectura se ven privados a menos que los materiales que reflejan los intereses de los adultos se adapten a sus necesidades”. Los lectores más pobres, una sexta parte de la población adulta, necesitan “materiales más simples para utilizarlos en la promoción de una alfabetización funcional y en el establecimiento de hábitos fundamentales de lectura”. [33]
En 1939, Irving Lorge publicó un artículo que informaba sobre otras combinaciones de variables que indican la dificultad con mayor precisión que las que utilizaron Gray y Leary. Su investigación también demostró que "la carga de vocabulario es el concomitante más importante de la dificultad". [34] En 1944, Lorge publicó su Índice de Lorge , una fórmula de legibilidad que utilizaba tres variables y sentó las bases para fórmulas más simples y confiables que le siguieron. [35]
En 1940, los investigadores habían:
En 1943, Rudolf Flesch publicó su tesis doctoral, Marks of a Readable Style (Señales de un estilo legible) , que incluía una fórmula de legibilidad para predecir la dificultad de lectura de material para adultos. Los investigadores de muchos campos comenzaron a utilizarla para mejorar las comunicaciones. Una de las variables que utilizaba eran las referencias personales, como los nombres y los pronombres personales. Otra variable eran los afijos . [36]
En 1947, Donald Murphy, de Wallace's Farmer , utilizó una edición dividida [37] para estudiar los efectos de hacer que el texto fuera más fácil de leer. Descubrió que reducir el nivel de lectura del noveno al sexto grado aumentaba el número de lectores en un 43% para un artículo sobre el nailon. También descubrió un aumento del 60% en el número de lectores de un artículo sobre el maíz, con mejores respuestas de las personas menores de 35 años. [37] El resultado fue una ganancia de 42.000 lectores en una tirada de 275.000 ejemplares.
Wilber Schramm, quien dirigió el programa de Investigación de Comunicaciones en la Universidad de Illinois, entrevistó a 1.050 lectores de periódicos en 1947. Descubrió que un estilo de lectura más fácil ayuda a determinar qué parte de un artículo se lee. Esto se llamó persistencia, profundidad o perseverancia en la lectura. También descubrió que la gente lee menos artículos largos que cortos; por ejemplo, una historia de nueve párrafos perderá 3 de cada 10 lectores al llegar al quinto párrafo. En cambio, una historia más corta perderá solo 2 de cada 10 lectores. [38]
Un estudio realizado en 1947 por Melvin Lostutter demostró que los periódicos se escribían generalmente a un nivel cinco años superior al de los lectores adultos estadounidenses promedio. Se descubrió que la facilidad de lectura de los artículos periodísticos no tenía mucha relación con la educación, la experiencia o el interés personal de los periodistas que escribían las historias. En cambio, tenía más que ver con las convenciones y la cultura de la industria. Lostutter abogó por que se hicieran más pruebas de legibilidad en los artículos periodísticos. La mejora de la legibilidad debe ser un "proceso consciente, en cierta medida independiente de la educación y la experiencia de los redactores del personal " . [39]
En 1948, Flesch publicó su fórmula de facilidad de lectura en dos partes. En lugar de utilizar niveles de grado, utilizó una escala de 0 a 100, donde 0 equivale al 12.º grado y 100 al 4.º grado. Eliminó el uso de afijos. La segunda parte de la fórmula predice el interés humano utilizando referencias personales y el número de oraciones personales. La nueva fórmula correlacionó 0,70 con las pruebas de lectura de McCall-Crabbs. [40]
En 1948, Bernard Feld realizó un estudio de todos los artículos y anuncios del Birmingham News del 20 de noviembre de 1947. Dividió los artículos en aquellos que superaban el nivel de octavo grado y aquellos que estaban en octavo grado o por debajo. Escogió el punto de corte de octavo grado, ya que se determinó que ese era el nivel de lectura promedio de los lectores adultos. Un texto de octavo grado "... llegará a aproximadamente el 50% de todos los adultos estadounidenses", escribió. Entre las historias de las agencias de noticias, el grupo inferior obtuvo dos tercios más de lectores, y entre las historias locales, un 75% más de lectores. Feld también creía en inculcar a los escritores los principios de redacción clara de Flesch. [41]
Tanto Rudolf Flesch como Robert Gunning trabajaron extensamente con periódicos y agencias de noticias para mejorar la legibilidad. Principalmente gracias a sus esfuerzos, en pocos años la legibilidad de los periódicos estadounidenses pasó del nivel de 16.º al 11.º grado, donde se mantiene hasta hoy. Los editores descubrieron que las fórmulas de Flesch podían aumentar el número de lectores hasta en un 60%. El trabajo de Flesch tuvo un enorme impacto en el periodismo. La fórmula Flesch Reading Ease se convirtió en una de las métricas de legibilidad más utilizadas, probadas y confiables. [42] [43] En 1951, Farr, Jenkins y Patterson simplificaron aún más la fórmula al cambiar el recuento de sílabas. [44]
En la década de 1940, Robert Gunning ayudó a llevar la investigación sobre legibilidad al ámbito laboral. En 1944, fundó la primera empresa de consultoría en legibilidad dedicada a reducir la "niebla" en los periódicos y los textos comerciales. En 1952, publicó The Technique of Clear Writing con su propio índice de niebla, una fórmula que correlaciona 0,91 con la comprensión medida mediante pruebas de lectura. [8]
Edgar Dale , profesor de educación en la Universidad Estatal de Ohio, fue uno de los primeros críticos de las listas de vocabulario y frecuencia de Thorndike. Afirmó que no distinguían entre los diferentes significados que tienen muchas palabras. Creó dos nuevas listas propias. Una, su "lista corta" de 769 palabras fáciles, fue utilizada por Irving Lorge en su fórmula. La otra era su "lista larga" de 3.000 palabras fáciles, que fueron entendidas por el 80% de los estudiantes de cuarto grado. Sin embargo, uno tiene que ampliar las listas de palabras con plurales regulares de sustantivos, formas regulares del tiempo pasado de los verbos, formas progresivas de verbos, etc. En 1948, incorporó esta lista a una fórmula que desarrolló con Jeanne S. Chall , quien más tarde fundó el Laboratorio de Lectura de Harvard. En 1995, Dale y Chall publicaron una nueva versión de su fórmula con una lista de palabras mejorada, la Nueva fórmula de legibilidad de Dale-Chall. [45]
La fórmula de legibilidad de Spache se desarrolló en 1952.
En 1963, mientras enseñaba inglés a profesores en Uganda, Edward Fry desarrolló su gráfico de legibilidad . Se convirtió en una de las fórmulas más populares y más fáciles de aplicar. [46] [47]
El índice de legibilidad automatizado se desarrolló en 1967.
Harry McLaughlin determinó que la longitud de las palabras y la longitud de las oraciones se deben multiplicar en lugar de sumarse como en otras fórmulas. En 1969, publicó su fórmula SMOG (Simple Measure of Gobbledygook). Su uso se recomienda a menudo en el ámbito sanitario. [48]
El sistema de puntuación de densidad sintáctica de Golub fue desarrollado por Lester Golub en 1974. [ cita requerida ]
En 1973, un estudio encargado por el ejército de los EE. UU. sobre las habilidades de lectura necesarias para diferentes trabajos militares dio como resultado la fórmula FORCAST. A diferencia de la mayoría de las demás fórmulas, utiliza solo un elemento de vocabulario, lo que la hace útil para textos sin oraciones completas. La fórmula satisfacía los requisitos de que:
En 1975, en un proyecto patrocinado por la Marina de los EE. UU., se recalculó la fórmula de facilidad de lectura para obtener una puntuación por grado. La nueva fórmula se denomina ahora fórmula de nivel de grado de Flesch-Kincaid . [50]
La estimación de legibilidad Linsear Write Raygor se desarrolló en 1977.
En 1978, John Bormuth, de la Universidad de Chicago, analizó la facilidad de lectura utilizando la nueva prueba de eliminación de espacios en blanco desarrollada por Wilson Taylor. Su trabajo respaldó investigaciones anteriores que incluían el grado de facilidad de lectura para cada tipo de lectura. El mejor nivel para la "lectura asistida" en el aula es un texto ligeramente difícil que provoque un "conjunto de tareas para aprender" y para el cual los lectores puedan responder correctamente el 50% de las preguntas de una prueba de opción múltiple. El mejor nivel para la lectura sin asistencia es aquel en el que los lectores puedan responder correctamente el 80% de las preguntas. Estos puntajes de corte fueron confirmados posteriormente por Vygotsky [51] y Chall y Conard [52] . Entre otras cosas, Bormuth confirmó que el vocabulario y la longitud de las oraciones son los mejores indicadores de la facilidad de lectura. Demostró que las medidas de facilidad de lectura funcionaban tan bien para adultos como para niños. Las mismas cosas que los niños encuentran difíciles son las mismas para los adultos del mismo nivel de lectura. También desarrolló varias medidas nuevas de puntajes de corte. Una de las más conocidas fue la fórmula Mean Cloze , que se utilizó en 1981 para producir el sistema de Grado de Poder Lector utilizado por la Junta de Exámenes de Ingreso a la Universidad. [53] [54] [55]
En 1988, Jack Stenner y sus asociados de MetaMetrics, Inc. publicaron el Marco Lexile para evaluar la legibilidad y encontrar textos apropiados para los estudiantes. El marco Lexile utiliza la longitud promedio de las oraciones y la frecuencia promedio de las palabras en el American Heritage Intermediate Corpus para predecir una puntuación en una escala de 0 a 2000. El American Heritage Intermediate Corpus incluye cinco millones de palabras de 1045 obras publicadas que suelen leer los estudiantes de tercero a noveno grado. [ cita requerida ]
En el año 2000, investigadores del School Renaissance Institute y Touchstone Applied Science Associates publicaron su fórmula de facilidad de lectura Advantage-TASA Open Standard (ATOS) para libros. Trabajaron en una fórmula que fuera fácil de usar y que pudiera utilizarse con cualquier texto.
El proyecto fue uno de los más amplios que se han realizado hasta la fecha para mejorar la facilidad de lectura. Los desarrolladores de la fórmula utilizaron 650 textos de lectura normalizados, 474 millones de palabras de todo el texto de 28.000 libros leídos por estudiantes. El proyecto también utilizó los registros de lectura de más de 30.000 personas que leyeron y fueron examinadas con 950.000 libros.
Descubrieron que tres variables dan la medida más confiable de la facilidad de lectura de un texto:
También encontraron que:
A partir de la década de 1970, los teóricos cognitivos comenzaron a enseñar que la lectura es en realidad un acto de pensamiento y organización. El lector construye significado al mezclar nuevos conocimientos con los conocimientos existentes. Debido a las limitaciones de las fórmulas de facilidad de lectura, algunas investigaciones buscaron formas de medir el contenido, la organización y la coherencia del texto. Aunque esto no mejoró la fiabilidad de las fórmulas, sus esfuerzos demostraron la importancia de estas variables en la facilidad de lectura.
Los estudios de Walter Kintch y otros demostraron el papel central de la coherencia en la facilidad de lectura, principalmente para las personas que están aprendiendo a leer. [58] En 1983, Susan Kemper ideó una fórmula basada en estados físicos y mentales. Sin embargo, descubrió que esto no era mejor que la familiaridad con las palabras y la longitud de las oraciones para mostrar la facilidad de lectura. [59]
Bonnie Meyer y otros intentaron utilizar la organización como medida de la facilidad de lectura. Si bien no se obtuvo una fórmula, demostraron que las personas leen más rápido y retienen más cuando el texto está organizado en temas. Descubrieron que un plan visible para presentar el contenido ayuda mucho a los lectores a evaluar un texto. Un plan jerárquico muestra cómo se relacionan las partes del texto. También ayuda al lector a combinar la nueva información con las estructuras de conocimiento existentes. [60]
Bonnie Armbruster descubrió que la característica más importante para el aprendizaje y la comprensión es la coherencia textual, que se presenta en dos tipos:
Armbruster confirmó el hallazgo de Kintsch de que la coherencia y la estructura son de mayor ayuda para los lectores más jóvenes. [61] RC Calfee y R. Curley se basaron en el trabajo de Bonnie Meyer y descubrieron que una estructura subyacente desconocida puede hacer que incluso un texto simple sea difícil de leer. Introdujeron un sistema graduado para ayudar a los estudiantes a progresar desde líneas argumentales más simples a otras más avanzadas y abstractas. [62]
Muchos otros estudios analizaron los efectos de otras variables textuales en la facilidad de lectura, entre ellos:
La Coh-Metrix se puede utilizar de muchas maneras diferentes para investigar la cohesión del texto explícito y la coherencia de la representación mental del texto. "Nuestra definición de cohesión consiste en las características del texto explícito que desempeñan algún papel a la hora de ayudar al lector a conectar mentalmente las ideas del texto". [79] La definición de coherencia es objeto de mucho debate. En teoría, la coherencia de un texto se define por la interacción entre las representaciones lingüísticas y las representaciones de conocimiento. Si bien la coherencia se puede definir como las características del texto (es decir, los aspectos de la cohesión) que probablemente contribuyan a la coherencia de la representación mental, las mediciones de Coh-Metrix proporcionan índices de estas características de cohesión. [79]
A diferencia de las fórmulas tradicionales de legibilidad, los enfoques de inteligencia artificial para la evaluación de la legibilidad (también conocidos como evaluación automática de la legibilidad) incorporan una gran cantidad de características lingüísticas y construyen modelos de predicción estadística para predecir la legibilidad del texto. [80] [81] Estos enfoques generalmente constan de tres pasos: 1. un corpus de entrenamiento de textos individuales, 2. un conjunto de características lingüísticas que se calcularán a partir de cada texto, y 3. un modelo de aprendizaje automático para predecir la legibilidad, utilizando los valores de las características lingüísticas calculados. [82] [83] [81]
En 2008, se demostró que la complejidad sintáctica está correlacionada con tiempos de procesamiento más largos en la comprensión de textos. [84] Es común utilizar un conjunto rico de estas características sintácticas para predecir la legibilidad de un texto. Las variantes más avanzadas de las características de legibilidad sintáctica se calculan con frecuencia a partir del árbol de análisis . Emily Pitler ( Universidad de Pensilvania ) y Ani Nenkova (Universidad de Pensilvania) son consideradas pioneras en la evaluación de las características sintácticas del árbol de análisis y en su uso generalizado en la evaluación de la legibilidad. [85] [86] Algunos ejemplos incluyen:
Lijun Feng fue pionera en el uso de algunas características motivadas cognitivamente (principalmente léxicas) en 2009. Esto fue durante su estudio de doctorado en la City University of New York (CUNY). [87] Las características motivadas cognitivamente fueron diseñadas originalmente para adultos con discapacidad intelectual , pero se demostró que mejoran la precisión de la evaluación de la legibilidad en general. Las características motivadas cognitivamente, en combinación con un modelo de regresión logística , pueden corregir el error promedio del nivel de grado de Flesch-Kincaid en más del 70%. Las características recién descubiertas por Feng incluyen:
En 2012, Sowmya Vajjala, de la Universidad de Tubinga, creó el corpus WeeBit combinando artículos educativos del sitio web Weekly Reader y del sitio web BBC Bitesize , que ofrecen textos para diferentes grupos de edad. [83] En total, hay 3125 artículos que se dividen en cinco niveles de legibilidad (de 7 a 16 años). El corpus WeeBit se ha utilizado en varias investigaciones de evaluación de la legibilidad basadas en IA. [86]
Wei Xu ( Universidad de Pensilvania ), Chris Callison-Burch ( Universidad de Pensilvania ) y Courtney Napoles ( Universidad Johns Hopkins ) introdujeron el corpus Newsela en el ámbito académico en 2015. [88] El corpus es una colección de miles de artículos de noticias nivelados profesionalmente para diferentes complejidades de lectura por editores profesionales de Newsela . El corpus se introdujo originalmente para la investigación de simplificación de textos , pero también se utilizó para la evaluación de la legibilidad de textos. [89]
La influencia de las características semánticas o semánticas avanzadas en la legibilidad del texto fue desarrollada por Bruce W. Lee durante su estudio en la ( Universidad de Pensilvania ), en 2021. Al tiempo que presentaba su método de hibridación de características, también exploró características semánticas avanzadas elaboradas a mano que tienen como objetivo medir la cantidad de conocimiento contenido en un texto determinado. [90]
donde el recuento de temas descubiertos (n) y la probabilidad del tema (p)
Gray y Leary analizaron 228 variables que afectan la facilidad de lectura y las dividieron en cuatro tipos: contenido, estilo, formato y organización. Descubrieron que el contenido era el más importante, seguido de cerca por el estilo. En tercer lugar estaba el formato, seguido de cerca por la organización. No encontraron ninguna manera de medir el contenido, el formato ni la organización, pero sí podían medir las variables de estilo. Entre las 17 variables de estilo medibles significativas, seleccionaron cinco para crear una fórmula:
La fórmula original es:
La fórmula modificada es:
Para aplicar la fórmula:
Dónde:
Finalmente, para compensar la “curva de equivalencia de nota”, aplique la siguiente tabla para la Puntuación Final:
Puntuación bruta | Puntuación final |
---|---|
4.9 y menos | Grado 4 y menores |
5,0–5,9 | Grados 5 y 6 |
6.0–6.9 | Grados 7 y 8 |
7,0–7,9 | Grados 9 y 10 |
8,0–8,9 | Grados 11 y 12 |
9,0–9,9 | Grados 13 a 15 (universidad) |
10 y más | Grados 16 y superiores. |
[91]
La nueva fórmula de Dale-Chall es:
La fórmula de niebla de Gunning es una de las más fiables y sencillas de aplicar:
La fórmula es:
El índice de densidad sintáctica de Golub fue desarrollado por Lester Golub en 1974. Forma parte de un subconjunto más pequeño de fórmulas de legibilidad que se concentran en las características sintácticas de un texto. Para calcular el nivel de lectura de un texto, se toma una muestra de varios cientos de palabras del texto. Se cuenta el número de palabras de la muestra, así como el número de unidades T. Una unidad T se define como una cláusula independiente y cualquier cláusula dependiente adjunta a ella. A continuación, se cuentan otras unidades sintácticas y se ingresan en la siguiente tabla:
1. Palabras/unidad T .95 X _________ ___ 2. Oraciones subordinadas/unidad T .90 X _________ ___ 3. Longitud de palabra de la cláusula principal (media) .20 X _________ ___ 4. Longitud de la oración subordinada (media) .50 X _________ ___ 5. Número de modales (will, shall, can, may, must, would...) .65 X _________ ___ 6. Número de formas Ser y Tener en el auxiliar .40 X _________ ___ 7. Número de frases preposicionales .75 X _________ ___ 8. Número de sustantivos y pronombres posesivos .70 X _________ ___ 9. Número de adverbios de tiempo (cuando, entonces, una vez, mientras...) .60 X _________ ___ 10. Número de gerundios, participios y absolutos Frases .85 X _________ ___
Los usuarios suman los números de la columna de la derecha y dividen el total por el número de unidades T. Finalmente, el cociente se ingresa en la siguiente tabla para llegar a una puntuación de legibilidad final.
Hoja de datos de seguridad (FDS) | 0,5 | 1.3 | 2.1 | 2.9 | 3.7 | 4.5 | 5.3 | 6.1 | 6.9 | 7.7 | 8.5 | 9.3 | 10.1 | 10.9 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Calificación | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
La relación tipo-muestra es una de las características que se utilizan a menudo para captar la riqueza léxica, que es una medida de la variedad y diversidad del vocabulario. Para medir la dificultad léxica de una palabra, se suele utilizar la frecuencia relativa de la palabra en un corpus representativo como el Corpus of Contemporary American English (COCA). A continuación se incluyen algunos ejemplos de características léxico-semánticas en la evaluación de la legibilidad. [86]
La correlación con la comprensión medida mediante pruebas de lectura es la siguiente: [33] [8]
Fórmula | Correlación | Error estándar |
---|---|---|
Gray y Leary (1935) | .645 | |
Flesch Kincaid (1948) | .91 | 1.9 |
La lectura fácil de Flesch (1948) | .88 | 2.44 |
Dale‐Chall original (1948) | .93 | 1,76 |
Niebla de fuego (1952) | .91 | 2.00 |
Gráfico de frituras (1963) | .86 | 2.31 |
La niebla de McLaughlin (1969) | .88 | 2.28 |
PRONÓSTICO (1973) | .66 | 3.61 |
La precisión de las fórmulas de legibilidad aumenta cuando se encuentra la legibilidad promedio de una gran cantidad de obras. Las pruebas generan una puntuación basada en características como la longitud estadística promedio de las palabras (que se utiliza como un indicador poco confiable de la dificultad semántica ; a veces se tiene en cuenta la frecuencia de las palabras ) y la longitud de las oraciones (como indicador poco confiable de la complejidad sintáctica ) de la obra.
La mayoría de los expertos coinciden en que las fórmulas de legibilidad simples, como la de Flesch-Kincaid para el nivel de grado, pueden ser muy engañosas. [9] Aunque las características tradicionales, como la longitud promedio de las oraciones, tienen una alta correlación con la dificultad de lectura, la medida de la legibilidad es mucho más compleja. Se estudió el enfoque basado en datos e inteligencia artificial (véase más arriba) para abordar esta deficiencia. [64]
Los expertos en redacción han advertido que un intento de simplificar el texto modificando únicamente la longitud de las palabras y las frases puede dar como resultado un texto más difícil de leer. [93] Todas las variables están estrechamente relacionadas. Si se modifica una, también deben ajustarse las demás, incluido el enfoque, la voz, la persona, el tono, la tipografía, el diseño y la organización.
Escribir para un grupo de lectores que no son los propios es muy difícil. Requiere entrenamiento, método y práctica. [94] Entre quienes son buenos en esto están los escritores de novelas y libros infantiles. Todos los expertos en escritura aconsejan que, además de utilizar una fórmula, se observen todas las normas de buena escritura, que son esenciales para escribir textos legibles. Los escritores deben estudiar los textos utilizados por su audiencia y sus hábitos de lectura. [95] Esto significa que para una audiencia de quinto grado, el escritor debe estudiar y aprender materiales de quinto grado de buena calidad. [96] [97]
{{cite journal}}
: CS1 maint: numeric names: authors list (link)