Escala de Likert

Escala de medición psicométrica

Una escala de Likert (/ˈlɪkərt / LIK - ərt , [ 1 ] [ nota 1] ) es una escala psicométrica que lleva el nombre de su inventor, el psicólogo social estadounidense Rensis Likert , [2] que se utiliza comúnmente en cuestionarios de investigación . Es el enfoque más utilizado para escalar respuestas en la investigación de encuestas, de modo que el término (o más completamente la escala de tipo Likert ) a menudo se usa indistintamente con escala de calificación , aunque existen otros tipos de escalas de calificación.

Likert distingue entre una escala propiamente dicha, que surge de las respuestas colectivas a un conjunto de ítems (normalmente ocho o más), y el formato en el que las respuestas se califican a lo largo de un rango. Técnicamente hablando, una escala Likert se refiere únicamente a la primera. [3] [4] La diferencia entre estos dos conceptos tiene que ver con la distinción que hace Likert entre el fenómeno subyacente que se investiga y los medios para capturar la variación que apunta al fenómeno subyacente. [5]

Al responder a un ítem de Likert, los encuestados especifican su nivel de acuerdo o desacuerdo en una escala simétrica de acuerdo-desacuerdo para una serie de afirmaciones. De este modo, el rango refleja la intensidad de sus sentimientos respecto de un ítem determinado. [6]

Una escala puede crearse como la simple suma o promedio de las respuestas del cuestionario sobre el conjunto de ítems individuales (preguntas). Al hacerlo, la escala Likert supone que las distancias entre cada opción (opción de respuesta) son iguales. Muchos investigadores emplean un conjunto de tales ítems que están altamente correlacionados (que muestran una alta consistencia interna ) pero también que juntos capturarán el dominio completo en estudio (lo que requiere correlaciones menos que perfectas). Otros se adhieren a un estándar por el cual "se supone que todos los ítems son réplicas unos de otros o, en otras palabras, los ítems se consideran instrumentos paralelos". [7] : 197  Por el contrario, la teoría de pruebas moderna trata la dificultad de cada ítem (los ICC ) como información que se debe incorporar en los ítems de escala. [8]

Composición

Ejemplo de cuestionario sobre el diseño de un sitio web, con respuestas en escala Likert

Una escala Likert es la suma de respuestas a varios ítems de Likert . Debido a que muchas escalas Likert emparejan cada ítem de Likert constituyente con su propia instancia de una escala analógica visual (por ejemplo, una línea horizontal, en la que el sujeto indica una respuesta haciendo un círculo o marcando las marcas de verificación), a veces se hace referencia erróneamente a un ítem individual como si fuera o tuviera una escala, y este error crea una confusión generalizada en la literatura y el lenguaje del campo.

Un ítem Likert es simplemente una afirmación que se le pide al encuestado que evalúe dándole un valor cuantitativo en cualquier tipo de dimensión subjetiva u objetiva, siendo el nivel de acuerdo/desacuerdo la dimensión más comúnmente utilizada. Los ítems Likert bien diseñados exhiben tanto "simetría" como "equilibrio". Simetría significa que contienen cantidades iguales de posiciones positivas y negativas cuyas distancias respectivas son bilateralmente simétricas respecto del valor "neutral"/cero (ya sea que ese valor se presente o no como candidato). Equilibrio significa que la distancia entre cada valor candidato es la misma, lo que permite que las comparaciones cuantitativas, como el promedio, sean válidas entre ítems que contienen más de dos valores candidatos. [9]

El formato de un elemento Likert típico de cinco niveles, por ejemplo, podría ser:

  1. Estoy totalmente en desacuerdo
  2. Discrepar
  3. Ni de acuerdo ni en desacuerdo
  4. Aceptar
  5. Estoy totalmente de acuerdo

La escala Likert es un método de escala bipolar que mide la respuesta positiva o negativa a una afirmación. A veces se utiliza una escala de puntos iguales, en la que la opción intermedia de "ni de acuerdo ni en desacuerdo" no está disponible. A esto a veces se le llama método de "elección forzada", ya que se elimina la opción neutral. [10] La opción neutral puede verse como una opción fácil de tomar cuando un encuestado no está seguro, por lo que es cuestionable si es una opción verdaderamente neutral. Un estudio de 1987 encontró diferencias insignificantes entre el uso de "indeciso" y "neutral" como opción intermedia en una escala Likert de cinco puntos. [11]

Las escalas Likert pueden estar sujetas a distorsiones por diversas causas. Los encuestados pueden:

  • Evite utilizar categorías de respuesta extremas ( sesgo de tendencia central ), especialmente por el deseo de evitar ser percibido como alguien que tiene opiniones extremistas (un ejemplo de sesgo de deseabilidad social ). Este efecto puede aparecer al principio de una prueba debido a la expectativa de que puedan aparecer a continuación preguntas sobre las que el sujeto tiene opiniones más firmes, de modo que en las primeras preguntas uno "deja espacio" para respuestas más firmes más adelante en la prueba. Esta expectativa crea un sesgo que es especialmente pernicioso porque sus efectos no son uniformes a lo largo de la prueba y no se pueden corregir mediante una simple normalización general;
  • Estar de acuerdo con las afirmaciones tal como se presentan ( sesgo de aquiescencia ), por ejemplo, estar de acuerdo tanto con la afirmación A como con su contraria. Este efecto es especialmente fuerte entre los niños, las personas con discapacidades del desarrollo, las personas mayores y las personas que están sujetas a una cultura de institucionalización que fomenta e incentiva el afán de complacer;
  • No estar de acuerdo con las oraciones tal como se presentan debido a un deseo defensivo de evitar hacer afirmaciones erróneas y/o evitar consecuencias negativas que los encuestados puedan temer que resulten de que sus respuestas se utilicen en su contra, especialmente si se malinterpretan y/o se sacan de contexto;
  • Proporcionar respuestas que, según su opinión, serán evaluadas como indicativas de fortaleza o falta de debilidad/disfunción ("fingir ser bueno");
  • Proporcionar respuestas que creen que serán evaluadas como indicativas de debilidad o presencia de deterioro/patología ("fingir estar mal");
  • Tratar de presentarse a sí mismos o a su organización de una manera que creen que el examinador o la sociedad consideran más favorable que sus verdaderas creencias ( sesgo de deseabilidad social , la versión intersubjetiva del "fingir el bien" objetivo discutida anteriormente);
  • Tratar de presentarse a sí mismos o a su organización bajo una luz que creen que el examinador o la sociedad consideran menos favorable/más desfavorable que sus verdaderas creencias ( desafío de las normas , la versión intersubjetiva de "fingir mal" objetivo analizada anteriormente).

El diseño de una escala con una codificación equilibrada (un número igual de afirmaciones positivas y negativas y, especialmente, un número igual de afirmaciones positivas y negativas con respecto a cada posición o tema en cuestión) puede obviar el problema del sesgo de aquiescencia, ya que la aquiescencia en los ítems con codificación positiva equilibrará la aquiescencia en los ítems con codificación negativa, pero los sesgos defensivos, de tendencia central y de deseabilidad social son algo más problemáticos.

Puntuación y análisis

Una vez completado el cuestionario, cada ítem puede analizarse por separado o, en algunos casos, las respuestas a los ítems pueden sumarse para crear una puntuación para un grupo de ítems. Por ello, las escalas Likert suelen denominarse escalas sumativas.

En la literatura [12] [13] existe un considerable desacuerdo sobre si los ítems de Likert individuales pueden considerarse datos de nivel de intervalo o si deben tratarse como datos categóricos ordenados, y hay convicciones firmes sobre cuáles son los métodos más aplicables. Este desacuerdo se remonta, en muchos aspectos, al grado en que los ítems de Likert se interpretan como datos ordinales .

Hay dos consideraciones principales en esta discusión. En primer lugar, las escalas Likert son arbitrarias. El valor asignado a un ítem Likert no tiene una base numérica objetiva, ni en términos de teoría de la medida ni de escala (a partir de la cual se puede determinar una métrica de distancia ). El valor asignado a cada ítem Likert es simplemente determinado por el investigador que diseña la encuesta, quien toma la decisión basándose en un nivel de detalle deseado. Sin embargo, por convención, a los ítems Likert se les suelen asignar valores enteros positivos progresivos. Las escalas Likert suelen oscilar entre 2 y 10, siendo 3, 5 o 7 los más comunes. [14] Además, esta estructura progresiva de la escala es tal que cada ítem Likert sucesivo se trata como si indicara una respuesta "mejor" que el valor anterior. (Esto puede diferir en los casos en que se necesita un orden inverso de la escala Likert).

El segundo punto, y posiblemente el más importante, es si la "distancia" entre cada categoría sucesiva de ítems es equivalente, lo que se infiere tradicionalmente. Por ejemplo, en el ítem Likert de cinco puntos mencionado anteriormente, la inferencia es que la "distancia" entre la categoría 1 y 2 es la misma que entre la categoría 3 y 4. En términos de una buena práctica de investigación, una presentación equidistante por parte del investigador es importante; de ​​lo contrario, puede resultar un sesgo en el análisis. Por ejemplo, es poco probable que un ítem Likert de cuatro puntos con las categorías "Malo", "Promedio", "Bueno" y "Muy bueno" tenga todas las categorías equidistantes, ya que solo hay una categoría que puede recibir una calificación por debajo del promedio. Podría decirse que esto sesgaría cualquier resultado a favor de un resultado positivo. Por otro lado, incluso si un investigador presenta lo que él o ella cree que son categorías equidistantes, es posible que el encuestado no lo interprete como tal.

Una buena escala Likert, como la anterior, presentará una simetría de categorías en torno a un punto medio con calificadores lingüísticos claramente definidos. En una escala simétrica de este tipo, los atributos equidistantes normalmente se observarán con mayor claridad o, al menos, se inferirán. Cuando una escala Likert es simétrica y equidistante, se comportará más como una medición a nivel de intervalo. Por lo tanto, si bien una escala Likert es de hecho ordinal , si se presenta bien, puede aproximarse a una medición a nivel de intervalo. Esto puede ser beneficioso ya que, si se tratara simplemente como una escala ordinal, se podría perder información valiosa si la "distancia" entre los elementos de Likert no estuviera disponible para su consideración. La idea importante aquí es que el tipo apropiado de análisis depende de cómo se haya presentado la escala Likert.

La validez de tales medidas depende de la naturaleza de intervalo subyacente de la escala. Si se supone que la naturaleza de intervalo es para una comparación de dos grupos, la prueba t de muestras pareadas no es inapropiada. [4] Si se deben realizar pruebas no paramétricas, se recomienda la modificación de Pratt (1959) [15] a la prueba de rangos con signo de Wilcoxon en lugar de la prueba de rangos con signo de Wilcoxon estándar . [4]

Las respuestas a varias preguntas Likert pueden sumarse siempre que todas las preguntas utilicen la misma escala Likert y que la escala sea una aproximación defendible a una escala de intervalo, en cuyo caso el teorema del límite central permite el tratamiento de los datos como datos de intervalo que miden una variable latente. [ cita requerida ] Si las respuestas sumadas cumplen estos supuestos, se pueden aplicar pruebas estadísticas paramétricas como el análisis de varianza . Los puntos de corte típicos para pensar que esta aproximación será aceptable son un mínimo de cuatro y preferiblemente ocho elementos en la suma. [5] [13]

Para modelar directamente las respuestas binarias de Likert, se pueden representar en forma binomial sumando las respuestas de acuerdo y desacuerdo por separado. La prueba de chi-cuadrado , la prueba Q de Cochran o la prueba de McNemar son procedimientos estadísticos comunes utilizados después de esta transformación. Las pruebas no paramétricas como la prueba de chi-cuadrado , la prueba de Mann-Whitney , la prueba de rangos con signo de Wilcoxon o la prueba de Kruskal-Wallis [16] se utilizan a menudo en el análisis de datos de escala Likert .

Como alternativa, las respuestas de la escala Likert se pueden analizar con un modelo probit ordenado , preservando el orden de las respuestas sin asumir una escala de intervalo. El uso de un modelo probit ordenado puede evitar errores que surgen al tratar las calificaciones ordenadas como mediciones a nivel de intervalo. [17] La ​​evaluación basada en el consenso (CBA) se puede utilizar para crear un estándar objetivo para las escalas Likert en dominios donde no existe un estándar generalmente aceptado u objetivo. La evaluación basada en el consenso (CBA) se puede utilizar para refinar o incluso validar estándares generalmente aceptados. [ cita requerida ]

Modelos de variables latentes

Una práctica común para analizar las respuestas a colecciones de ítems de la escala Likert es resumirlas a través de un modelo de variable latente , por ejemplo utilizando el análisis factorial o la teoría de respuesta al ítem .

Modelo de Rasch

En principio, los datos de la escala Likert pueden utilizarse como base para obtener estimaciones de nivel de intervalo en un continuo mediante la aplicación del modelo politómico de Rasch , cuando se pueden obtener datos que se ajusten a este modelo. Además, el modelo politómico de Rasch permite probar la hipótesis de que las afirmaciones reflejan niveles crecientes de una actitud o rasgo, como se pretende. Por ejemplo, la aplicación del modelo a menudo indica que la categoría neutral no representa un nivel de actitud o rasgo entre las categorías de acuerdo y desacuerdo.

No todos los conjuntos de ítems con escala Likert se pueden utilizar para la medición de Rasch. Los datos deben comprobarse minuciosamente para cumplir con los estrictos axiomas formales del modelo. Sin embargo, las puntuaciones brutas son estadísticas suficientes para las medidas de Rasch, una elección deliberada de Georg Rasch , por lo que, si está preparado para aceptar las puntuaciones brutas como válidas, entonces también puede aceptar las medidas de Rasch como válidas.

Presentación visual de datos de tipo Likert

Una parte importante del análisis y la presentación de datos es la visualización (o representación gráfica) de los mismos. El tema de la representación gráfica de datos de calificación Likert (y otros) se analiza en profundidad en dos artículos de Robbins y Heiberger. [18] En el primero, recomiendan el uso de lo que denominan gráficos de barras apiladas divergentes y los comparan con otros estilos de representación gráfica. El segundo artículo [19] describe el uso de la función Likert en el paquete HH para R y ofrece muchos ejemplos de su uso.

Nivel de medición

A menudo se cree que las cinco categorías de respuesta representan un nivel de intervalo de medición . Pero esto solo puede ser así si los intervalos entre los puntos de la escala corresponden a observaciones empíricas en un sentido métrico. Reips y Funke (2008) [20] muestran que este criterio se cumple mucho mejor con una escala analógica visual . De hecho, también pueden aparecer fenómenos que incluso cuestionen el nivel de escala ordinal en escalas Likert. [21] Por ejemplo, en un conjunto de ítems A ,  B ,  C calificados con una escala Likert pueden aparecer relaciones circulares como A  >  B , B  >  C y C  >  A. Esto viola el axioma de transitividad para la escala ordinal.

Las investigaciones de Labovitz [22] y Traylor [23] proporcionan evidencia de que, incluso con distorsiones bastante grandes de las distancias percibidas entre los puntos de la escala, los ítems de tipo Likert tienen un desempeño cercano al de las escalas que se perciben como intervalos iguales. Por lo tanto, estos ítems y otras escalas que parecen iguales en los cuestionarios son resistentes a las violaciones del supuesto de distancias iguales que muchos investigadores creen que se requiere para los procedimientos y pruebas estadísticas paramétricas.

Pronunciación

Rensis Likert , el desarrollador de la escala, pronunció su nombre / ˈlɪkərt / LIK -ərt . [ 24] [25] Algunos han afirmado que el nombre de Likert "es uno de los más mal pronunciados en [el] campo", [ 26 ] porque muchas personas pronuncian el nombre de la escala como / ˈl aɪkərt / LY - kərt .

Véase también

Notas

  1. ^ Comúnmente se pronuncia mal como / ˈ l k ər t / LY -kərt

Referencias

  1. ^ Wuensch, Karl L. (4 de octubre de 2005). "¿Qué es una escala Likert? ¿Y cómo se pronuncia 'Likert'?". Universidad de Carolina del Este . Consultado el 16 de diciembre de 2023 .
  2. ^ Likert, Rensis (1932). "Una técnica para la medición de actitudes". Archivos de Psicología . 140 : 1–55.
  3. ^ Spector, Paul E (1992). Construcción de una escala de calificación sumada . Sage.
  4. ^ abc Derrick, B; White, P (2017). "Comparación de dos muestras de una pregunta Likert individual". Revista internacional de matemáticas y estadística . 18 (3): 1–13.
  5. ^ ab Carifio, James; Perla, Rocco (2007). "Diez malentendidos comunes, conceptos erróneos, mitos persistentes y leyendas urbanas sobre las escalas Likert y los formatos de respuesta Likert y sus antídotos". Revista de Ciencias Sociales . 3 (3): 106–116. doi :10.3844/jssp.2007.106.116.
  6. ^ Burns, Alvin; Burns, Ronald (2008). Investigación básica de marketing (segunda edición). Nueva Jersey: Pearson Education. pp. 245. ISBN 978-0-13-205958-9.
  7. ^ van Alphen, A.; Halfens, R.; Hasman, A.; Imbos, T. (1994). "¿Likert o Rasch? Nada es más aplicable que una buena teoría". Journal of Advanced Nursing . 20 (1): 196–201. doi :10.1046/j.1365-2648.1994.20010196.x. PMID  7930122.
  8. ^ Rusch, Thomas; Lowry, Paul B.; Mair, Patrick; Treiblmaier, Horst (2017). "Liberarse de las limitaciones de la teoría clásica de las pruebas: desarrollo y medición de escalas de sistemas de información utilizando la teoría de respuesta a los ítems" (PDF) . Información y gestión . 54 (2): 189–203. doi :10.1016/j.im.2016.06.005.
  9. ^ Burns, Alvin; Burns, Ronald (2008). Investigación básica de marketing (segunda edición). Nueva Jersey: Pearson Education. pp. 250. ISBN 978-0-13-205958-9.
  10. ^ Allen, Elaine; Seaman, Christopher (2007). "Escalas de Likert y análisis de datos". Quality Progress . págs. 64–65.
  11. ^ Armstrong, Robert (1987). "El punto medio en una escala tipo Likert de cinco puntos". Perceptual and Motor Skills . 64 (2): 359–362. doi :10.2466/pms.1987.64.2.359. S2CID  145705789.
  12. ^ Jamieson, Susan (2004). "Escalas Likert: cómo (ab)utilizarlas" (PDF) . Educación médica . 38 (12): 1217–1218. doi :10.1111/j.1365-2929.2004.02012.x. PMID  15566531. S2CID  42509064.
  13. ^ ab Norman, Geoff (2010). "Escalas Likert, niveles de medición y las "leyes" de la estadística". Avances en Educación en Ciencias de la Salud . 15 (5): 625–632. doi :10.1007/s10459-010-9222-y. PMID  20146096. S2CID  6566608.
  14. ^ "Explicación de la escala Likert: con un ejemplo interactivo". SurveyKing . Consultado el 13 de agosto de 2017 .
  15. ^ Pratt, J. (1959). "Observaciones sobre ceros y empates en los procedimientos de rangos con signo de Wilcoxon". Revista de la Asociación Estadounidense de Estadística . 54 (287): 655–667. doi :10.1080/01621459.1959.10501526.
  16. ^ Mogey, Nora (25 de marzo de 1999). "So You Want to Use a Likert Scale?" [¿Entonces quiere usar una escala Likert?]. Learning Technology Dissemination Initiative [Iniciativa de difusión de tecnología de aprendizaje ]. Heriot-Watt University . Consultado el 30 de abril de 2009 .
  17. ^ Liddell, T.; Kruschke, J. (2018). "Análisis de datos ordinales con modelos métricos: ¿Qué podría salir mal?". Journal of Experimental Social Psychology . 79 : 328–348. doi :10.1016/j.jesp.2018.08.009. hdl : 2022/21970 .
  18. ^ Robbins, NB; Heiberger, RM (2011). "Gráficos de Likert y otras escalas de calificación" (PDF) . Actas de la JSM, Sección sobre métodos de investigación de encuestas . Asociación Estadounidense de Estadística. págs. 1058–1066.
  19. ^ Heiberger, RM; Robbins, NB (2014). "Diseño de gráficos de barras apiladas divergentes para escalas Likert y otras aplicaciones". Journal of Statistical Software . Vol. 57. Asociación Estadounidense de Estadística. págs. 1–32. doi :10.18637/jss.v057.i05. S2CID  61139330.
  20. ^ Reips, Ulf-Dietrich; Funke, Frederik (2008). "Medición del nivel de intervalo con escalas analógicas visuales en la investigación basada en Internet: generador VAS". Métodos de investigación del comportamiento . 40 (3): 699–704. doi : 10.3758/BRM.40.3.699 . PMID  18697664.
  21. ^ Johanson, George A.; Gips, Crystal J. (12-16 de abril de 1993). Intransitividad de comparación por pares: ¿información útil o molestia? (PDF) . Reunión anual de la Asociación Estadounidense de Investigación Educativa. Atlanta, GA.
  22. ^ Labovitz, S. (1967). "Algunas observaciones sobre medición y estadística". Fuerzas sociales . 46 (2): 151–160. doi :10.2307/2574595. JSTOR  2574595.
  23. ^ Traylor, Mark (octubre de 1983). "Escalamiento ordinal e interválico". Revista de la Sociedad de Investigación de Mercados . 25 (4): 297–303.
  24. ^ Babbie, Earl R. (2005). Los fundamentos de la investigación social . Belmont, CA: Thomson Wadsworth. pág. 174. ISBN 978-0-534-63036-2.
  25. ^ Meyers, Lawrence S.; Guarino, Anthony; Gamst, Glenn (2005). Investigación multivariante aplicada: diseño e interpretación . Sage Publications. pág. 20. ISBN. 978-1-4129-0412-4.
  26. ^ Latham, Gary P. (2006). Motivación laboral: historia, teoría, investigación y práctica . Thousand Oaks, California: Sage Publications. pág. 15. ISBN 978-0-7619-2018-2.
  • Trochim, William MK (20 de octubre de 2006). "Likert Scaling". Base de conocimientos sobre métodos de investigación, 2.ª edición . Consultado el 30 de abril de 2009 .
  • Galili, Tal (7 de abril de 2010). «Matriz de diagrama de dispersión de correlación para datos categóricos ordenados». Blog de estadísticas R. Consultado el 7 de noviembre de 2017 .
  • Uebersax, John S. Escalas de Likert: disipando la confusión. 2006.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Likert_scale&oldid=1250169143"