Parte de una serie sobre |
Sociología |
---|
Una escala de Likert (/ˈlɪkərt / LIK - ərt , [ 1 ] [ nota 1] ) es una escala psicométrica que lleva el nombre de su inventor, el psicólogo social estadounidense Rensis Likert , [2] que se utiliza comúnmente en cuestionarios de investigación . Es el enfoque más utilizado para escalar respuestas en la investigación de encuestas, de modo que el término (o más completamente la escala de tipo Likert ) a menudo se usa indistintamente con escala de calificación , aunque existen otros tipos de escalas de calificación.
Likert distingue entre una escala propiamente dicha, que surge de las respuestas colectivas a un conjunto de ítems (normalmente ocho o más), y el formato en el que las respuestas se califican a lo largo de un rango. Técnicamente hablando, una escala Likert se refiere únicamente a la primera. [3] [4] La diferencia entre estos dos conceptos tiene que ver con la distinción que hace Likert entre el fenómeno subyacente que se investiga y los medios para capturar la variación que apunta al fenómeno subyacente. [5]
Al responder a un ítem de Likert, los encuestados especifican su nivel de acuerdo o desacuerdo en una escala simétrica de acuerdo-desacuerdo para una serie de afirmaciones. De este modo, el rango refleja la intensidad de sus sentimientos respecto de un ítem determinado. [6]
Una escala puede crearse como la simple suma o promedio de las respuestas del cuestionario sobre el conjunto de ítems individuales (preguntas). Al hacerlo, la escala Likert supone que las distancias entre cada opción (opción de respuesta) son iguales. Muchos investigadores emplean un conjunto de tales ítems que están altamente correlacionados (que muestran una alta consistencia interna ) pero también que juntos capturarán el dominio completo en estudio (lo que requiere correlaciones menos que perfectas). Otros se adhieren a un estándar por el cual "se supone que todos los ítems son réplicas unos de otros o, en otras palabras, los ítems se consideran instrumentos paralelos". [7] : 197 Por el contrario, la teoría de pruebas moderna trata la dificultad de cada ítem (los ICC ) como información que se debe incorporar en los ítems de escala. [8]
This section needs additional citations for verification. (June 2023) |
Una escala Likert es la suma de respuestas a varios ítems de Likert . Debido a que muchas escalas Likert emparejan cada ítem de Likert constituyente con su propia instancia de una escala analógica visual (por ejemplo, una línea horizontal, en la que el sujeto indica una respuesta haciendo un círculo o marcando las marcas de verificación), a veces se hace referencia erróneamente a un ítem individual como si fuera o tuviera una escala, y este error crea una confusión generalizada en la literatura y el lenguaje del campo.
Un ítem Likert es simplemente una afirmación que se le pide al encuestado que evalúe dándole un valor cuantitativo en cualquier tipo de dimensión subjetiva u objetiva, siendo el nivel de acuerdo/desacuerdo la dimensión más comúnmente utilizada. Los ítems Likert bien diseñados exhiben tanto "simetría" como "equilibrio". Simetría significa que contienen cantidades iguales de posiciones positivas y negativas cuyas distancias respectivas son bilateralmente simétricas respecto del valor "neutral"/cero (ya sea que ese valor se presente o no como candidato). Equilibrio significa que la distancia entre cada valor candidato es la misma, lo que permite que las comparaciones cuantitativas, como el promedio, sean válidas entre ítems que contienen más de dos valores candidatos. [9]
El formato de un elemento Likert típico de cinco niveles, por ejemplo, podría ser:
La escala Likert es un método de escala bipolar que mide la respuesta positiva o negativa a una afirmación. A veces se utiliza una escala de puntos iguales, en la que la opción intermedia de "ni de acuerdo ni en desacuerdo" no está disponible. A esto a veces se le llama método de "elección forzada", ya que se elimina la opción neutral. [10] La opción neutral puede verse como una opción fácil de tomar cuando un encuestado no está seguro, por lo que es cuestionable si es una opción verdaderamente neutral. Un estudio de 1987 encontró diferencias insignificantes entre el uso de "indeciso" y "neutral" como opción intermedia en una escala Likert de cinco puntos. [11]
Las escalas Likert pueden estar sujetas a distorsiones por diversas causas. Los encuestados pueden:
El diseño de una escala con una codificación equilibrada (un número igual de afirmaciones positivas y negativas y, especialmente, un número igual de afirmaciones positivas y negativas con respecto a cada posición o tema en cuestión) puede obviar el problema del sesgo de aquiescencia, ya que la aquiescencia en los ítems con codificación positiva equilibrará la aquiescencia en los ítems con codificación negativa, pero los sesgos defensivos, de tendencia central y de deseabilidad social son algo más problemáticos.
Una vez completado el cuestionario, cada ítem puede analizarse por separado o, en algunos casos, las respuestas a los ítems pueden sumarse para crear una puntuación para un grupo de ítems. Por ello, las escalas Likert suelen denominarse escalas sumativas.
En la literatura [12] [13] existe un considerable desacuerdo sobre si los ítems de Likert individuales pueden considerarse datos de nivel de intervalo o si deben tratarse como datos categóricos ordenados, y hay convicciones firmes sobre cuáles son los métodos más aplicables. Este desacuerdo se remonta, en muchos aspectos, al grado en que los ítems de Likert se interpretan como datos ordinales .
Hay dos consideraciones principales en esta discusión. En primer lugar, las escalas Likert son arbitrarias. El valor asignado a un ítem Likert no tiene una base numérica objetiva, ni en términos de teoría de la medida ni de escala (a partir de la cual se puede determinar una métrica de distancia ). El valor asignado a cada ítem Likert es simplemente determinado por el investigador que diseña la encuesta, quien toma la decisión basándose en un nivel de detalle deseado. Sin embargo, por convención, a los ítems Likert se les suelen asignar valores enteros positivos progresivos. Las escalas Likert suelen oscilar entre 2 y 10, siendo 3, 5 o 7 los más comunes. [14] Además, esta estructura progresiva de la escala es tal que cada ítem Likert sucesivo se trata como si indicara una respuesta "mejor" que el valor anterior. (Esto puede diferir en los casos en que se necesita un orden inverso de la escala Likert).
El segundo punto, y posiblemente el más importante, es si la "distancia" entre cada categoría sucesiva de ítems es equivalente, lo que se infiere tradicionalmente. Por ejemplo, en el ítem Likert de cinco puntos mencionado anteriormente, la inferencia es que la "distancia" entre la categoría 1 y 2 es la misma que entre la categoría 3 y 4. En términos de una buena práctica de investigación, una presentación equidistante por parte del investigador es importante; de lo contrario, puede resultar un sesgo en el análisis. Por ejemplo, es poco probable que un ítem Likert de cuatro puntos con las categorías "Malo", "Promedio", "Bueno" y "Muy bueno" tenga todas las categorías equidistantes, ya que solo hay una categoría que puede recibir una calificación por debajo del promedio. Podría decirse que esto sesgaría cualquier resultado a favor de un resultado positivo. Por otro lado, incluso si un investigador presenta lo que él o ella cree que son categorías equidistantes, es posible que el encuestado no lo interprete como tal.
Una buena escala Likert, como la anterior, presentará una simetría de categorías en torno a un punto medio con calificadores lingüísticos claramente definidos. En una escala simétrica de este tipo, los atributos equidistantes normalmente se observarán con mayor claridad o, al menos, se inferirán. Cuando una escala Likert es simétrica y equidistante, se comportará más como una medición a nivel de intervalo. Por lo tanto, si bien una escala Likert es de hecho ordinal , si se presenta bien, puede aproximarse a una medición a nivel de intervalo. Esto puede ser beneficioso ya que, si se tratara simplemente como una escala ordinal, se podría perder información valiosa si la "distancia" entre los elementos de Likert no estuviera disponible para su consideración. La idea importante aquí es que el tipo apropiado de análisis depende de cómo se haya presentado la escala Likert.
La validez de tales medidas depende de la naturaleza de intervalo subyacente de la escala. Si se supone que la naturaleza de intervalo es para una comparación de dos grupos, la prueba t de muestras pareadas no es inapropiada. [4] Si se deben realizar pruebas no paramétricas, se recomienda la modificación de Pratt (1959) [15] a la prueba de rangos con signo de Wilcoxon en lugar de la prueba de rangos con signo de Wilcoxon estándar . [4]
Las respuestas a varias preguntas Likert pueden sumarse siempre que todas las preguntas utilicen la misma escala Likert y que la escala sea una aproximación defendible a una escala de intervalo, en cuyo caso el teorema del límite central permite el tratamiento de los datos como datos de intervalo que miden una variable latente. [ cita requerida ] Si las respuestas sumadas cumplen estos supuestos, se pueden aplicar pruebas estadísticas paramétricas como el análisis de varianza . Los puntos de corte típicos para pensar que esta aproximación será aceptable son un mínimo de cuatro y preferiblemente ocho elementos en la suma. [5] [13]
Para modelar directamente las respuestas binarias de Likert, se pueden representar en forma binomial sumando las respuestas de acuerdo y desacuerdo por separado. La prueba de chi-cuadrado , la prueba Q de Cochran o la prueba de McNemar son procedimientos estadísticos comunes utilizados después de esta transformación. Las pruebas no paramétricas como la prueba de chi-cuadrado , la prueba de Mann-Whitney , la prueba de rangos con signo de Wilcoxon o la prueba de Kruskal-Wallis [16] se utilizan a menudo en el análisis de datos de escala Likert .
Como alternativa, las respuestas de la escala Likert se pueden analizar con un modelo probit ordenado , preservando el orden de las respuestas sin asumir una escala de intervalo. El uso de un modelo probit ordenado puede evitar errores que surgen al tratar las calificaciones ordenadas como mediciones a nivel de intervalo. [17] La evaluación basada en el consenso (CBA) se puede utilizar para crear un estándar objetivo para las escalas Likert en dominios donde no existe un estándar generalmente aceptado u objetivo. La evaluación basada en el consenso (CBA) se puede utilizar para refinar o incluso validar estándares generalmente aceptados. [ cita requerida ]
Una práctica común para analizar las respuestas a colecciones de ítems de la escala Likert es resumirlas a través de un modelo de variable latente , por ejemplo utilizando el análisis factorial o la teoría de respuesta al ítem .
En principio, los datos de la escala Likert pueden utilizarse como base para obtener estimaciones de nivel de intervalo en un continuo mediante la aplicación del modelo politómico de Rasch , cuando se pueden obtener datos que se ajusten a este modelo. Además, el modelo politómico de Rasch permite probar la hipótesis de que las afirmaciones reflejan niveles crecientes de una actitud o rasgo, como se pretende. Por ejemplo, la aplicación del modelo a menudo indica que la categoría neutral no representa un nivel de actitud o rasgo entre las categorías de acuerdo y desacuerdo.
No todos los conjuntos de ítems con escala Likert se pueden utilizar para la medición de Rasch. Los datos deben comprobarse minuciosamente para cumplir con los estrictos axiomas formales del modelo. Sin embargo, las puntuaciones brutas son estadísticas suficientes para las medidas de Rasch, una elección deliberada de Georg Rasch , por lo que, si está preparado para aceptar las puntuaciones brutas como válidas, entonces también puede aceptar las medidas de Rasch como válidas.
Una parte importante del análisis y la presentación de datos es la visualización (o representación gráfica) de los mismos. El tema de la representación gráfica de datos de calificación Likert (y otros) se analiza en profundidad en dos artículos de Robbins y Heiberger. [18] En el primero, recomiendan el uso de lo que denominan gráficos de barras apiladas divergentes y los comparan con otros estilos de representación gráfica. El segundo artículo [19] describe el uso de la función Likert en el paquete HH para R y ofrece muchos ejemplos de su uso.
A menudo se cree que las cinco categorías de respuesta representan un nivel de intervalo de medición . Pero esto solo puede ser así si los intervalos entre los puntos de la escala corresponden a observaciones empíricas en un sentido métrico. Reips y Funke (2008) [20] muestran que este criterio se cumple mucho mejor con una escala analógica visual . De hecho, también pueden aparecer fenómenos que incluso cuestionen el nivel de escala ordinal en escalas Likert. [21] Por ejemplo, en un conjunto de ítems A , B , C calificados con una escala Likert pueden aparecer relaciones circulares como A > B , B > C y C > A. Esto viola el axioma de transitividad para la escala ordinal.
Las investigaciones de Labovitz [22] y Traylor [23] proporcionan evidencia de que, incluso con distorsiones bastante grandes de las distancias percibidas entre los puntos de la escala, los ítems de tipo Likert tienen un desempeño cercano al de las escalas que se perciben como intervalos iguales. Por lo tanto, estos ítems y otras escalas que parecen iguales en los cuestionarios son resistentes a las violaciones del supuesto de distancias iguales que muchos investigadores creen que se requiere para los procedimientos y pruebas estadísticas paramétricas.
Rensis Likert , el desarrollador de la escala, pronunció su nombre / ˈlɪkərt / LIK -ərt . [ 24] [25] Algunos han afirmado que el nombre de Likert "es uno de los más mal pronunciados en [el] campo", [ 26 ] porque muchas personas pronuncian el nombre de la escala como / ˈl aɪkərt / LY - kərt .