Psicometría

Teoría y técnica de la medición psicológica

La psicometría es un campo de estudio dentro de la psicología que se ocupa de la teoría y la técnica de la medición . La psicometría generalmente cubre campos especializados dentro de la psicología y la educación dedicados a las pruebas, la medición, la evaluación y las actividades relacionadas. [1] La psicometría se ocupa de la medición objetiva de constructos latentes que no se pueden observar directamente. Algunos ejemplos de constructos latentes incluyen la inteligencia , la introversión , los trastornos mentales y el rendimiento educativo . [2] Los niveles de los individuos en variables latentes no observables se infieren a través de modelos matemáticos basados ​​en lo que se observa a partir de las respuestas de los individuos a los elementos de las pruebas y las escalas. [2]

Los profesionales se describen como psicometristas, aunque no todos los que se dedican a la investigación psicométrica se conocen con este título. Los psicometristas suelen poseer cualificaciones específicas, como títulos o certificaciones, y la mayoría son psicólogos con formación de posgrado avanzada en psicometría y teoría de la medición. Además de las instituciones académicas tradicionales, los profesionales también trabajan para organizaciones como Educational Testing Service y Psychological Corporation . Algunos investigadores psicométricos se centran en la construcción y validación de instrumentos de evaluación, incluidas encuestas , escalas y cuestionarios abiertos o cerrados . Otros se centran en la investigación relacionada con la teoría de la medición (por ejemplo, teoría de respuesta a los ítems , correlación intraclase ) o se especializan como profesionales del aprendizaje y el desarrollo .

Fundación histórica

Las pruebas psicológicas provienen de dos corrientes de pensamiento: la primera, de Darwin , Galton y Cattell , sobre la medición de las diferencias individuales, y la segunda, de Herbart , Weber , Fechner y Wundt y sus mediciones psicofísicas de un constructo similar. El segundo grupo de individuos y su investigación es lo que ha llevado al desarrollo de la psicología experimental y las pruebas estandarizadas. [3]

Corriente victoriana

Charles Darwin fue la inspiración detrás de Francis Galton, un científico que impulsó el desarrollo de la psicometría. En 1859, Darwin publicó su libro El origen de las especies . Darwin describió el papel de la selección natural en el surgimiento, a lo largo del tiempo, de diferentes poblaciones de especies de plantas y animales. El libro mostró cómo los miembros individuales de una especie difieren entre sí y cómo poseen características que son más o menos adaptativas a su entorno. Aquellos con características más adaptativas tienen más probabilidades de sobrevivir para procrear y dar lugar a otra generación. Aquellos con características menos adaptativas tienen menos probabilidades. Estas ideas estimularon el interés de Galton en el estudio de los seres humanos y cómo se diferencian entre sí y cómo medir esas diferencias.

Galton escribió un libro titulado Genio hereditario , que se publicó por primera vez en 1869. El libro describía las diferentes características que poseen las personas y cómo esas características hacen que algunas sean más "aptas" que otras. Hoy en día, estas diferencias, como el funcionamiento sensorial y motor (tiempo de reacción, agudeza visual y fuerza física), son dominios importantes de la psicología científica. Gran parte del trabajo teórico y aplicado inicial en psicometría se realizó en un intento de medir la inteligencia . Galton, a menudo denominado "el padre de la psicometría", ideó e incluyó pruebas mentales entre sus medidas antropométricas . James McKeen Cattell , un pionero en el campo de la psicometría, continuó ampliando el trabajo de Galton. Cattell acuñó el término prueba mental y es responsable de la investigación y el conocimiento que finalmente llevaron al desarrollo de las pruebas modernas. [4]

Corriente alemana

El origen de la psicometría también tiene conexiones con el campo relacionado de la psicofísica . Casi al mismo tiempo que Darwin, Galton y Cattell hacían sus descubrimientos, Herbart también estaba interesado en "desvelar los misterios de la conciencia humana" a través del método científico. [4] Herbart fue responsable de la creación de modelos matemáticos de la mente, que influyeron en las prácticas educativas de los años siguientes.

EH Weber se basó en el trabajo de Herbart e intentó demostrar la existencia de un umbral psicológico, diciendo que era necesario un estímulo mínimo para activar un sistema sensorial . Después de Weber, GT Fechner amplió el conocimiento que obtuvo de Herbart y Weber, para idear la ley de que la fuerza de una sensación crece como el logaritmo de la intensidad del estímulo. A Wilhelm Wundt , seguidor de Weber y Fechner, se le atribuye la fundación de la ciencia de la psicología. Es la influencia de Wundt la que allanó el camino para que otros desarrollaran pruebas psicológicas. [4]

Siglo XX

En 1936, el psicometrista LL Thurstone , fundador y primer presidente de la Sociedad Psicométrica, desarrolló y aplicó un enfoque teórico de la medición conocido como la ley del juicio comparativo , un enfoque que tiene estrechas conexiones con la teoría psicofísica de Ernst Heinrich Weber y Gustav Fechner . Además, Spearman y Thurstone hicieron importantes contribuciones a la teoría y aplicación del análisis factorial , un método estadístico desarrollado y utilizado ampliamente en psicometría. [5] A fines de la década de 1950, Leopold Szondi hizo una evaluación histórica y epistemológica del impacto del pensamiento estadístico en la psicología durante las décadas anteriores: "en las últimas décadas, el pensamiento específicamente psicológico ha sido casi completamente suprimido y eliminado, y reemplazado por un pensamiento estadístico. Precisamente aquí vemos el cáncer de la testología y la testomanía de hoy". [6]

Más recientemente, la teoría psicométrica se ha aplicado a la medición de la personalidad, las actitudes , las creencias y el rendimiento académico . Estos constructos latentes no se pueden medir realmente, y gran parte de la investigación y la ciencia en esta disciplina se han desarrollado en un intento de medir estos constructos lo más cerca posible de la puntuación real.

Entre las figuras que hicieron contribuciones significativas a la psicometría se incluyen Karl Pearson , Henry F. Kaiser, Carl Brigham , LL Thurstone , EL Thorndike , Georg Rasch , Eugene Galanter , Johnson O'Connor , Frederic M. Lord , Ledyard R Tucker , Louis Guttman y Jane Loevinger .

Definición de medición en las ciencias sociales

La definición de medición en las ciencias sociales tiene una larga historia. Una definición muy extendida en la actualidad, propuesta por Stanley Smith Stevens , es que la medición es "la asignación de numerales a objetos o eventos de acuerdo con alguna regla". Esta definición fue introducida en un artículo de Science de 1946 en el que Stevens propuso cuatro niveles de medición . [7] Aunque ampliamente adoptada, esta definición difiere en aspectos importantes de la definición más clásica de medición adoptada en las ciencias físicas, a saber, que la medición científica implica "la estimación o descubrimiento de la relación entre alguna magnitud de un atributo cuantitativo y una unidad del mismo atributo" (p. 358) [8]

De hecho, la definición de medición de Stevens fue propuesta en respuesta al Comité Británico Ferguson, cuyo presidente, A. Ferguson, era físico. El comité fue designado en 1932 por la Asociación Británica para el Avance de la Ciencia para investigar la posibilidad de estimar cuantitativamente los eventos sensoriales. Aunque su presidente y otros miembros eran físicos, el comité también incluía a varios psicólogos. El informe del comité destacó la importancia de la definición de medición. Si bien la respuesta de Stevens fue proponer una nueva definición, que ha tenido una influencia considerable en el campo, esta no fue de ninguna manera la única respuesta al informe. Otra respuesta, notablemente diferente, fue aceptar la definición clásica, como se refleja en la siguiente declaración:

La medición en psicología y física no es en ningún sentido diferente. Los físicos pueden medir cuando pueden encontrar las operaciones mediante las cuales pueden cumplir los criterios necesarios; los psicólogos tienen que hacer lo mismo. No necesitan preocuparse por las misteriosas diferencias entre el significado de la medición en las dos ciencias (Reese, 1943, p. 49). [9]

Estas respuestas divergentes se reflejan en enfoques alternativos de medición. Por ejemplo, los métodos basados ​​en matrices de covarianza se emplean normalmente bajo la premisa de que los números, como las puntuaciones brutas derivadas de las evaluaciones, son mediciones. Tales enfoques implican implícitamente la definición de medición de Stevens, que sólo exige que los números se asignen de acuerdo con alguna regla. Por lo tanto, se considera generalmente que la principal tarea de investigación es el descubrimiento de asociaciones entre las puntuaciones y de los factores que se postulan como subyacentes a dichas asociaciones. [10]

Por otra parte, cuando se emplean modelos de medición como el modelo de Rasch , los números no se asignan en función de una regla. En cambio, de acuerdo con la declaración de Reese antes mencionada, se establecen criterios específicos para la medición y el objetivo es construir procedimientos u operaciones que proporcionen datos que cumplan con los criterios pertinentes. Las mediciones se estiman en función de los modelos y se realizan pruebas para determinar si se han cumplido los criterios pertinentes. [ cita requerida ]

Instrumentos y procedimientos

Los primeros instrumentos psicométricos fueron diseñados para medir la inteligencia . [11] Uno de los primeros métodos para medir la inteligencia fue el test desarrollado en Francia por Alfred Binet y Theodore Simon . Ese test se conocía como Test Binet-Simon  [fr] . El test francés fue adaptado para su uso en los EE. UU. por Lewis Terman de la Universidad de Stanford y se denominó Test de CI Stanford-Binet .

Otro de los principales enfoques de la psicometría ha sido la evaluación de la personalidad . Ha habido una variedad de enfoques teóricos para conceptualizar y medir la personalidad, aunque no hay una teoría ampliamente consensuada. Algunos de los instrumentos más conocidos incluyen el Inventario Multifásico de Personalidad de Minnesota , el Modelo de Cinco Factores (o "Big 5") y herramientas como el Inventario de Personalidad y Preferencias y el Indicador de Tipo Myers-Briggs . Las actitudes también se han estudiado ampliamente utilizando enfoques psicométricos. [ cita requerida ] [12] Un método alternativo implica la aplicación de modelos de medición desdoblados, siendo el más general el Modelo del Coseno Hiperbólico (Andrich y Luo, 1993). [13]

Enfoques teóricos

Los psicometristas han desarrollado varias teorías de medición diferentes, entre ellas la teoría clásica de los tests (TCT) y la teoría de la respuesta al ítem (TRI). [14] [15] Un enfoque que parece matemáticamente similar a la TRI, pero también bastante distintivo en términos de sus orígenes y características, está representado por el modelo de Rasch para la medición. El desarrollo del modelo de Rasch, y la clase más amplia de modelos a la que pertenece, se basó explícitamente en los requisitos de medición en las ciencias físicas. [16]

Los psicometristas también han desarrollado métodos para trabajar con grandes matrices de correlaciones y covarianzas. Las técnicas de esta tradición general incluyen: análisis factorial , [17] un método para determinar las dimensiones subyacentes de los datos. Uno de los principales desafíos que enfrentan los usuarios del análisis factorial es la falta de consenso sobre los procedimientos apropiados para determinar el número de factores latentes . [18] Un procedimiento habitual es detener la factorización cuando los valores propios caen por debajo de uno porque la esfera original se encoge. La falta de puntos de corte también afecta a otros métodos multivariados. [19]

El escalamiento multidimensional [20] es un método para encontrar una representación simple de datos con una gran cantidad de dimensiones latentes. El análisis de conglomerados es un enfoque para encontrar objetos que sean similares entre sí. El análisis factorial, el escalamiento multidimensional y el análisis de conglomerados son métodos descriptivos multivariados que se utilizan para extraer estructuras más simples de grandes cantidades de datos.

Más recientemente, el modelado de ecuaciones estructurales [21] y el análisis de trayectorias representan enfoques más sofisticados para trabajar con matrices de covarianza grandes. Estos métodos permiten ajustar modelos estadísticamente sofisticados a los datos y probarlos para determinar si son ajustes adecuados. Debido a que a un nivel granular la investigación psicométrica se ocupa del alcance y la naturaleza de la multidimensionalidad en cada uno de los elementos de interés, un procedimiento relativamente nuevo conocido como análisis bifactorial [22] [23] [24] puede ser útil. El análisis bifactorial puede descomponer "la varianza sistemática de un elemento en términos de, idealmente, dos fuentes, un factor general y una fuente de varianza sistemática adicional". [25]

Conceptos clave

Los conceptos clave de la teoría clásica de las pruebas son la fiabilidad y la validez . Una medida fiable es aquella que mide un constructo de forma consistente a lo largo del tiempo, de individuos y de situaciones. Una medida válida es aquella que mide lo que se pretende medir. La fiabilidad es necesaria, pero no suficiente, para la validez.

Tanto la fiabilidad como la validez pueden evaluarse estadísticamente. La consistencia en medidas repetidas de la misma prueba puede evaluarse con el coeficiente de correlación de Pearson, y a menudo se denomina fiabilidad test-retest. [26] De manera similar, la equivalencia de diferentes versiones de la misma medida puede indexarse ​​mediante una correlación de Pearson , y se denomina fiabilidad de formas equivalentes o un término similar. [26]

La consistencia interna, que aborda la homogeneidad de una única forma de prueba, se puede evaluar correlacionando el rendimiento en dos mitades de una prueba, lo que se denomina confiabilidad de mitad dividida ; el valor de este coeficiente de correlación de momento de producto de Pearson para dos mitades de pruebas se ajusta con la fórmula de predicción de Spearman-Brown para que corresponda a la correlación entre dos pruebas de longitud completa. [26] Quizás el índice de confiabilidad más comúnmente utilizado es el α de Cronbach , que es equivalente a la media de todos los coeficientes de mitad dividida posibles. Otros enfoques incluyen la correlación intraclase , que es la relación entre la varianza de las mediciones de un objetivo dado y la varianza de todos los objetivos.

Existen varias formas diferentes de validez. La validez relacionada con el criterio se refiere al grado en que una prueba o escala predice una muestra de comportamiento, es decir, el criterio, que es "externo al instrumento de medición en sí". [27] Esa muestra externa de comportamiento puede ser muchas cosas, incluida otra prueba; el promedio de calificaciones de la universidad como cuando se usa el SAT de la escuela secundaria para predecir el rendimiento en la universidad; e incluso el comportamiento que ocurrió en el pasado, por ejemplo, cuando se usa una prueba de síntomas psicológicos actuales para predecir la ocurrencia de victimización pasada (que representaría con precisión la postdicción). Cuando la medida del criterio se recopila al mismo tiempo que la medida que se está validando, el objetivo es establecer la validez concurrente ; cuando el criterio se recopila más tarde, el objetivo es establecer la validez predictiva . Una medida tiene validez de constructo si está relacionada con medidas de otros constructos como lo requiere la teoría. La validez de contenido es una demostración de que los elementos de una prueba hacen un trabajo adecuado para cubrir el dominio que se está midiendo. En un ejemplo de selección de personal, el contenido de la prueba se basa en una declaración definida o un conjunto de declaraciones de conocimientos, habilidades, capacidades u otras características obtenidas de un análisis de trabajo .

La teoría de respuesta a los ítems modela la relación entre los rasgos latentes y las respuestas a los ítems de un test. Entre otras ventajas, la TRI proporciona una base para obtener una estimación de la ubicación de un sujeto en un test en relación con un rasgo latente dado, así como el error estándar de medición de esa ubicación. Por ejemplo, el conocimiento de historia de un estudiante universitario puede deducirse de su puntuación en un test universitario y luego compararse de manera confiable con el conocimiento de un estudiante de secundaria deducido de una prueba menos difícil. Las puntuaciones derivadas de la teoría clásica de los tests no tienen esta característica, y la evaluación de la capacidad real (en lugar de la capacidad relativa a otros sujetos) debe evaluarse comparando las puntuaciones con las de un "grupo de normas" seleccionado al azar de la población. De hecho, todas las medidas derivadas de la teoría clásica de los tests dependen de la muestra examinada, mientras que, en principio, las derivadas de la teoría de respuesta a los ítems no lo son.

Estándares de calidad

Las consideraciones de validez y confiabilidad suelen considerarse elementos esenciales para determinar la calidad de cualquier prueba. Sin embargo, las asociaciones profesionales y de profesionales con frecuencia han situado estas preocupaciones dentro de contextos más amplios al desarrollar estándares y emitir juicios generales sobre la calidad de cualquier prueba en su conjunto dentro de un contexto determinado. Una consideración que preocupa en muchos entornos de investigación aplicada es si la métrica de un inventario psicológico determinado es significativa o arbitraria. [28]

Normas de prueba

En 2014, la Asociación Estadounidense de Investigación Educativa (AERA), la Asociación Estadounidense de Psicología (APA) y el Consejo Nacional de Medición en Educación (NCME) publicaron una revisión de los Estándares para Pruebas Educativas y Psicológicas [29] , que describe los estándares para el desarrollo, la evaluación y el uso de pruebas. Los Estándares cubren temas esenciales en las pruebas, incluyendo validez, confiabilidad/errores de medición y equidad en las pruebas. El libro también establece estándares relacionados con las operaciones de prueba, incluyendo diseño y desarrollo de pruebas, puntajes, escalas, normas, vinculación de puntajes, puntajes de corte, administración de pruebas, puntuación, informes, interpretación de puntajes, documentación de pruebas y derechos y responsabilidades de los examinados y usuarios de las pruebas. Finalmente, los Estándares cubren temas relacionados con las aplicaciones de pruebas, incluyendo pruebas y evaluaciones psicológicas , pruebas y acreditaciones en el lugar de trabajo , pruebas y evaluaciones educativas y pruebas en la evaluación de programas y políticas públicas.

Normas de evaluación

En el campo de la evaluación , y en particular de la evaluación educativa , el Comité Conjunto de Normas para la Evaluación Educativa [30] ha publicado tres conjuntos de normas para las evaluaciones: las Normas de Evaluación del Personal [31] , publicadas en 1988; las Normas de Evaluación de Programas (segunda edición) [32] , publicadas en 1994; y las Normas de Evaluación de Estudiantes [33], publicadas en 2003.

Cada publicación presenta y elabora un conjunto de estándares para su uso en una variedad de entornos educativos. Los estándares proporcionan pautas para diseñar, implementar, evaluar y mejorar la forma identificada de evaluación. [34] Cada uno de los estándares se ha colocado en una de cuatro categorías fundamentales para promover evaluaciones educativas que sean adecuadas, útiles, factibles y precisas. En estos conjuntos de estándares, las consideraciones de validez y confiabilidad se cubren bajo el tema de precisión. Por ejemplo, los estándares de precisión para estudiantes ayudan a garantizar que las evaluaciones de los estudiantes proporcionarán información sólida, precisa y creíble sobre el aprendizaje y el desempeño de los estudiantes.

Polémica y críticas

Debido a que la psicometría se basa en procesos psicológicos latentes medidos a través de correlaciones , ha habido controversia sobre algunas medidas psicométricas. [35] [ página necesaria ] Los críticos, incluidos los profesionales de las ciencias físicas , han argumentado que dicha definición y cuantificación es difícil, y que tales mediciones a menudo son mal utilizadas por los legos, como con las pruebas de personalidad utilizadas en los procedimientos de empleo. Los Estándares para la Medición Educativa y Psicológica dan la siguiente declaración sobre la validez de las pruebas : "la validez se refiere al grado en que la evidencia y la teoría respaldan las interpretaciones de las puntuaciones de las pruebas que implican los usos propuestos de las pruebas". [36] En pocas palabras, una prueba no es válida a menos que se use e interprete de la manera prevista. [37]

Dos tipos de herramientas utilizadas para medir los rasgos de personalidad son las pruebas objetivas y las medidas proyectivas . Ejemplos de tales pruebas son: Big Five Inventory (BFI), Minnesota Multiphasic Personality Inventory (MMPI-2), Rorschach Inkblot test , Neurotic Personality Questionnaire KON-2006 , [38] o Eysenck Personality Questionnaire . Algunas de estas pruebas son útiles porque tienen una fiabilidad y validez adecuadas , dos factores que hacen que las pruebas reflejen de manera consistente y precisa el constructo subyacente. El Myers–Briggs Type Indicator (MBTI), sin embargo, tiene una validez cuestionable y ha sido objeto de muchas críticas. El especialista en psicometría Robert Hogan escribió sobre la medida: "La mayoría de los psicólogos de la personalidad consideran al MBTI como poco más que una elaborada galleta china de la suerte". [39]

Lee Cronbach señaló en American Psychologist (1957) que "la psicología correlacional, aunque tan antigua como la experimentación, tardó más en madurar. Sin embargo, también puede calificarse como disciplina porque plantea un tipo de pregunta distintivo y tiene métodos técnicos para examinar si la pregunta se ha planteado correctamente y los datos se han interpretado correctamente". Continuó diciendo: "El método de correlación, por su parte, puede estudiar lo que el hombre no ha aprendido a controlar o nunca puede esperar controlar... Se requiere una verdadera federación de las disciplinas. Si se mantienen independientes, sólo pueden dar respuestas erróneas o ninguna respuesta en absoluto con respecto a ciertos problemas importantes". [40]

No humanos: animales y máquinas

La psicometría se ocupa de las capacidades, actitudes, rasgos y evolución educativa de los seres humanos . Cabe destacar que el estudio del comportamiento, los procesos mentales y las capacidades de los animales no humanos suele ser abordado por la psicología comparada o, con un continuo entre los animales no humanos y el resto de animales, por la psicología evolutiva . No obstante, hay algunos defensores de una transición más gradual entre el enfoque adoptado para los seres humanos y el enfoque adoptado para los animales (no humanos). [41] [42] [43] [44]

La evaluación de las capacidades, rasgos y evolución del aprendizaje de las máquinas ha sido en su mayor parte ajena al caso de los humanos y animales no humanos, con enfoques específicos en el área de la inteligencia artificial . También se ha propuesto un enfoque más integrado, bajo el nombre de psicometría universal . [45] [46]

Véase también

Referencias

  1. ^ "Glosario1". 22 de julio de 2017. Archivado desde el original el 22 de julio de 2017. Consultado el 28 de junio de 2022 .
  2. ^ ab Tabachnick, BG; Fidell, LS (2001). Uso del análisis multivariado . Boston: Allyn and Bacon. ISBN 978-0-321-05677-1.[ página necesaria ]
  3. ^ Kaplan, RM y Saccuzzo, DP (2010). Pruebas psicológicas: principios, aplicaciones y problemas. (8.ª ed.). Belmont, CA: Wadsworth, Cengage Learning.
  4. ^ abc Kaplan, RM y Saccuzzo, DP (2010). Pruebas psicológicas: principios, aplicaciones y problemas (8.ª ed.). Belmont, CA: Wadsworth, Cengage Learning.
  5. ^ Nunnally, J., y Berstein, IH (1994). Teoría psicométrica (3.ª ed.). Nueva York: McGraw-Hill.
  6. ^ Leopold Szondi (1960) Das zweite Buch: Lehrbuch der Experimentellen Triebdiagnostik . Huber, Berna y Stuttgart, 2.ª edición. Ch.27, De la traducción al español, B)II Las condiciones estadisticas , p.396. Cotización:

    el pensamiento psicológico específico, en las últimas décadas, fue suprimido y eliminado casi totalmente, siendo sustituido por un pensamiento estadístico. Precisamente aquí vemos el cáncer de la testología y testomanía de hoy.

  7. ^ Stevens, SS (7 de junio de 1946). "Sobre la teoría de las escalas de medición". Science . 103 (2684): 677–680. Bibcode :1946Sci...103..677S. doi :10.1126/science.103.2684.677. PMID  17750512. S2CID  4667599.
  8. ^ Michell, Joel (agosto de 1997). "Ciencia cuantitativa y la definición de medición en psicología". British Journal of Psychology . 88 (3): 355–383. doi :10.1111/j.2044-8295.1997.tb02641.x.
  9. ^ Reese, TW (1943). La aplicación de la teoría de la medición física a la medición de magnitudes psicológicas, con tres ejemplos experimentales. Psychological Monographs, 55 , 1–89. doi :10.1037/h0061367
  10. ^ "Psicometría". Assessmentpsychology.com . Consultado el 28 de junio de 2022 .
  11. ^ Stern, Theodore A.; Fava, Maurizio; Wilens, Timothy E.; Rosenbaum, Jerrold F. (2016). Psiquiatría clínica integral del Hospital General de Massachusetts (segunda edición). Londres. pág. 73. ISBN 978-0323295079. Recuperado el 31 de octubre de 2021 .{{cite book}}: CS1 maint: location missing publisher (link)
  12. ^ Longe, Jacqueline L., ed. (2022). La enciclopedia Gale de psicología . Vol. 2 (4.ª ed.). Farmington Hills, Michigan: Gale. pág. 1000. ISBN 9780028683867.
  13. ^ Andrich, D. y Luo, G. (1993). Un modelo de rasgo latente de coseno hiperbólico para el desarrollo de respuestas dicotómicas a un único estímulo. Applied Psychological Measurement, 17, 253–276.
  14. ^ Embretson, SE y Reise, SP (2000). Teoría de respuesta al ítem para psicólogos . Mahwah, NJ: Erlbaum.
  15. ^ Hambleton, RK y Swaminathan, H. (1985). Teoría de respuesta al ítem: principios y aplicaciones. Boston: Kluwer-Nijhoff.
  16. ^ Rasch, G. (1960/1980). Modelos probabilísticos para algunas pruebas de inteligencia y logros . Copenhague, Instituto Danés de Investigación Educativa, edición ampliada (1980) con prólogo y epílogo de BD Wright. Chicago: The University of Chicago Press.
  17. ^ Thompson, BR (2004). Análisis factorial exploratorio y confirmatorio: comprensión de conceptos y aplicaciones. Asociación Estadounidense de Psicología.
  18. ^ Zwick, William R.; Velicer, Wayne F. (1986). "Comparación de cinco reglas para determinar el número de componentes a retener". Psychological Bulletin . 99 (3): 432–442. doi :10.1037/0033-2909.99.3.432.
  19. ^ Singh, Manoj Kumar (11 de septiembre de 2021). Introducción a la psicología social. Publicaciones KK.
  20. ^ Davison, ML (1992). Escalamiento multidimensional. Krieger.
  21. ^ Kaplan, D. (2008). Modelado de ecuaciones estructurales: fundamentos y extensiones , 2.ª ed. Sage.
  22. ^ DeMars, CE (2013). Un tutorial sobre la interpretación de las puntuaciones del modelo bifactorial. International Journal of Testing, 13 , 354–378. http://dx.doi.org/10.1080/15305058.2013.799067
  23. ^ Reise, SP (2012). El redescubrimiento del modelado bifactorial. Multivariate Behavioral Research, 47 , 667–696. http://dx.doi.org/10.1080/00273171.2012.715555
  24. ^ Rodríguez, A., Reise, SP, y Haviland, MG (2016). Evaluación de modelos bifactoriales: cálculo e interpretación de índices estadísticos. Psychological Methods, 21 , 137–150. http://dx.doi.org/10.1037/met0000045
  25. ^ Schonfeld, IS, Verkuilen, J. y Bianchi, R. (2019). Un enfoque analítico bifactorial de modelado de ecuaciones estructurales exploratorio para descubrir qué miden las escalas de agotamiento, depresión y ansiedad. Psychological Assessment, 31 , 1073–1079. http://dx.doi.org/10.1037/pas0000721 ​​p. 1075
  26. ^ abc "Inicio – Fundamentos de investigación educativa por Del Siegle". www.gifted.uconn.edu . 17 de febrero de 2015.
  27. ^ Nunnally, JC (1978). Teoría psicométrica (2.ª ed.). Nueva York: McGraw-Hill.
  28. ^ Blanton, H., y Jaccard, J. (2006). Métricas arbitrarias en psicología. Archivado el 10 de mayo de 2006 en Wayback Machine. American Psychologist, 61 (1), 27–41.
  29. ^ "Los estándares para las pruebas educativas y psicológicas". apa.org .
  30. ^ "Comité conjunto sobre normas para la evaluación educativa". Archivado desde el original el 15 de octubre de 2009. Consultado el 28 de junio de 2022 .
  31. ^ Comité Conjunto de Normas para la Evaluación Educativa. (1988). Normas de evaluación del personal: cómo evaluar los sistemas de evaluación de los educadores. Archivado el 12 de diciembre de 2005 en Wayback Machine . Newbury Park, CA: Sage Publications.
  32. ^ Comité Conjunto de Normas para la Evaluación Educativa. (1994). Normas de evaluación de programas, 2.ª edición. Archivado el 22 de febrero de 2006 en Wayback Machine . Newbury Park, CA: Sage Publications.
  33. ^ Comité de Normas para la Evaluación Educativa. (2003). Normas de evaluación de los estudiantes: cómo mejorar las evaluaciones de los estudiantes. Archivado el 24 de mayo de 2006 en Wayback Machine. Newbury Park, CA: Corwin Press.
  34. ^ [ E. Cabrera-Nguyen (2010). "Directrices para los autores para la presentación de resultados de desarrollo y validación de escalas en la revista Journal of the Society for Social Work and Research]". Academia.edu . 1 (2): 99–103.
  35. ^ Tabachnick, BG; Fidell, LS (2001). Uso del análisis multivariante . Boston: Allyn and Bacon. ISBN 978-0-321-05677-1.
  36. ^ Asociación Estadounidense de Investigación Educativa, Asociación Estadounidense de Psicología y Consejo Nacional de Medición en Educación. (1999) Estándares para pruebas educativas y psicológicas . Washington, DC: Asociación Estadounidense de Investigación Educativa.
  37. ^ Bandalos, Deborah L. (2018). Teoría de la medición y aplicaciones para las ciencias sociales. Nueva York. p. 261. ISBN 978-1-4625-3215-5.OCLC 1015955756  .{{cite book}}: CS1 maint: location missing publisher (link)
  38. ^ Aleksandrowicz JW, Klasa K, Sobański JA, Stolarska D (2009). «Cuestionario de Personalidad Neurótica KON-2006» (PDF) . Archivos de Psiquiatría y Psicoterapia . 1 : 21–22.
  39. ^ Hogan, Robert (2007). Personalidad y destino de las organizaciones . Mahwah, NJ: Lawrence Erlbaum Associates . p. 28. ISBN. 978-0-8058-4142-8.OCLC 65400436  .
  40. ^ Cronbach, LJ (1957). "Las dos disciplinas de la psicología científica". American Psychologist . 12 (11): 671–684. doi :10.1037/h0043943 – vía EBSCO.
  41. ^ Humphreys, LG (1987). "Consideraciones psicométricas en la evaluación de las diferencias intraespecies en inteligencia". Behav Brain Sci . 10 (4): 668–669. doi :10.1017/s0140525x0005514x.
  42. ^ Eysenck, HJ (1987). "Los diversos significados de la inteligencia". Behav Brain Sci . 10 (4): 663. doi :10.1017/s0140525x00055060.
  43. ^ Locurto, C. y Scanlon, C (1987). "Diferencias individuales y factor de aprendizaje espacial en dos cepas de ratones". Behav Brain Sci . 112 : 344–352.
  44. ^ King, James E y Figueredo, Aurelio Jose (1997). "El modelo de cinco factores más dominancia en la personalidad del chimpancé". Revista de investigación en personalidad . 31 (2): 257–271. doi :10.1006/jrpe.1997.2179.
  45. ^ J. Hernández-Orallo; DL Dowe; MV Hernández-Lloreda (2013). "Psicometría universal: medición de las capacidades cognitivas en el reino de las máquinas" (PDF) . Cognitive Systems Research . 27 : 50–74. doi :10.1016/j.cogsys.2013.06.001. hdl : 10251/50244 . S2CID  26440282.
  46. ^ Hernández-Orallo, José (2017). La medida de todas las mentes: evaluación de la inteligencia natural y artificial. Cambridge: Cambridge University Press. ISBN 978-1-107-15301-1.

Bibliografía

  • Andrich, D. y Luo, G. (1993). "Un modelo de coseno hiperbólico para desplegar respuestas dicotómicas a un solo estímulo" (PDF) . Medición psicológica aplicada . 17 (3): 253–276. CiteSeerX  10.1.1.1003.8107 . doi :10.1177/014662169301700307. S2CID  120745971.
  • Michell, J. (1999). Medición en psicología . Cambridge: Cambridge University Press. doi :10.1017/CBO9780511490040
  • Rasch, G. (1960/1980). Probabilistic models for some intelligence and attainment tests (Modelos probabilísticos para algunas pruebas de inteligencia y rendimiento ). Copenhague, Instituto Danés de Investigación Educativa), edición ampliada (1980) con prólogo y epílogo de BD Wright. Chicago: The University of Chicago Press.
  • Reese, TW (1943). La aplicación de la teoría de la medición física a la medición de magnitudes psicológicas, con tres ejemplos experimentales. Psychological Monographs, 55 , 1–89. doi :10.1037/h0061367
  • Stevens, SS (1946). "Sobre la teoría de escalas de medición". Science . 103 (2684): 677–80. Bibcode :1946Sci...103..677S. doi :10.1126/science.103.2684.677. PMID  17750512.
  • Thurstone, LL (1927). "Una ley del juicio comparativo". Psychological Review . 34 (4): 278–286. doi :10.1037/h0070288.
  • Thurstone, LL (1929). La medición del valor psicológico. En TV Smith y WK Wright (Eds.), Ensayos de filosofía de diecisiete doctores en filosofía de la Universidad de Chicago . Chicago: Open Court.
  • Thurstone, LL (1959). La medición de valores . Chicago: The University of Chicago Press.
  • SF Blinkhorn (1997). "Pasado imperfecto, futuro condicional: cincuenta años de teoría de tests". British Journal of Mathematical and Statistical Psychology . 50 (2): 175–185. doi :10.1111/j.2044-8317.1997.tb01139.x.
  • Sanford, David (18 de noviembre de 2017). "Cambridge me acaba de decir que el Big Data aún no funciona". LinkedIn .

Lectura adicional

  • Normas APA para pruebas educativas y psicológicas
  • Fondo de elementos de personalidad internacional
  • Comité Conjunto sobre Normas de Evaluación Educativa
  • El Centro de Psicometría de la Universidad de Cambridge
  • Página de inicio de la Sociedad Psicométrica y Psychometrika
  • Laboratorio Psicométrico de Londres
Retrieved from "https://en.wikipedia.org/w/index.php?title=Psychometrics&oldid=1251782229"