Este artículo tiene varios problemas. Ayúdenos a mejorarlo o a discutir estos problemas en la página de discusión . ( Aprenda cómo y cuándo eliminar estos mensajes )
|
La validez interna es el grado en el que una evidencia respalda una afirmación sobre causa y efecto , dentro del contexto de un estudio en particular. Es una de las propiedades más importantes de los estudios científicos y es un concepto importante en el razonamiento sobre la evidencia en general. La validez interna está determinada por qué tan bien un estudio puede descartar explicaciones alternativas para sus hallazgos (generalmente, fuentes de error sistemático o 'sesgo'). Contrasta con la validez externa , el grado en el que los resultados pueden justificar conclusiones sobre otros contextos (es decir, el grado en el que los resultados pueden generalizarse ). Tanto la validez interna como la externa pueden describirse utilizando formas cualitativas o cuantitativas de notación causal .
Se dice que las inferencias poseen validez interna si se demuestra adecuadamente una relación causal entre dos variables . [1] [2] Se puede realizar una inferencia causal válida cuando se cumplen tres criterios:
En el ámbito de los experimentos científicos, los investigadores suelen cambiar el estado de una variable (la variable independiente ) para ver qué efecto tiene sobre una segunda variable (la variable dependiente ). [3] Por ejemplo, un investigador podría manipular la dosis de un fármaco en particular entre diferentes grupos de personas para ver qué efecto tiene sobre la salud. En este ejemplo, el investigador quiere hacer una inferencia causal, es decir, que diferentes dosis del fármaco pueden ser responsables de los cambios o diferencias observados. Cuando el investigador puede atribuir con confianza los cambios o diferencias observados en la variable dependiente a la variable independiente (es decir, cuando el investigador observa una asociación entre estas variables y puede descartar otras explicaciones o hipótesis rivales ), entonces se dice que la inferencia causal es válida internamente. [4]
En muchos casos, sin embargo, el tamaño de los efectos encontrados en la variable dependiente puede no depender únicamente de
Más bien, una serie de variables o circunstancias no controladas (o incontrolables) pueden llevar a explicaciones adicionales o alternativas (a) de los efectos encontrados y/o (b) de la magnitud de los efectos encontrados. Por lo tanto, la validez interna es más una cuestión de grado que de una u otra, y es exactamente por eso que los diseños de investigación distintos de los verdaderos experimentos también pueden producir resultados con un alto grado de validez interna.
Para permitir inferencias con un alto grado de validez interna, se pueden tomar precauciones durante el diseño del estudio. Como regla general, las conclusiones basadas en la manipulación directa de la variable independiente permiten una mayor validez interna que las conclusiones basadas en una asociación observada sin manipulación.
Si se considera únicamente la validez interna, los diseños experimentales verdaderos altamente controlados (es decir, con selección aleatoria, asignación aleatoria a los grupos de control o experimentales, instrumentos confiables, procesos de manipulación confiables y salvaguardas contra factores de confusión) pueden ser el "estándar de oro" de la investigación científica. Sin embargo, los mismos métodos utilizados para aumentar la validez interna también pueden limitar la generalización o validez externa de los hallazgos. Por ejemplo, estudiar el comportamiento de los animales en un zoológico puede facilitar la extracción de inferencias causales válidas dentro de ese contexto, pero estas inferencias pueden no generalizarse al comportamiento de los animales en la naturaleza. En general, un experimento típico en un laboratorio, que estudia un proceso particular, puede dejar de lado muchas variables que normalmente afectan fuertemente a ese proceso en la naturaleza.
Para recordar ocho de estas amenazas a la validez interna, utilicemos el acrónimo mnemotécnico THIS MESS [5] , que significa:
Cuando no se sabe qué variable cambió primero, puede ser difícil determinar qué variable es la causa y cuál es el efecto.
Una de las principales amenazas a la validez de las inferencias causales es la confusión : los cambios en la variable dependiente pueden atribuirse más bien a variaciones en una tercera variable relacionada con la variable manipulada. Cuando no se pueden descartar relaciones espurias , pueden desarrollarse hipótesis rivales a la inferencia causal original.
El sesgo de selección se refiere al problema de que, en la prueba previa, existen diferencias entre los grupos que pueden interactuar con la variable independiente y, por lo tanto, ser "responsables" del resultado observado. Los investigadores y los participantes aportan al experimento una gran variedad de características, algunas aprendidas y otras inherentes. Por ejemplo, sexo, peso, color de pelo, ojos y piel, personalidad, capacidades mentales y físicas, pero también actitudes como la motivación o la voluntad de participar.
Durante la etapa de selección del estudio de investigación, si un número desigual de sujetos de prueba tienen variables relacionadas con el sujeto similares, existe una amenaza para la validez interna. Por ejemplo, un investigador creó dos grupos de prueba, el grupo experimental y el grupo de control. Los sujetos de ambos grupos no son iguales con respecto a la variable independiente, pero son similares en una o más de las variables relacionadas con el sujeto.
La autoselección también tiene un efecto negativo en el poder interpretativo de la variable dependiente. Esto ocurre a menudo en las encuestas en línea, donde los individuos de grupos demográficos específicos optan por participar en la prueba en mayor proporción que otros grupos demográficos.
Los eventos fuera del estudio/experimento o entre mediciones repetidas de la variable dependiente pueden afectar las respuestas de los participantes a los procedimientos experimentales. A menudo, se trata de eventos de gran escala (desastre natural, cambio político, etc.) que afectan las actitudes y conductas de los participantes de tal manera que resulta imposible determinar si cualquier cambio en las mediciones dependientes se debe a la variable independiente o al evento histórico.
Los sujetos cambian durante el transcurso del experimento o incluso entre mediciones. Por ejemplo, los niños pequeños pueden madurar y su capacidad de concentración puede cambiar a medida que crecen. Tanto los cambios permanentes, como el crecimiento físico, como los temporales, como la fatiga, proporcionan explicaciones alternativas "naturales"; por lo tanto, pueden cambiar la forma en que un sujeto reaccionaría a la variable independiente. Por lo tanto, una vez finalizado el estudio, el investigador puede no ser capaz de determinar si la causa de la discrepancia se debe al tiempo o a la variable independiente.
Medir repetidamente a los participantes puede generar sesgos. Los participantes pueden recordar las respuestas correctas o pueden estar condicionados a saber que están siendo evaluados. Realizar repetidamente pruebas de inteligencia (las mismas o similares) generalmente conduce a mejoras en las puntuaciones, pero en lugar de concluir que las habilidades subyacentes han cambiado para siempre, esta amenaza a la validez interna proporciona una buena hipótesis rival.
El instrumento utilizado durante el proceso de prueba puede cambiar el experimento. Esto también se refiere a que los observadores estén más concentrados o preparados, o que hayan cambiado inconscientemente los criterios que utilizan para emitir juicios. Esto también puede ser un problema con las medidas de autoinforme proporcionadas en diferentes momentos. En este caso, el impacto puede mitigarse mediante el uso de pruebas previas retrospectivas. Si se produce algún cambio en la instrumentación, la validez interna de la conclusión principal se ve afectada, ya que hay explicaciones alternativas fácilmente disponibles.
Este tipo de error se produce cuando se seleccionan sujetos en función de puntuaciones extremas (muy alejadas de la media) durante una prueba. Por ejemplo, cuando se selecciona a niños con las peores puntuaciones en lectura para participar en un curso de lectura, las mejoras al final del curso pueden deberse a una regresión hacia la media y no a la eficacia del curso. Si los niños hubieran sido evaluados nuevamente antes de que comenzara el curso, probablemente habrían obtenido mejores puntuaciones de todos modos. Del mismo modo, es más probable que los valores atípicos extremos en las puntuaciones individuales se detecten en una instancia de la prueba, pero es probable que evolucionen hacia una distribución más normal con la repetición de la prueba.
Este error se produce si se hacen inferencias basándose únicamente en los participantes que han participado desde el principio hasta el final. Sin embargo, los participantes pueden haber abandonado el estudio antes de su finalización, e incluso puede que debido al estudio, programa o experimento en sí. Por ejemplo, el porcentaje de miembros del grupo que habían dejado de fumar en la prueba posterior fue mucho mayor en un grupo que había recibido un programa de formación para dejar de fumar que en el grupo de control. Sin embargo, en el grupo experimental solo el 60% había completado el programa. Si esta deserción está sistemáticamente relacionada con alguna característica del estudio, la administración de la variable independiente, la instrumentación o si el abandono conduce a un sesgo relevante entre los grupos, es posible toda una clase de explicaciones alternativas que expliquen las diferencias observadas.
Esto ocurre cuando interactúan las variables relacionadas con el sujeto, color de pelo, color de piel, etc., y las variables relacionadas con el tiempo, edad, tamaño físico, etc. Si se produce una discrepancia entre los dos grupos entre las pruebas, la discrepancia puede deberse a las diferencias de edad en las categorías de edad.
Si los efectos del tratamiento se propagan de los grupos de tratamiento a los grupos de control, puede observarse una ausencia de diferencias entre los grupos experimental y de control. Sin embargo, esto no significa que la variable independiente no tenga efecto o que no exista relación entre la variable dependiente y la independiente.
El comportamiento de los grupos de control puede cambiar como resultado del estudio. Por ejemplo, los miembros del grupo de control pueden esforzarse más para comprobar que no se demuestra la superioridad esperada del grupo experimental. Una vez más, esto no significa que la variable independiente no haya producido ningún efecto o que no exista una relación entre la variable dependiente y la independiente. Por el contrario, los cambios en la variable dependiente pueden verse afectados únicamente por un grupo de control desmoralizado, que trabaje menos o esté menos motivado, no por la variable independiente.
El sesgo del experimentador se produce cuando los individuos que llevan a cabo un experimento afectan inadvertidamente el resultado al comportarse inconscientemente de manera diferente a los miembros de los grupos de control y experimental. Es posible eliminar la posibilidad de sesgo del experimentador mediante el uso de diseños de estudio de doble ciego , en los que el experimentador no es consciente de la condición a la que pertenece un participante.
Los experimentos que tienen una alta validez interna pueden producir fenómenos y resultados que no tienen relevancia en la vida real, lo que da lugar al problema de la validez interna mutua. [6] [7] Surge cuando los investigadores utilizan resultados experimentales para desarrollar teorías y luego utilizan esas teorías para diseñar experimentos de prueba de teorías. Esta retroalimentación mutua entre experimentos y teorías puede conducir a teorías que explican solo fenómenos y resultados en entornos de laboratorio artificiales, pero no en la vida real.