Validez (psicometría)

propiedad psicométrica de los instrumentos de medida

En el campo de la metrología, psicometría y estadística, la validez es un concepto que hace referencia a la capacidad de un instrumento de medición para cuantificar de forma significativa y adecuada el rasgo para cuya medición ha sido diseñado. De esta forma, un instrumento de medida es válido en la medida en que las evidencias empíricas legitiman la interpretación de las puntuaciones arrojadas por el test.

Consideraciones generales

editar

La constatación de la validez de un instrumento de medida no ofrece mayores problemas cuando se trata de cuantificar variables objetivas, como el peso, la estatura o el volumen. Pero en el caso de variables psicológicas es necesario probar de forma empírica que el instrumento es válido para aquello que dice evaluar. No obstante, más que el test en sí mismo, lo que se somete a validación son las posibles inferencias que se vayan a realizar a partir de los resultados obtenidos. Tanto la fiabilidad como la validez son dos propiedades psicométricas que deben cumplir las interpretaciones e inferencias que se hagan de los resultados obtenidos por los tests psicológicos. La validez, pues, no debe ser una característica propia del test, sino de las generalizaciones y usos específicos de las medidas que el test proporciona.[1]

Es importante señalar que un instrumento de medición no tiene un coeficiente fijo de validez que vaya a servir para cualquier propósito o para cualquier grupo de individuos, sino que siempre dependerá de la correcta elección del criterio a valorar (variable criterio) y la muestra seleccionada.[2]

Existen diversos tipos de validez, conocidas como tipos de evidencias de validez, pero estas subdivisiones no constituyen conceptos que deban ser asumidos como independientes entre sí. Los tipos de validez mantienen una relación de influencia recíproca y conforman las diversas partes de un todo, que es lo que conocemos de forma genérica como "validez".[3]

El término Validez ha estado en constante desarrollo y cambio desde los inicios del siglo XX. Diversos autores ha compartido su definición y enfoque del término a lo largo del tiempo. Actualmente se acepta en general a lo establecido en los "Standards for Educational and Psychological Testing" (en su cuarta edición del 2014) publicados por la AERA (American Educational Research Asociation), la APA (American Psychological Association) y el NCME (National Coucil for Measurement in Education).

Definiciones de validez

editar
  • Desde el punto de vista estadístico, la validez es la proporción de la varianza verdadera que es relevante para los fines de la prueba; es decir, que es atribuible a la variable, características o dimensión que mide la prueba.
  • Desde el punto de vista psicométrico, la validez es el resultado de un proceso de recopilación de evidencias empíricas sustentado en supuestos teóricos que, en suma, permiten emitir un juicio valorativo que afirme la pertinencia y la suficiencia de las interpretaciones basadas en los resultados de una prueba. Este juicio no depende únicamente de los ítems de la prueba, sino también de la muestra sobre la que se efectúe el test, y del contexto de aplicación.[4]

Así, para Messick (1984, pp. 741), «la validez unificada integra consideraciones de contenido, criterio y consecuencias en un marco de referencia de constructo para la evaluación empírica de hipótesis racionales acerca del significado de las puntuaciones y de relaciones relevantes desde el punto de vista teórico, incluyendo las de naturaleza científica y aplicada».[5]

Tipos de Evidencias de Validez

editar

Validez de contenido

editar

Se dice que una prueba o test cumple con las condiciones de validez de contenido si constituye una muestra adecuada y representativa de los contenidos y alcance del constructo o dimensión a evaluar. En los casos en los que la materia objeto de medición se puede precisar con facilidad, la población de contenidos que se pretende evaluar está bien definida, por lo que la selección de los ítems del test no ofrece mayores dificultades, pudiéndose recurrir a métodos estadísticos de muestreo aleatorio para obtener una muestra representativa de ítems. No obstante, en el campo de la psicología no siempre es posible disponer de poblaciones de contenidos bien definidas (por ejemplo, si se pretenden medir variables psicológicas clásicas, como la extraversión, la inteligencia o el liderazgo). En estos casos suele recurrirse a un análisis racional de ítems, consistente en la evaluación de los contenidos del test por parte de un grupo de expertos en el área a tratar.[6]​ La validez de contenido es esencial a la hora de realizar inferencias o generalizaciones a partir de los resultados del test.

Un caso particular de la validez de contenido es la denominada «validez aparente». Una prueba posee una validez aparente adecuada cuando produce en los sujetos a los que se aplica la impresión de que efectivamente es una prueba adecuada. Es un tipo peculiar de validez de contenido, pero que tiene su parte de importancia al poder influir sobre la motivación de los participantes, que pueden mostrar una actitud negativa ante la prueba si no perciben que esta tenga el sentido que se le supone.[3]

Validez de criterio

editar

También conocida como «validez criterial», «validez relativa al criterio» o «validez de pronóstico», se refiere al grado de eficacia con que se puede predecir o pronosticar una variable de interés (criterio) a partir de las puntuaciones en un test. Es frecuente que en los procesos de selección de personal se utilicen instrumentos que pretendan determinar o predecir el rendimiento futuro de los candidatos al puesto de trabajo basándose en las respuestas obtenidas. Para ello es necesario que se haya obtenido una evidencia empírica de que los resultados obtenidos en la prueba correlacionen efectivamente con el rendimiento futuro en el puesto de trabajo.

Así pues, la operacionalización del concepto se realiza a partir del denominado coeficiente de validez, que es la correlación entre el test y el criterio. A mayor correlación, mayor capacidad predictiva del test. Existen distintos diseños experimentales que permiten determinar esta correlación. La elección de un diseño u otro dependerá de las necesidades y circunstancias específicas de cada caso:

  • Validez concurrente o simultánea: El test y el criterio se miden al mismo tiempo (concurrentemente). Puede utilizarse para validar un nuevo test por comparación con otro ya validado previamente.
  • Validez de pronóstico o predictiva: El criterio se mide pasado un periodo de tiempo tras la aplicación del test. Es el tipo más habitual en los procesos de selección de personal, en los que se pretende predecir el rendimiento futuro de los sujetos.
  • Validez retrospectiva: El test se aplica un tiempo después del criterio que se pretende evaluar. Útil cuando se pretende dilucidar mediante una prueba algún aspecto del pasado que actualmente no es accesible.[7][3]

La fórmula general del coeficiente de validez[8]​ es:   [9]

donde "x" hace referencia a las puntuaciones obtenidas en el test, e "y" hace referencia a las puntuaciones obtenidas en la variable criterio.

Validez de constructo

editar

A diferencia de lo que ocurre en otros campos, muchos de los conceptos manejados en el ámbito de la psicología no son directamente observables, por lo que requieren del apoyo de medidas indirectas. Los concepto de peso o volumen son suficientemente tangibles como para no resultar susceptibles de interpretaciones subjetivas al respecto de su significado, pero no ocurre lo mismo en el caso de variables psicológicas como el neuroticismo o la introversión. Estos conceptos precisan del acuerdo o consenso sobre sus significados para poder ser catalogados como útiles y válidos desde un punto de vista científico. La validez de constructo, pues, hace referencia a la recogida de evidencias empíricas que garanticen la existencia de un constructo psicológico en las condiciones exigibles a cualquier otro modelo o teoría científica.[3]​ Por todo ello, la validez de constructo se presenta como una condición indispensable a la hora de valorar la eficacia de un instrumento de evaluación sobre una variable psicológica determinada.

Para Messick (1980; p.1015) «la validez de constructo es el concepto unificador que integra las consideraciones de validez de contenido y de criterio en un marco común para probar hipótesis acerca de relaciones teóricamente relevantes». Asimismo, Cronbach (1984; p.126) refiere que «la meta final de la validación es la explicación y comprensión, y por tanto, esto nos lleva a considerar que toda validación es validación de constructo».[5]

Los procedimientos metodológicos más utilizados para la obtención de datos referentes a la validez de constructos psicológicos han sido el análisis factorial y la matriz multirrasgo-multimétodo. Ambos sistemas son indicadores respectivos de las denominadas "validez factorial" y "validez convergente-discriminante"

Validez factorial

editar

El análisis factorial es una técnica del análisis multivariado que permite realizar una estimación de los factores que dan cuenta de una serie de variables. Se trata de una técnica de reducción de datos que permite encontrar grupos homogéneos de variables a partir de un grupo de variables mucho más numeroso. Los criterios de formación de grupos se basan en la necesidad de que las variables a agrupar correlacionen entre sí, y cumplan el requisito de ser independientes. Es decir, formarán un grupo aquellas variables que, siendo independientes entre sí, muestren un índice de correlación elevado. Así, podremos hablar de validez factorial de un constructo en aquellos casos en los que todas las medidas que se hayan diseñado para evaluarlo arrojen resultados similares al ser sometidas a un análisis factorial. Este análisis puede ser exploratorio, si se realiza con la intención de descubrir la posible estructura subyacente factorial de un conjunto de datos cualesquiera; o confirmatorio, si se realiza con base en unas expectativas y teorías previas al respecto de esa estructura.[10]

Validez convergente-discriminante

editar

Este tipo de validez se determina a partir de los resultados arrojados por la matriz multirrasgo-multimétodo (diseño MRMM, sistematizado por Campbell y Fiske en 1959). El sistema consiste en realizar mediciones de varios rasgos con distintos métodos de medición. De este modo podemos encontrarnos con varios resultados.

  • Validez convergente: existe validez convergente cuando las mediciones del mismo rasgo realizadas con distintos métodos correlacionan entre sí. El hecho de que un mismo rasgo sea detectado por igual con varias metodologías diferentes, es un indicador fiable de la existencia real de ese rasgo. Se dice que en este caso, las medidas convergen.
  • Validez discriminante: se refiere al grado de diferenciación entre distintos constructos a partir de un único sistema de medición. Es decir, las medidas de distintos rasgos por el mismo método muestran una baja correlación en comparación con la que muestran las medidas del mismo rasgo con diferentes métodos, señal de que los rasgos son independientes entre sí, e independientes al sistema de medición empleado.[11]

Véase también

editar

Referencias

editar
  1. Prieto, Gerardo; Delgado, Ana R. (2010). «Fiabilidad y validez». Papeles del psicólogo (España: Consejo General de Colegios Oficiales de Psicólogos) 31 (1): 67-74. ISSN 0214-7823. Consultado el 16 de febrero de 2011. 
  2. Ruiz Bolívar, Carlos. «Validez». Programa Interinstitucional Doctorado en Educación. p. 2. Archivado desde el original el 25 de noviembre de 2011. Consultado el 16 de febrero de 2011. 
  3. a b c d Muñiz, José (1998). «Validez». Teoría clásica de los tests (5ª edición). Madrid: Pirámide. ISBN 843681262X. Consultado el 16 de febrero de 2011. 
  4. Aliaga Tovar, Jaime. «Psicometría: Tests psicométricos, confiabilidad y validez». p. 11. Archivado desde el original el 17 de noviembre de 2011. Consultado el 16 de febrero de 2011. 
  5. a b Pérez-Gil, José Antonio; Chacón Moscoso, Salvador; Moreno Rodríguez, Rafael (2000). «Validez de constructo: El uso del análisis factorial exploratorio-confirmatorio para obtener evidencias de validez». Psicothema 12 (Suplem. 2): 442-446. ISSN 0214-9915. Consultado el 16 de febrero de 2011. 
  6. «Validez de contenido». Archivado desde el original el 15 de octubre de 2010. Consultado el 16 de febrero de 2011. 
  7. Centro Virtual Cervantes. «Validez». Diccionario de términos clave. Consultado el 16 de febrero de 2006. 
  8. Universidad Nacional de Educación a Distancia. «Validez». España. Archivado desde el original el 14 de enero de 2011. Consultado el 17 de febrero de 2011. 
  9. Ruiz Bolívar, Carlos. «VALIDEZ». 24 de noviembre de 2015. Archivado desde el original el 25 de noviembre de 2011. 
  10. Mahía Casado, Ramón. «Análisis factorial». Consultado el 17 de febrero de 2011. 
  11. Tomás, José M.; Oliver, Amparo; Hontangas, Pedro M. (2000). «Análisis factorial confirmatorio de segundo orden y matrices multirrasgo-multimétodo». Psicothema 12 (Suplem. 2): 534-539. ISSN 0214-9915. Consultado el 17 de febrero de 2011. 

Bibliografía

editar
  • Muñiz, José (1998). «Validez». Teoría clásica de los tests (5ª edición). Madrid: Pirámide. ISBN 843681262X. Consultado el 16 de febrero de 2011.