MEDIDAS CIENTíFICAS: FIABILIDAD Y VALIDEZ

Medidas científicas: fiabilidad y validez

La confiabilidad es una medida de la consistencia y estabilidad internas de un dispositivo de medición.

La validez nos da una indicación de si el dispositivo de medición mide lo que dice.

La consistencia interna es el grado en que los ítems o preguntas de la medida evalúan consistentemente el mismo constructo. Cada pregunta debe tener como objetivo medir lo mismo. La consistencia interna a menudo se mide utilizando el Alfa de Cronbach, una supercorrelación de todos los elementos de la escala. Si la puntuación es de .70 o más, la medición es aceptable. Sin embargo, es preferible .80 o más. También es importante considerar el contexto al considerar el puntaje que refleja la consistencia interna.

La estabilidad a menudo se mide mediante la confiabilidad de prueba / reprueba. La misma persona toma la misma prueba dos veces y se comparan las puntuaciones de cada prueba. Una alta correlación entre las dos puntuaciones de la prueba implica que la prueba es confiable. En la mayoría de las circunstancias, se considera aceptable una correlación de al menos .70. Sin embargo, esta es una pauta general y no una prueba estadística.

La confiabilidad entre evaluadores es otro coeficiente de confiabilidad que a veces se usa para evaluar la confiabilidad. Con la confiabilidad entre evaluadores, diferentes jueces o evaluadores (dos o más) hacen observaciones, registran sus hallazgos y luego comparan sus observaciones. Si los evaluadores son confiables, el porcentaje de acuerdo debería ser alto.

Al preguntarnos si una medida es válida, nos preguntamos si mide lo que se supone que debe ser. La validez es un juicio basado en datos recopilados, no una prueba estadística. Hay dos formas principales de determinar la validez: medidas existentes y diferencias de grupo conocidas.

La prueba de medidas existentes determina si la nueva medida se correlaciona con medidas válidas relevantes existentes. La nueva medida debe ser similar a las medidas que se han registrado con dispositivos de medición válidos ya establecidos.

Las diferencias de grupo conocidas determinan si la nueva medida distingue entre diferencias de grupo conocidas. Se ve una ilustración de las diferencias de grupo conocidas cuando a diferentes grupos se les da la misma medida y se espera que obtengan una puntuación diferente. Por ejemplo, si les dieras a demócratas y republicanos una prueba para evaluar la solidez de ciertos puntos de vista políticos, esperarías que obtengan una puntuación diferente. Sus puntos de vista son sustancialmente diferentes en muchos temas. Si estos dos grupos puntuaron de manera diferente, como se esperaba, podríamos decir que la medida indica validez: la medida de lo que dice medir.

Al diseñar nuevos dispositivos de medición, es imperativo tener en cuenta su fiabilidad y validez. Una medida puede ser confiable y no válida. Pero una medida válida es siempre una medida fiable.