La fiabilidad y la validez son conceptos utilizados para evaluar la calidad de la investigación. Indican lo bien que un método, técnica o prueba mide algo. La fiabilidad se refiere a la consistencia de una medida, y la validez a la precisión de una medida.

Es importante tener en cuenta la fiabilidad y la validez al crear el diseño de la investigación, planificar los métodos y redactar los resultados, especialmente en la investigación cuantitativa.

La fiabilidad y la validez están estrechamente relacionadas, pero significan cosas diferentes. Una medición puede ser fiable sin ser válida. Sin embargo, si una medición es válida, suele ser también fiable.

¿Qué es la fiabilidad?

De acuerdo con Russ-Eft (1980), la fiabilidad se refiere a la constancia con la que un método mide algo. Si se puede obtener el mismo resultado de forma constante utilizando los mismos métodos en las mismas circunstancias, la medición se considera fiable.

Se mide la temperatura de una muestra líquida varias veces en condiciones idénticas. El termómetro muestra siempre la misma temperatura, por lo que los resultados son fiables.

Un médico utiliza un cuestionario de síntomas para diagnosticar a un paciente con una enfermedad de larga duración. Varios médicos diferentes utilizan el mismo cuestionario con el mismo paciente pero dan diagnósticos diferentes. Esto indica que el cuestionario tiene poca fiabilidad como medida de la enfermedad.

¿Qué es la validez?

La validez se refiere a la precisión con la que un método mide lo que pretende medir. Si la investigación tiene una alta validez, significa que produce resultados que se corresponden con las propiedades, características y variaciones reales del mundo físico o social.

Relación entre Fiabilidad y Validez

Una alta fiabilidad es un indicador de que una medición es válida. Si un método no es fiable, probablemente no sea válido.

Por ejemplo, si el termómetro muestra temperaturas diferentes cada vez, aunque se hayan controlado cuidadosamente las condiciones para garantizar que la temperatura de la muestra sea la misma, es probable que el termómetro funcione mal y, por tanto, sus mediciones no sean válidas.

Si un cuestionario de síntomas da lugar a un diagnóstico fiable cuando se responde en diferentes momentos y con diferentes médicos, esto indica que tiene una gran validez como medida de la condición médica.

Sin embargo, la fiabilidad por sí sola no es suficiente para garantizar la validez. Incluso si una prueba es fiable, puede no reflejar con exactitud la situación real.

Medición de la Fiabilidad y la Validez

Un grupo de participantes realiza una prueba diseñada para medir la memoria de trabajo. Los resultados son fiables, pero las puntuaciones de los participantes están fuertemente correlacionadas con su nivel de comprensión lectora. Esto indica que el método podría tener una baja validez: la prueba puede estar midiendo la comprensión lectora de los participantes en lugar de su memoria de trabajo.

La validez es más difícil de evaluar que la fiabilidad, pero es aún más importante. Para obtener resultados útiles, los métodos que utilices para recoger los datos deben ser válidos: la investigación debe medir lo que dice medir. Esto garantiza que la discusión de los datos y las conclusiones que se extraigan sean también válidas.

Cuando se realiza una investigación cuantitativa, hay que tener en cuenta la fiabilidad y la validez de los métodos de investigación y los instrumentos de medición.

Tipos de Fiabilidad

La fiabilidad indica la consistencia con la que un método mide algo. Cuando se aplica el mismo método a la misma muestra en las mismas condiciones, se deberían obtener los mismos resultados. Si no es así, el método de medición puede ser poco fiable.

Según Yang (1995), hay cuatro tipos principales de fiabilidad. Cada uno de ellos puede estimarse comparando diferentes conjuntos de resultados producidos por el mismo método.

Fiabilidad test-retest

La fiabilidad test-retest mide la consistencia de los resultados cuando se repite la misma prueba en la misma muestra en un momento diferente. Se utiliza cuando se mide algo que se espera que permanezca constante en la muestra.

Un test de daltonismo para aspirantes a piloto en prácticas debería tener una alta fiabilidad de test-retest, porque el daltonismo es un rasgo que no cambia con el tiempo.

Por qué es importante

Hay muchos factores que pueden influir en los resultados en diferentes momentos: por ejemplo, los encuestados pueden experimentar diferentes estados de ánimo o las condiciones externas pueden afectar a su capacidad para responder con precisión.

La fiabilidad de la prueba-retest puede utilizarse para evaluar la resistencia de un método a estos factores a lo largo del tiempo. Cuanto menor sea la diferencia entre las dos series de resultados, mayor será la fiabilidad test-retest.

Cómo se mide

Para medir la fiabilidad test-retest, se realiza la misma prueba en el mismo grupo de personas en dos momentos diferentes. A continuación, se calcula la correlación entre los dos conjuntos de resultados.

Ejemplo de fiabilidad test-retest

Se diseña un cuestionario para medir el coeficiente intelectual de un grupo de participantes (una propiedad que probablemente no cambie de forma significativa con el paso del tiempo). Se administra la prueba con dos meses de diferencia al mismo grupo de personas, pero los resultados son significativamente diferentes, por lo que la fiabilidad test-retest del cuestionario de coeficiente intelectual es baja.

Cómo mejorar la fiabilidad de la prueba de retrospección

Cuando diseñe pruebas o cuestionarios, intente formular las preguntas, los enunciados y las tareas de forma que no se vean influidos por el estado de ánimo o la concentración de los participantes.

Al planificar los métodos de recogida de datos, intente minimizar la influencia de factores externos y asegúrese de que todas las muestras se someten a las mismas condiciones.

Recuerde que es de esperar que se produzcan cambios en los participantes a lo largo del tiempo, y téngalos en cuenta.

Fiabilidad entre evaluadores

La fiabilidad de la intercalación (también llamada fiabilidad interobservador) mide el grado de acuerdo entre diferentes personas que observan o evalúan lo mismo. Se utiliza cuando los datos son recogidos por investigadores que asignan calificaciones, puntuaciones o categorías a una o más variables.

En un estudio de observación en el que un equipo de investigadores recoge datos sobre el comportamiento en el aula, la fiabilidad interobservador es importante: todos los investigadores deben estar de acuerdo en cómo categorizar o calificar los diferentes tipos de comportamiento.

Por qué es importante

Las personas son subjetivas, por lo que las percepciones de los distintos observadores sobre las situaciones y los fenómenos difieren naturalmente. Una investigación fiable pretende minimizar la subjetividad en la medida de lo posible, de modo que otro investigador pueda replicar los mismos resultados.

A la hora de diseñar la escala y los criterios para la recogida de datos, es importante asegurarse de que diferentes personas calificarán la misma variable de forma coherente con un sesgo mínimo. Esto es especialmente importante cuando hay varios investigadores implicados en la recogida o el análisis de datos.

Cómo medirla

Para medir la fiabilidad entre evaluadores, diferentes investigadores realizan la misma medición u observación en la misma muestra. A continuación, se calcula la correlación entre sus diferentes conjuntos de resultados. Si todos los investigadores dan calificaciones similares, la prueba tiene una alta fiabilidad entre los evaluadores.

Ejemplo de fiabilidad entre evaluadores

Un equipo de investigadores observa el progreso de la cicatrización de las heridas en los pacientes. Para registrar las etapas de cicatrización, se utilizan escalas de valoración, con un conjunto de criterios para evaluar diversos aspectos de las heridas. Se comparan los resultados de diferentes investigadores que evalúan el mismo conjunto de pacientes, y existe una fuerte correlación entre todos los conjuntos de resultados, por lo que la prueba tiene una alta fiabilidad entre los evaluadores.

Mejora de la fiabilidad entre evaluadores

Defina claramente sus variables y los métodos que se utilizarán para medirlas.

Desarrolle criterios detallados y objetivos sobre cómo se calificarán, contarán o categorizarán las variables.

Si hay varios investigadores implicados, asegúrese de que todos tienen exactamente la misma información y formación.

Fiabilidad de las formas paralelas

La fiabilidad de las formas paralelas mide la correlación entre dos versiones equivalentes de un test. Se utiliza cuando hay dos herramientas de evaluación o conjuntos de preguntas diferentes diseñados para medir lo mismo.

Por qué es importante

Si quieres utilizar varias versiones diferentes de una prueba (por ejemplo, para evitar que los encuestados repitan las mismas respuestas de memoria), primero tienes que asegurarte de que todos los conjuntos de preguntas o mediciones dan resultados fiables.

En la evaluación educativa, a menudo es necesario crear diferentes versiones de las pruebas para garantizar que los alumnos no tengan acceso a las preguntas de antemano. La fiabilidad de las formas paralelas significa que, si los mismos alumnos realizan dos versiones diferentes de una prueba de comprensión lectora, deberían obtener resultados similares en ambas pruebas.

Cómo se mide

La forma más habitual de medir la fiabilidad de las formas paralelas es elaborar un gran conjunto de preguntas para evaluar lo mismo y, a continuación, dividirlas aleatoriamente en dos conjuntos de preguntas.

El mismo grupo de encuestados responde a ambos conjuntos y se calcula la correlación entre los resultados. Una alta correlación entre los dos indica una alta fiabilidad de los formularios paralelos.

Ejemplo de fiabilidad de formularios paralelos

Se formula un conjunto de preguntas para medir la aversión al riesgo financiero en un grupo de encuestados. Las preguntas se dividen aleatoriamente en dos conjuntos, y los encuestados se dividen aleatoriamente en dos grupos. Ambos grupos realizan las dos pruebas: el grupo A realiza primero la prueba A y el grupo B la prueba B. Se comparan los resultados de las dos pruebas y los resultados son casi idénticos, lo que indica una alta fiabilidad de las formas paralelas.

Cómo mejorar la fiabilidad de los formularios paralelos

Asegúrese de que todas las preguntas o ítems del test se basan en la misma teoría y están formulados para medir lo mismo.

Consistencia interna

La consistencia interna evalúa la correlación entre varios ítems de un test que pretenden medir el mismo constructo.

Se puede calcular la consistencia interna sin necesidad de repetir la prueba o de involucrar a otros investigadores, por lo que es una buena forma de evaluar la fiabilidad cuando sólo se dispone de un conjunto de datos.

Por qué es importante

Cuando se diseña un conjunto de preguntas o valoraciones que se combinarán en una puntuación global, hay que asegurarse de que todos los ítems reflejan realmente lo mismo. Si las respuestas a los distintos ítems se contradicen, la prueba podría no ser fiable.

Para medir la satisfacción de los clientes con una tienda online, podría crear un cuestionario con un conjunto de afirmaciones con las que los encuestados deben estar de acuerdo o en desacuerdo. La consistencia interna le indica si todas las afirmaciones son indicadores fiables de la satisfacción del cliente.

Cómo medirla

Para medir la consistencia interna se utilizan dos métodos habituales.

Correlación media entre elementos: Para un conjunto de medidas diseñadas para evaluar el mismo constructo, se calcula la correlación entre los resultados de todos los pares de ítems posibles y luego se calcula la media.

Fiabilidad por mitades: Se divide aleatoriamente un conjunto de medidas en dos conjuntos. Después de probar todo el conjunto con los encuestados, se calcula la correlación entre los dos conjuntos de respuestas.

Ejemplo de consistencia interna

Se presenta a un grupo de encuestados un conjunto de afirmaciones diseñadas para medir la mentalidad optimista y pesimista. Deben calificar su acuerdo con cada afirmación en una escala de 1 a 5. Si la prueba es internamente consistente, un encuestado optimista debería dar generalmente calificaciones altas a los indicadores de optimismo y bajas a los de pesimismo. Se calcula la correlación entre todas las respuestas a las afirmaciones “optimistas”, pero la correlación es muy débil. Esto sugiere que la prueba tiene una baja consistencia interna.

Mejorar la consistencia interna

Hay que tener cuidado a la hora de idear preguntas o medidas: las que pretenden reflejar el mismo concepto deben basarse en la misma teoría y estar cuidadosamente formuladas.

¿Qué tipo de fiabilidad se aplica a mi investigación?

Según Fink (1995), es importante tener en cuenta la fiabilidad cuando se planifica el diseño de la investigación, se recogen y analizan los datos y se redacta la investigación. El tipo de fiabilidad que debes calcular depende del tipo de investigación y de tu metodología.

Cómo garantizar la validez y la fiabilidad de su investigación

La fiabilidad y validez de los resultados depende de la creación de un diseño de investigación sólido, la elección de métodos y muestras adecuados y la realización de la investigación de forma cuidadosa y coherente.

Garantizar la validez

Si se utilizan puntuaciones o clasificaciones para medir variaciones en algo (como rasgos psicológicos, niveles de capacidad o propiedades físicas), es importante que los resultados reflejen las variaciones reales con la mayor precisión posible. La validez debe tenerse en cuenta en las primeras fases de la investigación, cuando se decide cómo se van a recoger los datos.

Elija métodos de medición adecuados

Asegúrese de que el método y la técnica de medición sean de alta calidad y estén orientados a medir exactamente lo que quiere saber. Deben investigarse a fondo y basarse en los conocimientos existentes.

Por ejemplo, para recoger datos sobre un rasgo de la personalidad, puede utilizar un cuestionario estandarizado que se considere fiable y válido. Si desarrolla su propio cuestionario, debe basarse en la teoría establecida o en los resultados de estudios anteriores, y las preguntas deben estar redactadas con cuidado y precisión.

Utilice métodos de muestreo adecuados para seleccionar a los sujetos

Para obtener resultados válidos y generalizables, defina claramente la población que está investigando (por ejemplo, personas de un rango de edad, ubicación geográfica o profesión específicos). Asegúrese de que cuenta con un número suficiente de participantes y de que éstos son representativos de la población.

Garantizar la fiabilidad

La fiabilidad debe tenerse en cuenta durante todo el proceso de recogida de datos. Cuando se utiliza una herramienta o técnica para recoger datos, es importante que los resultados sean precisos, estables y reproducibles.

Aplique sus métodos de forma coherente

Planifique su método cuidadosamente para asegurarse de que realiza los mismos pasos de la misma manera en cada medición. Esto es especialmente importante si participan varios investigadores.

Por ejemplo, si está realizando entrevistas u observaciones, defina claramente cómo se contarán los comportamientos o las respuestas específicas, y asegúrese de que las preguntas se formulan de la misma manera cada vez.

Estandarice las condiciones de su investigación

Cuando recojas los datos, mantén las circunstancias lo más coherentes posible para reducir la influencia de factores externos que puedan crear variaciones en los resultados.

Por ejemplo, en un montaje experimental, asegúrate de que todos los participantes reciben la misma información y se someten a las mismas condiciones.

Dónde escribir sobre fiabilidad y validez en una tesis

Es conveniente hablar de la fiabilidad y la validez en varias secciones de la tesis o disertación. Demostrar que los has tenido en cuenta al planificar tu investigación e interpretar los resultados hace que tu trabajo sea más creíble y digno de confianza.

Nuestros especialistas esperan por ti para que los contactes a través del formulario de cotización o del chat directo. También contamos con canales de comunicación confidenciales como WhatsApp y Messenger. Y si quieres estar al tanto de nuestros novedosos servicios y las diferentes ventajas de contratarnos, síguenos en Facebook, Instagram o Twitter.

Si este artículo fue de tu agrado, no olvides compartirlo por tus redes sociales.

Referencias Bibliográficas

Fink, A., ed. (1995). The survey Handbook, v.1.Thousand Oaks, CA: Sage.

Russ-Eft, D. F. (1980). Validity and reliability in survey research. American Institutes for Research in the Behavioral Sciences August, 227 151.

Yang, G. H., et al. (1995). Experimental and quasi-experimental educational research. Diss. Colorado State University.

Fiabilidad y Validez

Fiabilidad y Validez

Abrir chat
1
Escanea el código
Bienvenido(a) a Online Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!