Los diseños de Pre Test y  Post Test se utilizan ampliamente en la investigación del comportamiento. Principalmente con el propósito de comparar grupos y / o medir el cambio resultante de los tratamientos experimentales.

Un diseño de prueba previa y posterior es un experimento en el que se toman medidas en individuos antes y después de que estén involucrados en algún tratamiento.

Investigación cuasi-experimental

Diseño de Pre Test y Post Test

  1. Administre una prueba previa a un grupo de personas y registre sus puntajes.
  2. Administrar algún tratamiento diseñado para cambiar la puntuación de los individuos.
  3. Administre una prueba posterior al mismo grupo de personas y registre sus puntajes.
  4. Analice la diferencia entre los puntajes previos y posteriores a la prueba.

Ejemplo: todos los estudiantes de una determinada clase realizan una prueba previa. Luego, el maestro utiliza una determinada técnica de enseñanza durante una semana y administra una prueba posterior de dificultad similar. Posteriormente, analiza las diferencias entre los puntajes previos y posteriores al examen para ver si la técnica de enseñanza tuvo un efecto significativo en los puntajes.

Investigación experimental

Diseño Pre Test y Post Test con grupo de control

  1. Asignar individuos al azar a un grupo de tratamiento o grupo de control.
  2. Administre la misma prueba previa a todas las personas y registre sus puntajes.
  3. Administrar algún procedimiento de tratamiento a los individuos del grupo de tratamiento y administrar algún procedimiento estándar a los individuos del grupo de control.
  4. Administre la misma prueba posterior a las personas de ambos grupos.
  5. Analice la diferencia entre los puntajes previos y posteriores a la prueba entre el grupo de tratamiento y el grupo de control.

Ejemplo: una maestra divide al azar asigna la mitad de su clase a un grupo de control y la otra mitad a un grupo de tratamiento. Luego utiliza una técnica de enseñanza estándar y una nueva técnica de enseñanza con cada grupo, respectivamente. Esto lo realiza durante una semana y luego administra una prueba posterior de dificultad similar a todos los estudiantes.

Posibles problemas con la validez interna

La validez interna se refiere al grado en que un estudio establece una relación de causa y efecto confiable entre un tratamiento y un resultado.

En un experimento de diseño de prueba previa y posterior, hay varios factores que podrían afectar la validez interna, que incluyen:

Historial: los individuos experimentan algún evento fuera del estudio que afecta las mediciones antes y después de un tratamiento.

Madurez: los cambios biológicos en los participantes afectan las mediciones antes y después de un tratamiento.

Desgaste: un individuo abandona el estudio antes de que se pueda realizar una medición posterior.

Regresión a la media: las personas que obtienen una puntuación extremadamente alta o baja en alguna medición tienen una tendencia a obtener una puntuación más cercana al promedio la próxima vez. Esto a pesar del tratamiento en el que participan.

Sesgo de selección: los individuos del grupo de tratamiento y del grupo de control no son realmente comparables.

A menudo, la selección aleatoria y la asignación aleatoria de individuos a grupos pueden minimizar estas amenazas a la validez interna, pero no en todos los casos.

Diseños experimentales básicos Pre Test y Post Test

La validez interna es el grado en que el tratamiento experimental hace una diferencia (o causa un cambio) en los contextos experimentales específicos. La validez externa es el grado en que el efecto del tratamiento se puede generalizar entre poblaciones, entornos, variables de tratamiento e instrumentos de medición.

Los factores que amenazan la validez interna son: antecedentes, maduración, efectos previos a la prueba, instrumentos, regresión estadística hacia la media, selección diferencial de participantes, mortalidad e interacciones de factores.

Las amenazas a la validez externa incluyen: efectos de interacción de sesgos de selección y tratamiento. De la misma manera se considera, efecto de interacción reactiva de pruebas preliminares, efecto reactivo de procedimientos experimentales e interferencia de tratamientos múltiples.

Para una discusión detallada de las amenazas a la invalidez interna y externa, los lectores pueden consultar a Bellini y Rumrill. Las anotaciones utilizadas son:

Y1 = puntuaciones previas a la prueba,

T = tratamiento experimental,

Y2 = puntuaciones posteriores a la prueba,

D = Y2− Y1 (puntuaciones de ganancia )

y RD = diseño aleatorio (selección aleatoria y asignación de participantes a grupos y, luego, asignación aleatoria de grupos a tratamientos).

ANCOVA con datos de Pre Test y Post Test

El propósito de utilizar las puntuaciones de la preprueba como una covariable en ANCOVA con un diseño de preprueba-posprueba es (a) reducir la varianza del error y (b) eliminar los sesgos sistemáticos. Con diseños aleatorios, el objetivo principal de ANCOVA es reducir la varianza del error, porque la asignación aleatoria de sujetos a grupos protege contra el sesgo sistemático.

Es importante señalar que cuando las puntuaciones previas a la prueba no son fiables, los efectos del tratamiento pueden estar gravemente sesgados en diseños no aleatorios.

Otro problema con ANCOVA se relaciona con el crecimiento diferencial de sujetos en grupos intactos o auto-seleccionados en la variable dependiente. Las diferencias previas a la prueba (sesgo sistemático) entre grupos pueden afectar las interpretaciones de las diferencias posteriores a la prueba. Recordemos que supuestos como la aleatorización, la relación lineal entre las puntuaciones previas y posteriores a la prueba y la homogeneidad de las pendientes de regresión subyacen al ANCOVA.

ANOVA y ANCOVA en Puntajes de Ganancia

En un intento por evitar problemas que podrían ser creados por una violación de estos supuestos, algunos investigadores usan ANOVA en puntajes de ganancia. Esto sin saber que se requieren los mismos supuestos para el análisis de puntajes de ganancia. Investigaciones previas han demostrado que cuando la pendiente de regresión es igual a 1, ANCOVA y ANOVA en las puntuaciones de ganancia producen la misma relación F. Siendo el análisis de la puntuación de ganancia un poco más potente debido a los grados de libertad perdidos con el análisis de covarianza.

Cuando la pendiente de regresión no es igual a 1, que suele ser el caso, ANCOVA dará como resultado una prueba más poderosa. Por ejemplo, si no existe una relación lineal entre las puntuaciones de la prueba previa y la prueba posterior, el ANCOVA se puede ampliar para incluir un componente cuadrático o cúbico. O, si las pendientes de regresión no son iguales, ANCOVA puede conducir a un procedimiento como la técnica de Johnson-Neymante que proporciona regiones de importancia.

ANOVA sobre puntajes residuales

Comparado con el modelo ANCOVA, el ANOVA sobre puntuaciones residuales es menos potente y algunos autores recomiendan que se evite. Maxwell, Delaney y Man-heimer advirtieron a los investigadores sobre un concepto erróneo común de que el ANOVA en las puntuaciones residuales es el mismo que el ANCOVA.

Demostraron que: (a) cuando los residuos se obtienen a partir de los coeficientes de regresión agrupados dentro del grupo, el ANOVA de las puntuaciones residuales da como resultado un nivel α de significancia inflado y (b) cuando se utiliza el coeficiente de regresión para la muestra total de todos los grupos combinados, ANOVA sobre puntuaciones residuales produce una prueba conservadora inadecuada.

Medición de la Variable Dependiente en Pre Test y Post Test

Certezas en la Medición de la Variable

Si la puntuación media posterior a la prueba es mejor que la puntuación media previa a la prueba, entonces tiene sentido concluir que el tratamiento podría ser responsable de la mejora. Desafortunadamente, a menudo no se puede concluir esto con un alto grado de certeza porque puede haber otras explicaciones de por qué las puntuaciones posteriores a la prueba son mejores.

Quizás un programa antidrogas se transmitió por televisión y muchos de los estudiantes lo vieron, o quizás una celebridad murió de una sobredosis de drogas y muchos de los estudiantes se enteraron. Otra categoría de explicaciones alternativas recibe el nombre de maduración. Si fuera un programa de un año, los participantes podrían volverse menos impulsivos o mejores razonadores y esto podría ser responsable del cambio.

Cambios en la Variable Dependiente

Otra explicación alternativa para un cambio en la variable dependiente en un diseño pretest-postest es la regresión a la media. Esto se refiere al hecho estadístico de que un individuo que puntúa extremadamente en una variable en una ocasión tenderá a puntuar menos en la próxima ocasión. Por ejemplo, un jugador de bolos con un promedio a largo plazo de 150 que de repente lanza un 220 obtendrá una puntuación más baja en el próximo juego. Su puntuación “retrocederá” hacia su puntuación media de 150.

La regresión a la media puede ser un problema cuando los participantes se seleccionan para estudios adicionales debido a sus puntuaciones extremas. Imagine, por ejemplo, que solo los estudiantes que obtuvieron calificaciones especialmente bajas en una prueba de fracciones reciben un programa de capacitación especial y luego vuelven a evaluar. La regresión a la media prácticamente garantiza que sus puntuaciones serán más altas incluso si el programa de entrenamiento no tiene ningún efecto.

Remisión Espontánea

Un concepto estrechamente relacionado y extremadamente importante en la investigación psicológica por ejemplo, es la remisión espontánea. Esta es la tendencia de muchos problemas médicos y psicológicos a mejorar con el tiempo sin ningún tipo de tratamiento. El resfriado común es un buen ejemplo. Si hoy se midiera la gravedad de los síntomas en 100 enfermos de resfriado común, se les diera un plato de sopa de pollo todos los días y luego se volviera a medir la gravedad de los síntomas en una semana, probablemente mejorarían mucho.

Sin embargo, esto no significa que la sopa de pollo fuera responsable de la mejora, ya que habrían mejorado mucho sin ningún tratamiento. Lo mismo ocurre con muchos problemas psicológicos. Es probable que un grupo de personas gravemente deprimidas hoy en día esté menos deprimido en promedio en 6 meses. Al revisar los resultados de varios estudios de tratamientos para la depresión, los investigadores Michael Posternak e Ivan Miller encontraron que los participantes en condiciones de control en lista de espera mejoraron un promedio de 10 a 15%. Esto antes de recibir cualquier tratamiento. Por lo tanto, en general, se debe tener mucho cuidado al inferir causalidad a partir de diseños pretest-postest.

Referencias Bibliográficas

Bellini and P. Rumrill, Research in rehabilitation counsel-ing, Springfield, IL: Charles C. Thomas.[2] R.D. Bock, Basic issues in the measurement of change. in:Advances in Psychological and Educational Measurement,D.N.M.DeGruijterandL.J.Th.VanderKamp, eds,JohnWiley& Sons, NY, 1976, pp. 75–96.

A.D. Bryk and H. I. Weisberg, Use of the nonequivalent con-trol group design when subjects are growing, PsychologicalBulletin 85 (1977), 950–962

I.S. Cahen and R.L. Linn, Regions of significant criterion dif-ference in aptitude- treatment interaction research, AmericanEducational Research Journal 8 (1971), 521–530.

Pre Test y Post Test

Pre Test y Post Test

Abrir chat
1
Bienvenida(o) a Online-Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!.