La prueba F es una prueba paramétrica que ayuda al investigador a realizar una inferencia sobre los datos extraídos de una población determinada. La prueba F se denomina prueba paramétrica debido a la presencia de parámetros. Estos parámetros en la prueba F son la media y la varianza. La moda de la prueba F es el valor que aparece con mayor frecuencia en un conjunto de datos y siempre es menor que la unidad. Según el coeficiente de asimetría de Karl Pearson, la prueba F está muy sesgada positivamente. La distribución de probabilidad de F aumenta constantemente antes de alcanzar el pico y luego comienza a disminuir para convertirse en tangencial en el infinito. Por lo tanto, podemos decir que el eje de F es asintótico a la cola derecha.

Por ejemplo, suponga que cultivamos dos conjuntos de calabazas en dos condiciones experimentales diferentes. En este caso, el investigador seleccionaría una muestra aleatoria de tamaño 9 y 11. Las desviaciones estándar de sus pesos son 0,6 y 0,8 respectivamente. Tras suponer que la distribución de sus pesos es normal, el investigador realiza una prueba F para comprobar la hipótesis de si las varianzas reales son iguales o no. La prueba F de significación global indica si su modelo de regresión lineal se ajusta mejor a los datos que un modelo que no contenga variables independientes.

Una prueba F es un tipo de prueba estadística muy flexible. Se puede utilizar en una gran variedad de escenarios. Las pruebas F pueden evaluar múltiples términos del modelo simultáneamente, lo que les permite comparar los ajustes de diferentes modelos lineales. En cambio, las pruebas t pueden evaluar sólo un término a la vez.

Usos de la Prueba F

La prueba F de significación global indica si el modelo de regresión lineal se ajusta mejor a los datos que un modelo que no contenga variables independientes.  De esta manera, una prueba F es un tipo de prueba estadística muy flexible. Se puede utilizar en una gran variedad de escenarios. Las pruebas F pueden evaluar múltiples términos del modelo simultáneamente, lo que les permite comparar los ajustes de diferentes modelos lineales. En cambio, las pruebas t pueden evaluar sólo un término a la vez.

El investigador también utiliza la prueba F para determinar si las dos estimaciones independientes de las varianzas de la población son o no homogéneas por naturaleza. Para calcular la prueba F de significación global, el software estadístico que use, sólo necesita incluir los términos adecuados en los dos modelos que compara. La prueba F global compara el modelo que usted especifica con el modelo sin variables independientes. Este tipo de modelo también se conoce como modelo de sólo intercepción.

El investigador utiliza la prueba F para comprobar la significación de un coeficiente de correlación múltiple observado. El investigador también la utiliza para probar la significación de un coeficiente de correlación muestral observado. El coeficiente de correlación de la muestra se define como una medida de asociación como la dispersión estadística en las categorías dentro de la muestra en su conjunto. El investigador así, comprueba su significación.

Qué debe tener en cuenta el investigador

El investigador debe tener en cuenta que existe cierta asociación entre las distribuciones t y F de la prueba F. Según esta asociación, si un estadístico t sigue una distribución t de student con ‘n’ grados de libertad, entonces el cuadrado de este estadístico seguirá la distribución F de Snedecor con 1 y n grados de libertad.

La prueba F también tiene algunas otras asociaciones, como la asociación entre la distribución it y chi cuadrado. La distribución F en la prueba F siempre tiene una distribución no simétrica. La media de la distribución F en la prueba F es aproximadamente uno. Hay dos grados de libertad independientes en la distribución F, uno en el numerador y otro en el denominador. Hay muchas distribuciones F diferentes en la prueba F, una para cada par de grados de libertad.

Hipótesis en la Prueba F

La prueba F de significación global tiene las dos hipótesis siguientes:

La hipótesis nula afirma que el modelo sin variables independientes se ajusta a los datos tan bien como su modelo.

La hipótesis alternativa dice que su modelo se ajusta a los datos mejor que el modelo de sólo intercepción.

En la salida estadística del software elegido, puede encontrar la prueba F global en la tabla ANOVA.

Interpretación de la prueba F de significación global

En este caso, comparemos el valor p de la prueba F con su nivel de significación. Si el valor p es menor que el nivel de significación, los datos de su muestra proporcionan suficiente evidencia para concluir que su modelo de regresión se ajusta a los datos mejor que el modelo sin variables independientes.

Este resultado es una buena noticia porque significa que las variables independientes de su modelo mejoran el ajuste.

En general, si ninguna de sus variables independientes es estadísticamente significativa, la prueba F global tampoco lo es. En ocasiones, las pruebas pueden producir resultados contradictorios. Este desacuerdo puede producirse porque la prueba F de significación global evalúa todos los coeficientes conjuntamente, mientras que la prueba t para cada coeficiente los examina individualmente. Por ejemplo, la prueba F global puede encontrar que los coeficientes son significativos conjuntamente mientras que las pruebas t pueden no encontrar la significación individualmente.

Estos resultados contradictorios de las pruebas pueden ser difíciles de entender. La prueba F suma el poder predictivo de todas las variables independientes y determina que es poco probable que todos los coeficientes sean iguales a cero. Sin embargo, es posible que cada variable no sea lo suficientemente predictiva por sí sola como para ser estadísticamente significativa. En otras palabras, su muestra proporciona pruebas suficientes para concluir que su modelo es significativo, pero no lo suficiente para concluir que cualquier variable individual es significativa.

Formas adicionales de interpretar la prueba F de significación global

Si tiene una prueba F de significación global estadísticamente significativa, puede sacar otras conclusiones.

Para el modelo sin variables independientes, el modelo de sólo intercepción, todas las predicciones del modelo son iguales a la media de la variable dependiente. En consecuencia, si la prueba F global es estadísticamente significativa, las predicciones de su modelo son una mejora con respecto al uso de la media.

Distribución F

Hace algunos años, los estadísticos descubrieron que cuando se toman pares de muestras de una población normal, los cocientes de las varianzas de las muestras de cada par seguirán siempre la misma distribución. No es de extrañar que, a lo largo de los años, los estadísticos hayan descubierto que el cociente de las varianzas de las muestras recogidas de diferentes maneras sigue esta misma distribución, la distribución F. Como sabemos que las distribuciones muestrales de la razón de varianzas siguen una distribución conocida, podemos realizar pruebas de hipótesis utilizando la razón de varianzas.

Piense en la forma que tendrá la distribución F. Por ejemplo, si s12 y s22 proceden de muestras de la misma población, entonces si se toman muchos pares de muestras y se calculan las puntuaciones F, la mayoría de esas puntuaciones F serán cercanas a uno. Todas las puntuaciones F serán positivas, ya que las varianzas son siempre positivas: el numerador de la fórmula es la suma de los cuadrados, por lo que será positivo y el denominador es el tamaño de la muestra menos uno, que también será positivo.

Pero pensar en las proporciones requiere cierto cuidado. Es posible que s22 sea mucho mayor que s12 y entonces F sería muy cercano a cero. Dado que F va de cero a muy grande, con la mayoría de los valores en torno a uno, obviamente no es simétrica; hay una larga cola a la derecha y un pronunciado descenso a cero a la izquierda.

Hay dos usos de la distribución F. El primero es una prueba muy sencilla para ver si dos muestras proceden de poblaciones con la misma varianza. El segundo es el análisis de varianza de una vía (ANOVA), que utiliza la distribución F para comprobar si tres o más muestras proceden de poblaciones con la misma media.

Una prueba sencilla: ¿Proceden estas dos muestras de poblaciones con la misma varianza?

Como la distribución F se genera extrayendo dos muestras de la misma población normal, puede utilizarse para probar la hipótesis de que dos muestras proceden de poblaciones con la misma varianza. Se tendrían dos muestras (una de tamaño n1 y otra de tamaño n2) y la varianza muestral de cada una. Obviamente, si las dos varianzas están muy cerca de ser iguales, las dos muestras podrían proceder fácilmente de poblaciones con varianzas iguales. Dado que el estadístico F es el cociente de las dos varianzas muestrales, cuando las dos varianzas muestrales son casi iguales, la puntuación F es cercana a uno. Si se calcula la puntuación F y se aproxima a uno, se acepta la hipótesis de que las muestras proceden de poblaciones con la misma varianza.

Método Básico de la Prueba F

Este es el método básico de la prueba F. Hipotetice que las muestras proceden de poblaciones con la misma varianza. Calcule la puntuación F encontrando el cociente de las varianzas de las muestras. Si la puntuación F se acerca a uno, concluya que su hipótesis es correcta y que las muestras proceden de poblaciones con varianzas iguales. Si la puntuación F está lejos de uno, concluya que las poblaciones probablemente tienen varianzas diferentes.

El método básico debe completarse con algunos detalles si se va a utilizar esta prueba en el trabajo de tesis. Hay dos conjuntos de detalles: en primer lugar, escribir formalmente las hipótesis y en segundo lugar, utilizar las tablas de distribución F para poder saber si la puntuación F está cerca de uno o no. Formalmente, se necesitan dos hipótesis para completarlas. La primera es la hipótesis nula de que no hay diferencias (por tanto, nula). Se suele denominar Ho. La segunda es que hay una diferencia y se llama la alternativa y se denota H1 o Ha.

Nuestros especialistas esperan por ti para que los contactes a través del formulario de cotización o del chat directo. También contamos con canales de comunicación confidenciales como WhatsApp y Messenger. Y si quieres estar al tanto de nuestros novedosos servicios y las diferentes ventajas de contratarnos, síguenos en FacebookInstagram o Twitter.

Si este artículo fue de tu agrado, no olvides compartirlo por tus redes sociales. También te puede interesar: Cómo calcular el tamaño de la muestra correctamente

Fuentes Consultadas

Fox, Karl A. (1980). Intermediate Economic Statistics (Second ed.). New York: John Wiley & Sons. pp. 290–310.

Kmenta, Jan (1986). Elements of Econometrics (Second ed.). New York: Macmillan. pp. 147–148.

Maddala, G. S.; Lahiri, Kajal (2009). Introduction to Econometrics (Fourth ed.). Chichester: Wiley. pp. 155–160.

Prueba F

Prueba F. Foto: Unsplash. Créditos: Mimi Thian @mimithian

Abrir chat
1
Escanea el código
Bienvenido(a) a Online Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!