Intervalos de Confianza, Predicción y Tolerancia

Ene 24, 2022 | Investigación Cuantitativa

Los intervalos de confianza son estimaciones que se calculan a partir de los datos de la muestra para determinar los rangos que probablemente contengan el parámetro poblacional (media, desviación estándar) de interés. Por ejemplo, si nuestra población es (2,6), un intervalo de confianza de la media sugiere que la media de la población está probablemente entre 2 y 6. ¿Y con qué grado de confianza podemos decir esto? Obviamente al 100%, ¿no? Porque conocemos todos los valores y podemos calcularlo muy fácilmente.

De esta manera, un intervalo de confianza es un rango de valores, derivado de las estadísticas de la muestra, que probablemente contenga el valor de un parámetro poblacional desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población determinada den lugar a intervalos de confianza idénticos. Pero si se repitiera la muestra muchas veces, un cierto porcentaje de los intervalos de confianza resultantes contendría el parámetro poblacional desconocido. El porcentaje de estos intervalos de confianza que contienen el parámetro es el nivel de confianza del intervalo.

Usos de los Intervalos de Confianza

Lo más frecuente es utilizar los intervalos de confianza para acotar la media o la desviación estándar, pero también se pueden obtener para los coeficientes de regresión, las proporciones, las tasas de ocurrencia (Poisson) y para las diferencias entre poblaciones.

Supongamos que toma una muestra aleatoria de bombillas y mide el tiempo de combustión. Minitab calcula que el intervalo de confianza del 95% es de 1230 – 1265 horas. El intervalo de confianza indica que usted puede estar 95% seguro de que la media para toda la población de bombillas cae dentro de este rango.

Los intervalos de confianza sólo evalúan el error de muestreo en relación con el parámetro de interés. (El error de muestreo es simplemente el error inherente cuando se intenta estimar la característica de toda una población a partir de una muestra). Por consiguiente, debe tener en cuenta estas importantes consideraciones:

A medida que aumenta el tamaño de la muestra, el error de muestreo disminuye y los intervalos se hacen más estrechos. Si pudiera aumentar el tamaño de la muestra hasta igualar a la población, no habría error de muestreo. En este caso, el intervalo de confianza tendría una anchura de cero y sería igual al verdadero parámetro de la población.

¿Qué sucede cuándo no se puede estudiar a toda la población?

Los intervalos de confianza sólo informan sobre el parámetro de interés y nada sobre la distribución de los valores individuales.

En el ejemplo de la bombilla, sabemos que es probable que la media esté dentro del rango, pero el intervalo de confianza del 95% no predice que el 95% de las observaciones futuras estén dentro del rango. Tendremos que utilizar un tipo de intervalo diferente para sacar una conclusión así.

Pero en los problemas de la vida real, esto no es así. No siempre es factible o posible estudiar a toda la población. Entonces, ¿qué hacemos? Tomamos datos de una muestra. Pero, ¿podemos confiar en una sola muestra? No, porque diferentes muestras de los mismos datos producirán medias diferentes.

Así que tomamos numerosas muestras aleatorias (de la misma población) y calculamos intervalos de confianza para cada muestra y un determinado porcentaje de estos intervalos contendrá el verdadero parámetro de la población.

Nivel de Confianza

Este porcentaje determinado se denomina nivel de confianza. Un nivel de confianza del 95% significa que de 100 muestras aleatorias tomadas, espero que 95 de los intervalos de confianza contengan el verdadero parámetro poblacional.

Suponga que trabaja en una empresa de artículos deportivos que fabrica balones de baloncesto. Hay varias plantas de fabricación y cada planta produce 10.000 balones cada día. Tienes que probar los balones antes de que la empresa los empaquete y los envíe.

Uno de los procedimientos estándar de la industria es comprobar la altura del primer rebote de los balones. Su colega sugiere tomar una muestra aleatoria (de la misma planta de fabricación) y formar un intervalo de confianza en torno a la altura media de rebote.

Coge 100 pelotas, las deja caer desde el primer piso de su oficina y mide el rebote medio y el intervalo de confianza del 95% para el rebote medio es de 110-120 cms. Puedo decir que tengo un 95% de confianza en que la altura media de rebote de todos los balones de baloncesto (toda la población de una planta) se encuentra en este intervalo.

Precaución: Esto no significa que el 95% de las veces, la altura de rebote estará en este rango.

Como podemos ver en esta imagen de arriba, hay 100 intervalos de confianza para 100 muestras diferentes. La línea roja es el valor verdadero de la población. 95 de estos intervalos contienen el valor verdadero, los otros 5 no.

Algunas consideraciones importantes

A medida que extraemos muestras más y más grandes, nuestro intervalo de confianza se hace más estrecho. Una muestra más grande reducirá el error de muestreo, dará estimaciones más precisas y, por tanto, intervalos más pequeños. Supongamos que decidimos probar 5.000 pelotas, con lo que obtendremos una mejor estimación del intervalo de altura de rebote.

A medida que aumentamos el nivel de confianza, por ejemplo del 95% al 99%, nuestro rango se hace más amplio. Puede sonar contradictorio, pero piénsalo. Para tener más confianza en que un intervalo contiene el parámetro verdadero, el rango debe ser más amplio. Por ejemplo, puedo tener un 100% de confianza en que la altura de rebote de la pelota es de 0 a infinito.

Intervalos de predicción

¿Qué ocurre después de ajustar un modelo de regresión? Predecimos el valor de la variable dependiente.

El rango que probablemente contenga el valor de la variable dependiente para una nueva y única observación dados los valores específicos de las variables independientes, es el intervalo de predicción.

Un intervalo de predicción es un rango que probablemente contenga el valor de la respuesta de una sola observación nueva, dada la configuración especificada de los predictores en su modelo.

Utilizaremos los mismos ajustes que antes y calculamos un intervalo de predicción de 1350 – 1500 horas. Podemos estar seguros en un 95% de que este intervalo incluye el tiempo de combustión de la siguiente bombilla producida con estos ajustes.

Intervalos de Predicción e Intervalos de Confianza

El intervalo de predicción es siempre más amplio que el correspondiente intervalo de confianza de la predicción, debido a la incertidumbre añadida que supone la predicción de una sola respuesta frente a la respuesta media.

Estamos llegando a determinar dónde es probable que caiga una observación individual, pero se necesita un modelo para que funcione.

Tomemos el ejemplo anterior del baloncesto para entender este concepto.

Supongamos que, utilizando un modelo de regresión (a menudo regresión lineal) y dados los valores específicos de las variables independientes como el material de la goma, el tipo de costura (basado en los balones de baloncesto ya producidos), entrenamos nuestro modelo. Este modelo predice ahora un intervalo de predicción de 105-125 cm. Ahora podemos estar seguros en un 95% de que la altura de rebote de la siguiente pelota de baloncesto producida con los mismos ajustes estará dentro de este intervalo.

Tenga en cuenta que aquí no estamos prediciendo la media, sino un valor individual, por lo que hay una mayor incertidumbre y, por tanto, un intervalo de predicción siempre es más amplio que el intervalo de confianza.

Los intervalos de predicción pueden confundirse a menudo con los intervalos de confianza. Están relacionados, pero los dos procesos tienen cálculos y propósitos diferentes.

El intervalo de predicción predice en qué rango caerá una futura observación individual, mientras que un intervalo de confianza muestra el rango probable de valores asociados a algún parámetro estadístico de los datos, como la media de la población.

Un intervalo de tolerancia no debe confundirse con las «tolerancias» de fabricación, que son declaraciones sobre intervalos dentro de los cuales esperamos o exigimos que caiga alguna medida. Pueden tener alguna relación con los datos anteriores (es decir, la organización no querría que no tuvieran ninguna relación con la realidad), pero no se calculan a partir de los datos del proceso en curso.

Intervalos de Tolerancia

La amplitud de un intervalo de confianza se debe enteramente al error de muestreo. A medida que el tamaño de la muestra se aproxima a la totalidad de la población, la anchura del intervalo de confianza se aproxima a cero.

En cambio, la anchura de un intervalo de tolerancia se debe tanto al error de muestreo como a la varianza de la población. A medida que el tamaño de la muestra se acerca a toda la población, el error de muestreo disminuye y los percentiles estimados se acercan a los verdaderos percentiles de la población.

Para determinar dónde cae el 95% de la población, Minitab calcula los valores de los datos que corresponden a los percentiles 2.5 y 97.5 estimados (97.5 – 2.5 = 95). Lea aquí para obtener más información sobre los percentiles y las proporciones de la población.

Lamentablemente, las estimaciones de los percentiles tendrán errores porque estamos trabajando con una muestra. No podemos estar 100% seguros de que un intervalo de tolerancia contenga realmente la proporción especificada. En consecuencia, los intervalos de tolerancia tienen un nivel de confianza.

Usos de los intervalos de tolerancia

En general, se utilizan los intervalos de tolerancia si se tienen datos muestreados y se quiere predecir un rango de resultados probables.

En el campo de la mejora de la calidad, los analistas de Six Sigma suelen exigir que el resultado de un proceso tenga medidas (por ejemplo, tiempo de quemado, longitud, etc.) que estén dentro de los límites de la especificación. Para este contexto, los intervalos de tolerancia pueden detectar una variación excesiva comparando los requisitos del cliente con los límites de tolerancia que cubren una proporción específica de la población. Si el intervalo de tolerancia es más amplio que los requisitos del cliente, puede haber una variación excesiva del producto.

Nuestros especialistas esperan por ti para que los contactes a través del formulario de cotización o del chat directo. También contamos con canales de comunicación confidenciales como WhatsApp y Messenger. Y si quieres estar al tanto de nuestros novedosos servicios y las diferentes ventajas de contratarnos, síguenos en Facebook, Instagram o Twitter.

Si este artículo fue de tu agrado, no olvides compartirlo por tus redes sociales. También te puede interesar: Criterios de Inclusión y Exclusión

Referencias Bibliográficas

Liu, R. Y. 1988. “Bootstrap Procedures Under Some Non-i.i.d. Models.” The Annals of Statistics 16 (4): 1696 1708. https://doi.org/10.1214/aos/1176351062

D’Orazio M., Di Zio M., Scanu M., Torelli N., Ballin M. (2009) Statistical matching of two surveys with a common subset, First Italian Conference on Survey Methodology (ITACOSM09), Siena 10-12 June 2009.

Tereshchenko G. (2008) Improving of Household Sample Surveys Data Quality on Base of Statistical Matching Approaches, Institute for Demography and Social Studies of the National Academy of Sciences
of Ukraine.

Intervalos de Confianza, Predicción y Tolerancia. Foto: Unsplash. Créditos: Mimi Thian

Intervalos de Confianza, Predicción y Tolerancia