La estadística inductiva (o razonamiento inductivo) es una rama de la estadística que se ocupa de tomar muestras de una población más grande y usar esos datos para: sacar conclusiones, tomar decisiones, pronósticos y predecir el comportamiento futuro.

Estadística inferencial vs inductiva

La estadística inductiva y la estadística inferencial son dos términos que se utilizan indistintamente. Por ejemplo:

"La estadística inferencial ... también se llama razonamiento inductivo o estadística inductiva" (Jeneralczuk, 2011)

“En estadística inductiva se aplica la teoría de la probabilidad para hacer inferencias sobre el proceso que generó los datos” (Braune, n.d.)

Sin embargo, existe una diferencia muy sutil entre los dos términos. La estadística inductiva es el proceso lógico de sacar conclusiones generales basadas en piezas específicas de información; es el proceso subyacente detrás de las estadísticas inferenciales, a diferencia de los datos (estadísticas) producidos. En otras palabras, la rama de la estadística inferencial (que incluye la estimación y la prueba de hipótesis) utiliza el razonamiento inductivo (Steen, 2018).

Diferencia entre estadística descriptiva e inductiva

Tanto la estadística descriptiva como la inferencial ayudan a dar sentido a una fila tras otra de datos. Utilice estadísticas descriptivas para resumir y representar gráficamente los datos de un grupo que elija. Este proceso le permite comprender ese conjunto específico de observaciones.

Las estadísticas descriptivas describen una muestra. Eso es bastante sencillo. Simplemente tome un grupo que le interese, registre datos sobre los miembros del grupo y luego use estadísticas de resumen y gráficos para presentar las propiedades del grupo. Con las estadísticas descriptivas, no hay incertidumbre porque está describiendo solo a las personas o elementos que realmente mide. No está intentando inferir propiedades sobre una población más grande.

El proceso implica tomar una cantidad potencialmente grande de puntos de datos en la muestra y reducirlos a unos pocos valores y gráficos de resumen significativos. Este procedimiento nos permite obtener más información y visualizar los datos que simplemente pasar fila tras fila de números sin procesar

Herramientas comunes de estadística descriptiva

Tendencia central: use la media o la mediana para ubicar el centro del conjunto de datos. Esta medida le dice dónde caen la mayoría de los valores.

Dispersión: ¿Qué tan lejos del centro se extienden los datos? Puede utilizar el rango o la desviación estándar para medir la dispersión. Una dispersión baja indica que los valores se agrupan más estrechamente alrededor del centro. Una mayor dispersión significa que los puntos de datos se alejan más del centro. También podemos graficar la distribución de frecuencias.

Asimetría: la medida le indica si la distribución de valores es simétrica o sesgada.

Ejemplo de estadística descriptiva

Suponga que queremos describir los puntajes de las pruebas en una clase específica de 30 estudiantes. Registramos todos los puntajes de las pruebas, calculamos las estadísticas de resumen y producimos gráficos.

En conjunto, esta información nos da una imagen bastante buena de esta clase específica. No hay incertidumbre en torno a estas estadísticas porque reunimos las puntuaciones de todos en la clase. Sin embargo, no podemos tomar estos resultados y extrapolarlos a una población mayor de estudiantes.

Estadística inferencial

La estadística inferencial toma datos de una muestra y hace inferencias sobre la población más grande de la que se extrajo la muestra. Debido a que el objetivo de la estadística inferencial es sacar conclusiones de una muestra y generalizarlas a una población, debemos tener confianza en que nuestra muestra refleja con precisión la población. Este requisito afecta nuestro proceso. A un nivel amplio, debemos hacer lo siguiente:

Definir la población que estamos estudiando.

Saque una muestra representativa de esa población.

Utilice análisis que incorporen el error de muestreo.

No podemos elegir un grupo conveniente. En cambio, el muestreo aleatorio nos permite tener la confianza de que la muestra representa a la población. El muestreo aleatorio produce estadísticas, como la media, que no tienden a ser demasiado altas o demasiado bajas. Usando una muestra aleatoria, podemos generalizar de la muestra a la población más amplia. Desafortunadamente, recolectar una muestra verdaderamente aleatoria puede ser un proceso complicado.

Pros y contras de trabajar con muestras

Obtiene enormes beneficios al trabajar con una muestra aleatoria extraída de una población. En la mayoría de los casos, es simplemente imposible medir toda la población para comprender sus propiedades. La alternativa es recopilar una muestra aleatoria y luego utilizar las metodologías de estadística inferencial para analizar los datos de la muestra.

Por lo general, aprendemos sobre la población extrayendo una muestra relativamente pequeña de ella. Estamos muy lejos de medir a todas las personas u objetos de esa población. En consecuencia, cuando se estiman las propiedades de una población a partir de una muestra, es poco probable que las estadísticas de la muestra igualen exactamente el valor real de la población.

Por ejemplo, es poco probable que la media de la muestra sea exactamente igual a la media de la población. La diferencia entre la estadística de la muestra y el valor de la población es el error de muestreo. Las estadísticas inferenciales incorporan estimaciones de este error en los resultados estadísticos.

Por el contrario, los valores de resumen en la estadística descriptiva son sencillos. El puntaje promedio en una clase específica es un valor conocido porque medimos a todos los individuos en esa clase. No hay incertidumbre.

Herramientas de análisis estándar de la estadística inductiva

Las metodologías más comunes en estadística inferencial son las pruebas de hipótesis, los intervalos de confianza y el análisis de regresión. Curiosamente, estos métodos inferenciales pueden producir valores de resumen similares a los de las estadísticas descriptivas, como la media y la desviación estándar. Sin embargo, como demostraremos, los usamos de manera muy diferente al hacer inferencias.

Pruebas de hipótesis

Las pruebas de hipótesis utilizan datos de muestra para responder preguntas como las siguientes:

¿La media de la población es mayor o menor que un valor particular?

¿Son las medias de dos o más poblaciones diferentes entre sí?

Por ejemplo, si estudiamos la efectividad de un nuevo medicamento comparando los resultados en un grupo de tratamiento y de control, las pruebas de hipótesis pueden decirnos si es probable que el efecto del medicamento que observamos en la muestra exista en la población. Después de todo, no queremos usar el medicamento si es efectivo solo en nuestra muestra específica. En cambio, necesitamos evidencia de que será útil en toda la población de pacientes. Las pruebas de hipótesis nos permiten sacar este tipo de conclusiones sobre poblaciones enteras.

Intervalos de confianza (IC)

En la estadística inferencial, un objetivo principal es estimar los parámetros de la población. Estos parámetros son los valores desconocidos para toda la población, como la media poblacional y la desviación estándar. Estos valores de parámetros no solo son desconocidos, sino que casi siempre son incognoscibles. Normalmente, es imposible medir una población completa. El error de muestreo que mencioné anteriormente produce incertidumbre, o un margen de error, alrededor de nuestras estimaciones.

Supongamos que definimos nuestra población como todos los jugadores de baloncesto de la escuela secundaria. Luego, extraemos una muestra aleatoria de esta población y calculamos la altura media de 181 cm. Esta estimación muestral de 181 cm es la mejor estimación de la altura media de la población. Sin embargo, está prácticamente garantizado que nuestra estimación del parámetro de población no es exactamente correcta.

Los intervalos de confianza incorporan la incertidumbre y el error muestral para crear un rango de valores dentro del cual el valor real de la población es similar. Por ejemplo, un intervalo de confianza de [176 186] indica que podemos estar seguros de que la media de la población real se encuentra dentro de este rango.

Referencias Bibliográficas

Braune, C. (n.d.). Inductive Stats. Retrieved February 22, 2019 from: http://fuzzy.cs.ovgu.de/studium/ida/txt/ida_inductive.pdf
Jeneralczuk, J. (2011). The Three Main Aspects of Statistics. Article posted on website University of Massachusetts—Amherst. Retrieved February 22, 2019 from: http://people.math.umass.edu/~jeneral/stat240/handout1.pdf
Steen, K. Probability and Statistics, Chapter 2. Montefiore Institute. Retrieved February 27, 2018 from: http://www.montefiore.ulg.ac.be/~kvansteen/MATH0008-2/ac20112012/Class4/Chapter4_ac1112_v5a2.pdf

Estadística Inductivo

Estadística Inductiva

 

Abrir chat
1
Bienvenida(o) a Online-Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!.