Al comparar las predicciones con los datos reales, podemos determinar hasta qué punto la deducción y la inferencia explican los datos y, por tanto, el fenómeno. Esto puede llevarnos a rechazar por completo algunos modelos, a mejorar (y luego reevaluar) otros, y quizás finalmente a declarar uno como el "mejor" modelo (hasta el momento). Los modelos se construyen utilizando principios teóricos aceptados, conocimientos previos y el juicio de los expertos.

¿Qué es la Deducción?

La deducción puede definirse como el proceso de sacar conclusiones basadas en pruebas y razonamientos. Se encuentra en el centro del método científico, ya que abarca los principios y métodos por los que utilizamos los datos para aprender sobre los fenómenos observables. Esto se hace siempre a través de modelos. Gran parte de la ciencia se basa en modelos, lo que significa que construimos un modelo de algún fenómeno y lo utilizamos para hacer predicciones de los datos que esperamos observar en determinadas condiciones.

¿Qué es la Inferencia?

Según Popper (2005), la inferencia es el proceso por el que se comparan los modelos con los datos. Normalmente se trata de fundir el modelo matemáticamente y utilizar los principios de la probabilidad para cuantificar la calidad de la coincidencia.

Ejemplo de Aplicación de la Deducción e Inferencia

A modo de ejemplo, consideremos, de forma un tanto anacrónica, los modelos de movimiento de los planetas en el sistema solar vistos desde la superficie de la Tierra. Dos alternativas destacadas son:

(1) El modelo geocéntrico, en el que la Tierra se considera fija y el Sol, la Luna y los planetas orbitan a su alrededor

(2) El modelo heliocéntrico, en el que el Sol se considera fijo y la Tierra y los planetas orbitan a su alrededor (la Luna sigue orbitando la Tierra).

Ignorando los detalles específicos de los diversos sabores de estos modelos generales (aristotélico, ptolemaico, copernicano, kepleriano, etc.), existe en realidad una forma de equivalencia de los dos modelos, porque uno puede transformarse en el otro mediante una transformación de coordenadas no inerciales. Pero cuando se definen en sus coordenadas naturales, estos dos modelos parecen muy diferentes.

Procedimiento para llevar a cabo la inferencia

La inferencia puede dividirse normalmente en dos partes: ajuste del modelo y comparación del modelo. En una versión del modelo geocéntrico, los planetas se mueven en órbitas circulares regulares con el Sol en el centro. Varios parámetros describen el movimiento de cada planeta (radio, periodo, inclinación, fase). El ajuste del modelo es el proceso por el que se determinan los valores de estos parámetros a partir de un conjunto de datos observacionales.

Como todos los datos tienen más o menos ruido, esto implica una incertidumbre, que se cuantifica mejor utilizando la probabilidad. Es decir, la incertidumbre en los datos se corresponde con la incertidumbre en los parámetros del modelo. El método más general de inferencia consiste en determinar la función de distribución de la probabilidad (PDF), P(θ | D, M), donde D denota los datos y θ los parámetros del modelo M. Se trata, por lo general, de una PDF multidimensional y no suele poder evaluarse analíticamente.

El Método Monte Carlo

Según Medewar (1996), el arsenal de inferencia incluye numerosas herramientas numéricas para evaluarla, siendo los métodos Markov Chain Monte Carlo (MCMC) uno de los más populares. Sin embargo, esto lleva mucho tiempo y a veces se emplean técnicas aproximadas para determinar la información de resumen (como la media y la covarianza). Dependiendo de la cantidad y la calidad de los datos, así como de la idoneidad del modelo, P(θ | D, M) puede tener un pico más o menos alto en torno a un rango estrecho de parámetros. Esto indica una solución bien determinada y de baja incertidumbre para ese modelo.

Por lo general, querremos saber lo bueno que es un modelo, ya sea en un sentido general o en algunos valores específicos ajustados de los parámetros. En realidad, se trata de una cuestión mal planteada si sólo consideramos un modelo, porque entonces no tenemos ninguna alternativa que pueda explicar mejor los datos, de modo que cualquier dato debe atribuirse a nuestro único modelo. Por lo tanto, en realidad siempre comparamos modelos y tratamos de identificar el "mejor" (según algunos criterios).

Como mínimo, consideramos un modelo "de fondo" como una alternativa implícita. Si tomamos el ejemplo de la detección de una línea de emisión en un espectro en el que sólo tenemos un modelo para la ubicación y la forma de la línea, un modelo alternativo implícito es la ausencia de línea, por ejemplo, sólo un espectro constante. Pero a menudo tendremos otros modelos alternativos, por ejemplo, con múltiples líneas, o líneas con diferentes formas.

Cuantificando la calidad de ambos modelos

Rara vez creemos que nuestros modelos sean perfectos, por lo que en realidad no tiene sentido preguntarse si un modelo concreto es el "correcto". Esto se ve reforzado por el hecho de que los datos son ruidosos -tienen un componente aleatorio que no puede ser predicho por un modelo- por lo que esperamos cierta desviación entre los datos y las predicciones. Por tanto, sólo podemos cuantificar la calidad relativa de los modelos (incluido un posible modelo de fondo). No podemos establecer la calidad absoluta de un modelo. Por cierto, la comparación de modelos se realiza a menudo de forma deficiente en la literatura. En parte por el uso de modelos de fondo demasiado simplificados y cuya debilidad ayuda a promover artificialmente casi cualquier otro modelo.

El Segundo Pilar de la Inferencia

Esto nos lleva al segundo pilar de la inferencia, la comparación de modelos, cuyo objetivo es identificar cuál de los modelos considerados explica mejor los datos. Volviendo al ejemplo de las órbitas planetarias, consideremos que tenemos un conjunto de observaciones de posiciones planetarias (coordenadas celestes bidimensionales) en fechas conocidas.

Un buen modelo geocéntrico puede predecir muy bien la mayoría de las observaciones posibles. Mejor, de hecho, que un modelo heliocéntrico con órbitas circulares. En términos más generales, como podemos transformar geométricamente las predicciones de un modelo heliocéntrico en las de un modelo geocéntrico, ambos modelos podrían ser igualmente buenos para predecir estos datos.

Al hacer más complejo un modelo geocéntrico (añadir más epiciclos) hacemos que se ajuste cada vez mejor a los datos. Piensa en ajustar una curva a diez puntos en un espacio bidimensional: A menos que los puntos sean colineales, una curva cúbica siempre puede ajustarse mejor --en términos de suma de residuos cuadrados-- que una línea recta). Si tenemos razones adicionales para preferir un modelo geocéntrico (como la falta de paralaje estelar, Aristóteles o las interpretaciones bíblicas), entonces el modelo geocéntrico parece estar favorecido.

Consideración de la Verosimilitud de los Modelos

Sin embargo, hay algo importante que falta en esta cadena de razonamiento. Sabemos que se pueden hacer modelos cada vez más complejos para ajustarse a cualquier conjunto de datos, pero consideramos que tales modelos son cada vez más artificiosos. Por tanto, además de la capacidad de predicción, la consideración de la verosimilitud de los modelos debe ser una parte fundamental de la inferencia. La verosimilitud se equipara a menudo (aunque no siempre) con la parsimonia, en cuyo caso adoptamos lo que suele llamarse la navaja de Occam. Debemos preferir una solución sencilla cuando no sea necesaria una más complicada.

Por tanto, deberíamos aplicar algún tipo de "control de la complejidad" a nuestros modelos. En cuanto al desarrollo histórico de las teorías del movimiento planetario, el cambio de preferencia de un modelo geocéntrico a uno heliocéntrico no se debió únicamente a la mejora de los datos.

También se debió a una mayor disposición a cuestionar la suposición de que la Tierra no podía moverse, así como a la elección de dar más peso al hecho de que el movimiento del Sol está sospechosamente sincronizado con el movimiento de los planetas en el modelo geocéntrico. Lo primero fue consecuencia de una revolución intelectual que fue más allá de la astronomía. Lo segundo fue esencialmente un argumento de plausibilidad. Ambos demuestran la importancia ineludible que tiene para el proceso de inferencia la información previa, aquella que va más allá de los datos que utilizamos explícitamente en la modelización.

Inferencia Bayesiana

La descripción anterior de la inferencia es la bayesiana. Es el único enfoque lógico y autoconsistente de la inferencia basada en la probabilidad. Un enfoque probabilístico es esencial, porque tratar con datos observacionales significa tratar con la incertidumbre, Los datos son ruidosos (no podemos medir con exactitud las posiciones de los planetas) y nuestras muestras son incompletas (no podemos medir todos los puntos de una órbita).

La probabilidad es, sin duda, el medio más potente para tratar la incertidumbre. Algunos científicos se oponen a las probabilidades a priori, pero esto no significa negar su existencia. Sólo pone de manifiesto la dificultad que supone en la práctica encapsular la información a priori en términos de probabilidades, lo cual es un problema científico que hay que abordar, no rehuir.

La inferencia bayesiana ha experimentado un importante renacimiento en la astronomía en los últimos veinte años. Esto se debe, en parte, al aumento de la potencia de cálculo disponible, ya que con frecuencia hay que realizar una integración numérica de alta dimensión. Una vez que los métodos para hacer esto se volvieron manejables, los astrónomos se dieron cuenta de la necesidad de un análisis de datos lógico y autoconsistente, en contraposición a las pruebas o recetas estadísticas rápidas y simples, pero a menudo erróneas.

Importancia de realizar la inferencia correctamente

Realizar la inferencia correctamente es un área de vital importancia en toda la ciencia, pero en particular en la astronomía, donde, al no poder realizar experimentos u obtener datos in situ, estamos limitados a las observaciones remotas. Se invierten enormes cantidades de dinero, tiempo y esfuerzo en la construcción de instrumentos potentes. Así, se debería hacer un esfuerzo proporcional para garantizar que se hacen cosas sensatas con los datos. Desgraciadamente, no siempre es así, y muchas publicaciones en la literatura sacan conclusiones incorrectas debido a una inferencia defectuosa.

Esto no siempre se debe a la ignorancia o incluso a la falta de esfuerzo. Los principios de la inferencia pueden ser sencillos, pero la práctica es bastante más compleja: ¿Qué modelos debo tener en cuenta? ¿Cómo configuro y parametrizo estos modelos? ¿Qué datos tengo en cuenta? ¿Cuál es el modelo de ruido adecuado? ¿Cómo defino mis valores previos y compruebo la sensibilidad a los mismos? ¿Y la complejidad o la plausibilidad del modelo? ¿Cómo exploro una PDF posterior de alta dimensión en una escala de tiempo aceptable? ¿Qué nuevos datos debo adquirir para ayudar a distinguir entre los modelos que he probado? ¿Cómo utilizo los resultados del análisis para mejorar los modelos o proponer otros nuevos?  Se trata de preguntas que sólo pueden responderse en el contexto de problemas concretos, y que constituyen el centro de la investigación aplicada en materia de inferencia.

Inferencia: Poblaciones y muestras

La base de las pruebas de hipótesis con análisis estadístico es la inferencia. En pocas palabras, la inferencia -y la estadística inferencial por extensión- significa obtener conocimientos sobre una población a partir de una muestra de esa población. Dado que en la mayoría de los contextos no es posible disponer de todos los datos de una población entera de interés, tenemos que tomar una muestra de esa población. Sin embargo, para poder confiar en la inferencia, la muestra debe cubrir las variables teóricamente relevantes, los rangos de las variables y los contextos.

Poblaciones y muestras

Al realizar un análisis estadístico, diferenciamos entre poblaciones y muestras. La población es el conjunto total de elementos que nos interesan. La muestra es un subconjunto de esos elementos que estudiamos para comprender la población. Aunque nos interesa la población, a menudo tenemos que recurrir al estudio de una muestra debido a limitaciones de tiempo, financieras o logísticas que podrían hacer inviable el estudio de toda la población. En cambio, utilizamos la estadística inferencial para hacer inferencias sobre la población a partir de una muestra.

Muestreo y conocimiento

Tomemos una expresión relativamente común -pero quizá menos examinada- sobre lo que "sabemos" del mundo que nos rodea. Solemos decir que conocemos" a las personas, y a algunas las conocemos mejor que a otras. ¿Qué significa conocer a alguien? En parte debe significar que podemos anticipar cómo se comportaría esa persona en una amplia gama de situaciones. Si conocemos a esa persona por experiencia, entonces debe ser que hemos observado su comportamiento en una variedad suficiente de situaciones en el pasado para poder inferir cómo se comportaría en situaciones futuras.

Dicho de otro modo, hemos "muestreado" su comportamiento en una gama relevante de situaciones y contextos para confiar en que podemos anticipar su comportamiento en el futuro. Consideraciones similares sobre el muestreo podrían aplicarse a "conocer" un lugar, un grupo o una institución. De igual importancia son las muestras de observaciones a través de diferentes combinaciones de variables, necesarias para identificar las relaciones (o funciones) entre las variables. En resumen, las muestras -ya sean deliberadas y sistemáticas o de otro tipo- forman parte de lo que creemos conocer del mundo que nos rodea.

Estrategias de muestreo

Dada la importancia del muestreo, no debería sorprender que existan numerosas estrategias diseñadas para proporcionar una inferencia útil sobre las poblaciones. Por ejemplo, ¿cómo podemos juzgar si la temperatura de una sopa es adecuada antes de servirla? Podríamos remover la olla, para asegurar la uniformidad de la temperatura en las posibles muestras (del tamaño de una cuchara), y luego tomar una muestra de una cucharada.

Un problema especialmente espinoso en el muestreo es la práctica del cortejo, en la que los participantes pueden intentar dar lo mejor de sí mismos para causar una buena impresión. Dicho de otro modo, los participantes suelen tratar de sesgar la muestra de experiencias relacionales para quedar mejor que la media.

¿Qué implica el muestreo?

El muestreo en este contexto suele implicar:

(a) Obtener opiniones de otras personas, ampliando así (aunque sólo sea de forma indirecta) el tamaño de la muestra

(b) Observar a la pareja de cortejo en una amplia gama de circunstancias en las que puede ser difícil mantener el sesgo pretendido.

Dicho de manera formal, podemos intentar estratificar la muestra tomando observaciones en "celdas" apropiadas que correspondan a diferentes influencias potenciales sobre el comportamiento. Por ejemplo, entornos de alto estrés que impliquen la preparación de exámenes finales o la reunión con los padres.

Sin embargo, en el mejor de los casos, tratamos de eliminar el efecto de las distintas influencias en nuestras muestras mediante la aleatorización. Siguiendo con el ejemplo del cortejo, se podrían tomar observaciones del comportamiento a través de las interacciones de una serie de parejas y situaciones asignadas al azar. Pero, por supuesto, para entonces todas las apuestas están fuera de lugar para que las cosas funcionen de todos modos.

Técnicas de muestreo

Cuando se realiza estadística inferencial para inferir sobre las características de una población a partir de una muestra, es esencial tener claro cómo se ha extraído la muestra. El muestreo puede ser una práctica muy compleja con múltiples etapas para la obtención de la muestra final. Es deseable que la muestra sea alguna forma de muestra probabilística, es decir, una muestra en la que cada miembro de la población tiene una probabilidad conocida de ser muestreado.

La forma más directa de una muestra probabilística adecuada es una muestra aleatoria en la que todos tienen la misma probabilidad de ser incluidos en la muestra. Una muestra aleatoria tiene las ventajas de la simplicidad (en teoría) y la facilidad de inferencia, ya que no es necesario realizar ajustes en los datos. Sin embargo, la realidad de la realización de una muestra aleatoria puede hacer que el proceso sea bastante difícil.

Ejemplo 1 de Muestreo

Antes de poder extraer sujetos al azar, necesitamos una lista de todos los miembros de la población. Para muchas poblaciones (por ejemplo, los adultos residentes en EE.UU.) esa lista es imposible de obtener. No hace mucho tiempo, era razonable concluir que una lista de números de teléfono era una aproximación razonable a ese listado para los hogares estadounidenses.

Durante la época en que los teléfonos fijos eran omnipresentes, los encuestadores podían llamar a los números al azar (y quizás preguntar por el adulto del hogar que hubiera cumplido años más recientemente) para obtener una buena aproximación de una muestra aleatoria nacional. También era una época anterior a la identificación de las llamadas y a los tonos de llamada especializados. Esto significaba que las llamadas se contestaban de forma rutinaria, disminuyendo así -pero no eliminando- la preocupación por el sesgo de respuesta. Por supuesto, los hábitos telefónicos han cambiado y a los encuestadores les resulta cada vez más difícil argumentar que la marcación aleatoria de teléfonos fijos sirve como muestra representativa de los estadounidenses adultos.

Ejemplo 2 de Muestreo

A menudo se utilizan otras formas de muestreo probabilístico para superar algunas de las dificultades que presenta el muestreo aleatorio puro. Supongamos que nuestro análisis nos exige hacer comparaciones basadas en la raza. Sólo el 12,6% de los estadounidenses son afroamericanos.

Supongamos que también queremos tener en cuenta las preferencias religiosas. Sólo el 5% de los afroamericanos son católicos, lo que significa que sólo el 0,6% de la población es de ambas religiones. Si el tamaño de nuestra muestra es de 500, podríamos acabar con tres afroamericanos católicos. Una muestra aleatoria estratificada (también llamada muestra por cuotas) puede resolver ese problema. Una muestra aleatoria estratificada es similar a una muestra aleatoria simple, pero se extraerá de diferentes subpoblaciones, estratos, en diferentes porcentajes. Por lo tanto, la muestra total debe ser ponderada para que sea representativa de toda la población.

Muestreo por Conglomerados

Otro tipo de muestreo probabilístico habitual en las encuestas presenciales es el muestreo por conglomerados. Según Dorland’s Illustrated Medical Dictionary (1994), el muestreo por conglomerados inicialmente muestrea sobre la base de conglomerados (generalmente unidades geográficas, como las secciones censales) y luego muestrea a los participantes dentro de esas unidades. De hecho, este enfoque suele utilizar un muestreo de varios niveles, en el que el primer nivel puede ser una muestra de distritos del Congreso, luego de secciones censales y después de hogares. La muestra final tendrá que ser ponderada de forma compleja para reflejar las distintas probabilidades de que los individuos sean incluidos en la muestra.

Muestreo No Probabilístico

Las muestras no probabilísticas, o aquellas para las que se desconoce la probabilidad de inclusión de un miembro de la población en la muestra, pueden plantear problemas difíciles para la inferencia estadística. Sin embargo, en algunas condiciones, pueden considerarse representativas y utilizarse para la estadística inferencial.

Muestreo por Conveniencia

Las muestras de conveniencia (por ejemplo, los estudiantes de pregrado en el grupo de sujetos del Departamento de Psicología) son accesibles y tienen un coste relativamente bajo, pero pueden diferir de la población más grande a la que se quiere inferir en aspectos importantes. La necesidad puede empujar a un investigador a utilizar una muestra de conveniencia, pero la inferencia debe abordarse con precaución. Una muestra de conveniencia basada en "pregunté a personas que salieron del banco" podría proporcionar resultados muy diferentes a una muestra basada en "pregunté a personas que salieron de un establecimiento de préstamos de día de pago".

Muestreo Intencionado

Algunas muestras no probabilísticas se utilizan porque el investigador no quiere hacer inferencias a una población mayor. Una muestra intencionada o de juicio se basa en la discreción del investigador respecto a quién puede aportar información útil sobre el tema. Si queremos saber por qué se promulgó una ley, tiene sentido tomar una muestra del autor y los coautores del proyecto de ley, los miembros del comité, los dirigentes, etc., en lugar de una muestra aleatoria de los miembros del órgano legislativo.

Muestreo de Bola de Nieve

El muestreo de bola de nieve es similar a un muestreo intencionado en el sentido de que buscamos a personas con determinadas características, pero confiamos en que los sujetos nos recomienden a otros que cumplan los criterios que hemos establecido. Es posible que queramos conocer a jóvenes artistas con dificultades. Sin embargo, puede ser difícil encontrarlos, ya que sus obras no cuelgan en las galerías, así que podemos empezar con uno o varios que encontremos y luego preguntarles a quién más deberíamos entrevistar.

Las técnicas de muestreo pueden ser relativamente sencillas, pero a medida que uno se aleja del muestreo aleatorio simple, el proceso de muestreo se vuelve más complejo o limita nuestra capacidad de hacer inferencias sobre una población. Los investigadores utilizan todas estas técnicas con buenos propósitos y la mejor técnica dependerá de una serie de factores, como el presupuesto, la experiencia, la necesidad de precisión y la pregunta de investigación que se aborde. Sin embargo, en lo que queda de este texto, cuando hablemos de hacer inferencias, los datos se basarán en una muestra probabilística adecuadamente extraída.

Referencias Bibliográficas

Medewar P. (1996) Is the scientific paper a fraud? In: The Strange Case of the Spotted Mice and Other Essays. Cambridge: Oxford U. Press.
Popper KR.  (2005) The Logic of Scientific Discovery. New York: Basic Books.
Dorland’s Illustrated Medical Dictionary (1994). 28th Edition. Philadelphia: WB Saunders.

Deducción e Inferencia

Deducción e Inferencia

Abrir chat
1
Bienvenido(a) a Online Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!