Los modelos geométricos y algebraicos intentan describir las relaciones estructurales subyacentes entre las variables. En algunos casos, forman parte de un enfoque probabilístico. Por ejemplo, los modelos algebraicos que subyacen a la regresión o las representaciones geométricas de las correlaciones entre ítems en una técnica denominada análisis factorial.

En otros casos, los modelos geométricos y algebraicos se desarrollan sin modelar explícitamente el elemento de aleatoriedad o incertidumbre que siempre está presente en los datos. Aunque este último enfoque de los problemas de las ciencias sociales y del comportamiento ha sido menos investigado que el probabilístico, existen algunas ventajas en el desarrollo de los aspectos estructurales independientes de los estadísticos. Comenzamos la discusión con algunas representaciones inherentemente geométricas. Luego pasamos a las representaciones numéricas para datos ordenados.

La Geometría y las Representaciones Geométricas

Aunque la geometría es un gran tema matemático, poco de ella parece ser directamente aplicable a los tipos de datos que se encuentran en las ciencias sociales y del comportamiento. Según Firestein (2016), una de las principales razones es que los conceptos primitivos que se utilizan normalmente en la geometría -puntos, líneas, coincidencias- no se corresponden de forma natural con los tipos de observaciones cualitativas. Es especial aquellas que suelen obtenerse en los contextos de las ciencias sociales y del comportamiento.

Sin embargo, dado que las representaciones geométricas se utilizan para reducir cuerpos de datos, existe una necesidad real de desarrollar una comprensión más profunda. Sobre todo de cuándo tienen sentido dichas representaciones de datos sociales o psicológicos. Además, existe una necesidad práctica de comprender por qué los algoritmos informáticos geométricos, como los de escalamiento multidimensional, funcionan tan bien como aparentemente lo hacen. Una mejor comprensión de los algoritmos aumentará la eficacia y la idoneidad de su uso. Esto resulta cada vez más importante con la disponibilidad generalizada de programas de escalado para microordenadores.

Modelos de Escalado

A lo largo de los últimos 50 años se han desarrollado varios tipos de técnicas de escalado bien entendidas. Se han utilizado ampliamente para ayudar en la búsqueda de representaciones geométricas adecuadas de los datos empíricos. De acuerdo con National Academies of Sciences Engineering, & Medicine (2017), todo el campo del escalado está entrando ahora en una coyuntura crítica en cuanto a la unificación y la síntesis de lo que antes parecían ser contribuciones dispares.

En los últimos años se ha puesto de manifiesto que varios de los principales métodos de análisis, incluidos algunos basados en supuestos probabilísticos, pueden unificarse bajo la rúbrica de una única estructura matemática generalizada. Por ejemplo, recientemente se ha demostrado que enfoques tan diversos como el escalamiento multidimensional no métrico, el análisis de componentes principales, el análisis factorial, el análisis de correspondencia y el análisis logarítmico-lineal, tienen más en común en términos de estructura matemática subyacente de lo que se había pensado anteriormente.

Escalamiento Multidimensional

El escalamiento multidimensional no métrico es un método que comienza con datos sobre el ordenamiento establecido por la similitud subjetiva (o cercanía) entre pares de estímulos. La idea es incrustar los estímulos en un espacio métrico. Es decir, una geometría con una medida de distancia entre puntos. De esta manera las distancias entre los puntos correspondientes a los estímulos muestren el mismo ordenamiento que los datos.

Este método se ha aplicado con éxito a fenómenos que, por otros motivos, se sabe que pueden describirse en términos de una estructura geométrica específica. Tales aplicaciones se utilizaron para validar los procedimientos. Dicha validación se hizo, por ejemplo, con respecto a la percepción de los colores. Se sabe que se pueden describir en términos de una estructura tridimensional particular conocida como las coordenadas de color euclidianas. Se han hecho aplicaciones similares con los símbolos del código Morse y los fonemas hablados. La técnica se utiliza ahora en algunas aplicaciones biológicas y de ingeniería. También en algunas ciencias sociales, como método de exploración y simplificación de datos.

La Base Axiomática

Una cuestión de interés es cómo desarrollar una base axiomática para diversas geometrías utilizando como concepto primitivo un observable. Por ejemplo la ordenación por parte del sujeto de la similitud relativa de un par de estímulos con otro, que es el punto de partida típico de dicho escalamiento. La tarea general consiste en descubrir propiedades de los datos cualitativos suficientes para garantizar que existe un mapeo en la estructura geométrica e, idealmente, descubrir un algoritmo para encontrarlo.

Se han realizado algunos trabajos de este tipo general. Por ejemplo, existe un elegante conjunto de axiomas basados en las leyes de correspondencia de los colores que da lugar a la representación vectorial tridimensional del espacio cromático. Pero el problema más general de entender las condiciones en las que los algoritmos de escalado multidimensional son adecuados sigue sin resolverse. Además, es necesario trabajar en la comprensión de modelos espaciales más generales, no euclidianos.

Sistemas factoriales ordenados

Un tipo de estructura común en las ciencias surge cuando una variable dependiente ordenada se ve afectada por dos o más variables independientes ordenadas. Esta es la situación a la que suelen aplicarse los modelos de regresión y de análisis de la varianza. También es la estructura que subyace a las conocidas identidades físicas. Aquí las unidades físicas se expresan como productos de las potencias de otras unidades. Por ejemplo, la energía tiene la unidad de masa por el cuadrado de la unidad de distancia dividido por el cuadrado de la unidad de tiempo.

Hay muchos ejemplos de este tipo de estructuras en las ciencias sociales y del comportamiento. Un ejemplo es la ordenación de las preferencias de los paquetes de productos básicos -colecciones de varias cantidades de productos básicos- que puede revelarse directamente. Puede ser mediante expresiones de preferencia o indirectamente mediante la elección entre conjuntos alternativos de paquetes. Otro ejemplo relacionado es el de las preferencias entre cursos de acción alternativos que implican varios resultados con diferentes grados de incertidumbre. Este es uno de los problemas más investigados debido a su importancia potencial en la toma de decisiones.

Un ejemplo psicológico es la compensación entre la demora y la cantidad de la recompensa. Esto produce aquellas combinaciones que son igualmente reforzantes. En un tipo de problema común y aplicado, se da a un sujeto descripciones de personas en términos de varios factores. Por ejemplo, inteligencia, creatividad, diligencia y honestidad, y se le pide que las califique según un criterio como la idoneidad para un trabajo concreto.

Las Regularidades de los Datos y la Representación Numérica

En todos estos casos y en una miríada de otros similares, la cuestión es si las regularidades de los datos permiten una representación numérica. En un principio, se han estudiado con detenimiento tres tipos de representaciones. Estos son la variable dependiente como una suma, un producto o una media ponderada de las medidas asociadas a las variables independientes. Las dos primeras representaciones son la base de algunas investigaciones psicológicas y económicas, así como de una parte considerable de la medición física y la modelización en la estadística clásica. La tercera representación, el promedio, ha demostrado ser muy útil para entender las preferencias entre resultados inciertos y la amalgama de rasgos descritos verbalmente, así como algunas variables físicas.

Para cada uno de estos tres casos -sumar, multiplicar y promediar- los investigadores saben qué propiedades o axiomas de orden deben satisfacer los datos para que esa representación numérica sea adecuada. Partiendo de la base de que existe una u otra de estas representaciones, y utilizando las valoraciones numéricas de los sujetos en lugar de la ordenación, se ha desarrollado y aplicado en varios ámbitos una técnica de escalado denominada medición funcional. La misma hace referencia a la función que describe cómo se relaciona la variable dependiente con las independientes. Lo que sigue siendo problemático es cómo abarcar en el nivel ordinal el hecho de que un cierto error aleatorio se inmiscuye en casi todas las observaciones. A continuación, se debe mostrar cómo se representa esa aleatoriedad en el nivel numérico. Esto sigue siendo una cuestión de investigación no resuelta y desafiante.

Evolución de las Representaciones

En los últimos años se ha avanzado considerablemente en la comprensión de ciertas representaciones intrínsecamente diferentes de las que acabamos de comentar. El trabajo se ha centrado en tres aspectos relacionados. El primero es un esquema de clasificación de las estructuras según el grado de restricción de su representación. Las tres representaciones numéricas clásicas se conocen como tipos de escala ordinal, de intervalo y de razón.

Para los sistemas con representaciones numéricas continuas y de tipo de escala al menos tan rica como la de razón, se ha demostrado que sólo puede existir un tipo adicional. Un segundo impulso es aceptar los supuestos estructurales, como los factoriales. Luego derivar para cada escala las posibles relaciones funcionales entre las variables independientes. Y el tercer impulso es desarrollar axiomas para las propiedades de una relación de orden que conduzca a las posibles representaciones. En la actualidad se sabe mucho sobre las posibles representaciones no aditivas. Esto tanto en el caso de los multifactores como en el de los estímulos combinables, como la combinación de intensidades de sonido.

Modelos de Clustering

Muchos temas no parecen representarse correctamente en términos de distancias en un espacio geométrico continuo. Más bien, en algunos casos, como las relaciones entre los significados de las palabras -que son de gran interés en el estudio de las representaciones de la memoria-, parece ser más esclarecedora una descripción en términos de estructuras jerárquicas en forma de árbol. De acuerdo con Bouter et al (2016), este tipo de descripción parece apropiado tanto por la naturaleza categórica de los juicios como por la naturaleza jerárquica, más que de compensación, de la estructura.

Los elementos individuales se representan como los nodos terminales del árbol, y las agrupaciones por diferentes grados de similitud se muestran como nodos intermedios, y las agrupaciones más generales aparecen más cerca de la raíz del árbol. Se han desarrollado y se están desarrollando técnicas de agrupación que requieren una considerable capacidad de cálculo. Existen algunas aplicaciones exitosas, pero se espera que se perfeccionen mucho más.

Modelos de red

Recientemente se han desarrollado otras líneas de modelización avanzada que abren nuevas posibilidades de especificación empírica y comprobación de diversas teorías. En los datos de redes sociales, las relaciones entre las unidades, más que las propias unidades, son los principales objetos de estudio: amistades entre personas, lazos comerciales entre naciones, grupos de cocitación entre investigadores, interrelación entre consejos de administración de empresas. En la última década se han desarrollado modelos especiales para los datos de las redes sociales. Estos proporcionan, entre otras cosas, nuevas medidas precisas de la fuerza de los vínculos relacionales entre las unidades. Uno de los principales retos actuales de los datos de redes sociales es manejar la dependencia estadística que surge cuando las unidades muestreadas están relacionadas de forma compleja.

Referencias Bibliográficas

National Academies of Sciences Engineering, & Medicine (2017) Fostering Integrity in Research (The National Academies Press, Washington, DC).

Bouter LM, Tijdink J, Axelsen N, Martinson BC, ter Riet G (2016) Ranking major and minor research misbehaviors: Results from a survey among participants of four World Conferences on Research Integrity. Res Integr Peer Rev 1:17.

Firestein S (2016) Failure: Why Science Is So Successful (Oxford Univ Press, Oxford).

También te puede interesar: Modelos Probabilísticos para la Recolección de Datos Estadísticos

Modelos Geométricos y Algebraicos para la Recolección de Datos Estadísticos

Modelos Geométricos y Algebraicos para la Recolección de Datos Estadísticos

Abrir chat
1
Bienvenido(a) a Online Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!