El análisis factorial es una técnica que se utiliza para reducir una gran cantidad de variables en menores cantidades denominadas factores. Esta técnica extrae la máxima varianza común de todas las variables y las coloca en una puntuación común. Como índice de todas las variables, podemos usar esta puntuación para un análisis más detallado. El análisis factorial es parte del modelo lineal general (GLM) y este método también asume varios supuestos: existe una relación lineal, no hay multicolinealidad. Incluye además variables relevantes en el análisis y existe una correlación verdadera entre variables y factores. Hay varios métodos disponibles, pero el análisis de componentes principales se usa con mayor frecuencia.
¿Por qué usar Análisis Factorial?
El análisis factorial es una herramienta útil para investigar relaciones variables para conceptos complejos como el estado socioeconómico, los patrones dietéticos o las escalas psicológicas. Permite a los investigadores investigar conceptos que no se pueden medir fácilmente directamente al colapsar una gran cantidad de variables en unos pocos factores subyacentes interpretables.
¿Qué es un Factor?
El concepto clave del análisis factorial es que múltiples variables observadas tienen patrones de respuestas similares porque todas están asociadas con una variable latente (es decir, no medida directamente). Por ejemplo, las personas pueden responder de manera similar a las preguntas sobre ingresos, educación y ocupación, que están asociadas con el estado socioeconómico variable latente.
En cada análisis factorial, hay la misma cantidad de factores que variables. Cada factor captura una cierta cantidad de la varianza general en las variables observadas, y los factores siempre se enumeran en orden de cuánta variación explican.
El valor propio es una medida de cuánto de la varianza de las variables observadas explica un factor. Cualquier factor con un valor propio ≥1 explica más varianza que una sola variable observada.
Los factores que explican la menor cantidad de variación generalmente se descartan. La relación de cada variable con el factor subyacente se expresa mediante la llamada carga factorial.
Tipos de Análisis Factorial
Existen diferentes tipos de métodos utilizados para extraer el factor del conjunto de datos:
- Análisis de componentes principales: este es el método más común utilizado por los investigadores. Se comienza a extraer la varianza máxima y los coloca en el primer factor. Después de eso, se elimina esa varianza explicada por los primeros factores y luego comienza a extraer la varianza máxima para el segundo factor. Este proceso va al último factor.
- Análisis factorial común: el segundo método más preferido por los investigadores, extrae la varianza común y los pone en factores. Este método no incluye la varianza única de todas las variables.
- Factorización de imagen: este método se basa en la matriz de correlación. El método de regresión se usa para predecir el factor en la factorización de imágenes.
- Método de máxima verosimilitud: este método también funciona en la métrica de correlación, pero utiliza el método de máxima verosimilitud para factorizar.
- Otros métodos de análisis factorial: la factorización Alfa supera los mínimos cuadrados. El cuadrado de peso es otro método basado en regresión que se usa para factorizar.
Factor de Carga
La carga de factores es básicamente el coeficiente de correlación para la variable y el factor. La carga de factores muestra la varianza explicada por la variable en ese factor en particular.
Valores propios: los valores propios también se denominan raíces características. Los valores propios muestran la varianza explicada por ese factor particular de la varianza total.
Puntuación del factor: la puntuación del factor también se denomina puntuación del componente. Este puntaje es de todas las filas y columnas, que se pueden usar como índice de todas las variables y se pueden usar para un análisis posterior. Podemos estandarizar este puntaje multiplicando un término común. Con este puntaje de factor, cualquier análisis que hagamos, asumiremos que todas las variables se comportarán como puntajes de factor y se moverán.
Criterios para determinar el número de factores: de acuerdo con el criterio de Kaiser, los valores propios son un buen criterio para determinar un factor. Si los valores propios son mayores que uno, deberíamos considerar que un factor y si los valores propios son menores que uno, entonces no deberíamos considerarlo como un factor. De acuerdo con la regla de extracción de varianza, debe ser mayor que 0.7. Si la varianza es menor que 0.7, entonces no deberíamos considerar eso un factor.
Método de rotación: el método de rotación hace que sea más confiable comprender la salida. Los valores propios no afectan el método de rotación, pero el método de rotación afecta los valores propios o el porcentaje de varianza extraído.
Ejecución del Análisis Factorial
Como analista de datos, el objetivo de un análisis factorial es reducir el número de variables para explicar e interpretar los resultados. La extracción de factores implica elegir el tipo de modelo y la cantidad de factores a extraer. La rotación de factores se produce después de que se extraen los factores, con el objetivo de lograr una estructura simple para mejorar la capacidad de interpretación.
Análisis Factorial Confirmatorio
El análisis factorial confirmatorio le permite al investigador determinar si existe una relación entre un conjunto de variables observadas (también conocidas como variables manifiestas) y sus construcciones subyacentes. Es similar al análisis factorial exploratorio. Con el Análisis factorial confirmatorio podemos especificar la cantidad de factores necesarios. Aunque es técnicamente aplicable a cualquier disciplina, generalmente se usa en las ciencias sociales.
Implementación del Análisis Factorial Confirmatorio
Realizar una revisión de la literatura para ayudarlo a elegir un modelo apropiado. Por ejemplo, podemos elegir un diagrama o ecuaciones.
Determinar si son posibles valores únicos para la estimación del parámetro de población.
Recopilación de datos.
Realizar un análisis de datos inicial para verificar problemas como datos faltantes, colinealidad o valores atípicos.
Estimar los parámetros de la población.
Determinar si el modelo que eligió funciona. Si el modelo es inaceptable, debemos considerar realizar un Análisis Factorial Exploratorio.
Análisis Factorial Exploratorio
El Análisis Factorial Exploratorio se utiliza para encontrar la estructura subyacente de un gran conjunto de variables. Reduce los datos a un conjunto mucho más pequeño de variables de resumen. Es casi idéntico al análisis factorial confirmatorio. Ambas técnicas pueden usarse para confirmar o explorar. Las similitudes son:
Evaluar la fiabilidad interna de una medida.
Examinar factores o construcciones teóricas representadas por conjuntos de ítems. Asumir que los factores no están correlacionados.
Investigar la calidad de los artículos individuales.
Análisis Generalizado de Procrustes
El análisis de Procrustes es una forma de comparar dos conjuntos de configuraciones o formas. Originalmente desarrollada para combinar dos soluciones del análisis factorial, la técnica se extendió al análisis generalizado de Procrustes para poder comparar más de dos formas. Las formas están alineadas con una forma objetivo o entre sí.
Este análisis utiliza transformaciones geométricas (es decir, reescalamiento isotrópico, reflexión, rotación o traducción) de matrices para comparar los conjuntos de datos.
La matriz de consenso es como su nombre indica, el resultado de los promedios de todas las matrices de entrada. Las matrices formadas durante el proceso de Análisis de Procrustes Generalizado pueden ingresarse en el Análisis de Componentes Principales y proyectarse en un espacio bidimensional para obtener resultados fáciles de entender.
Uso en Perfiles Sensoriales
El análisis generalizado de Procrustes es una forma de encontrar una estructura subyacente en el perfil sensorial, que se divide en dos categorías: perfil convencional y perfil de libre elección.
Con el perfil convencional, se proporciona un conjunto fijo de términos descriptivos para los evaluadores. Los evaluadores suelen ser personas altamente capacitadas. Por ejemplo, podría preguntar a tres expertos sus opiniones sobre el cuerpo, el aroma y el sabor de cuatro marcas de vino. Las descripciones fijas pueden incluir nítidas, angulares y mantecosas. Los resultados se pueden promediar, por lo que es posible utilizar el análisis factorial o el análisis de componentes principales, así como el Análisis de Procrustes, para analizar la prueba.
El perfil de libre elección brinda a los encuestados la libertad de responder preguntas en sus propios términos descriptivos. Las categorías son las dimensiones del análisis generalizado de Procrustes. Idealmente, el número de dimensiones es igual en todos los ámbitos (en este ejemplo, eso significaría que el experto dio una calificación en las tres áreas). Sin embargo, es posible ejecutar el Análisis generalizado de Procrustes utilizando dimensiones desiguales.
Variables Latentes
Una variable latente o variable generalmente se considera como una variable que no es directamente medible u observable. Por ejemplo, el nivel de neurosis, conciencia o apertura de una persona son variables latentes. Aunque no puede ver estas variables subyacentes (no son parte del conjunto de datos de un experimento), pueden causar efectos en sus resultados experimentales. Las variables latentes también se conocen como: construcciones hipotéticas.
Las variables latentes a veces se usan en técnicas de modelado estadístico como el análisis factorial, donde se pueden inferir a través de técnicas de modelado. Están siempre presentes en casi todos los análisis de regresión, porque todos los términos de error aditivo no son medibles (y, por lo tanto, están latentes).
Los métodos de modelado estadístico que a menudo se usan para identificar variables latentes incluyen: Algoritmos EM, Análisis factorial, Modelos ocultos de Markov, Análisis semántico latente, Análisis de componentes principales y Modelos de ecuaciones estructurales.
Una variable latente también puede estar presente (e incluida en un modelo) cuando no existe el objetivo de medir realmente eso.
Variables manifiestas
Las variables manifiestas (también llamadas variables observables) se pueden medir u observar directamente. Son lo opuesto a las variables latentes. Por ejemplo, la edad y el género son variables observables. Sin embargo, es raro que pueda estar 100% seguro de una variable. Incluso el género, si se observa, no es 100% seguro, porque las personas pueden mentir sobre su forma, disfrazar su género real o ser una persona transgénero. Por lo tanto, debe usar variables latentes siempre que sea posible.
Conclusiones
El análisis factorial es un método para modelar variables observadas y su estructura de covarianza, en términos de un número menor de factores subyacentes no observables (latentes). Los factores generalmente se consideran conceptos o ideas generales que pueden describir un fenómeno observado. Por ejemplo, un deseo básico de obtener cierto nivel social podría explicar la mayoría del comportamiento de consumo. Estos factores no observados son más interesantes para el científico social que las mediciones cuantitativas observadas.
El análisis factorial es generalmente un método exploratorio – descriptivo que requiere muchos juicios subjetivos. Es una herramienta ampliamente utilizada y a menudo controvertida porque los modelos, métodos y subjetividad son tan flexibles que pueden producirse debates sobre interpretaciones.
El método es similar a los componentes principales, aunque, el análisis factorial es más elaborado. En cierto sentido, el análisis factorial es una inversión de componentes principales. En el análisis factorial modelamos las variables observadas como funciones lineales de los factores. Con respecto a los componentes principales, creamos nuevas variables que son combinaciones lineales de las variables observadas.
Si tu tesis conlleva algún tipo de enfoque relacionado con un análisis especializado, nuestros asesores cuentan con años de dilatada experiencia en diversas áreas. En Online-Tesis.com, estamos para cumplir tu sueño.
Nuestros especialistas esperan por ti para que los contactes a través del formulario de cotización o del chat directo. También contamos con canales de comunicación confidenciales como WhatsApp y Messenger. Y si quieres estar al tanto de nuestros novedosos servicios y las diferentes ventajas de contratarnos, síguenos en Facebook, Instagram o Twitter.
Si este artículo fue de tu agrado, no olvides compartirlo por tus redes sociales.
Referencias Bibliográficas
Bryant, F. B., & Yarnold, P. R. (1995). Principal components analysis and exploratory and confirmatory factor analysis. In L. G. Grimm & P. R. Yarnold (Eds.), Reading and understanding multivariate analysis. Washington, DC: American Psychological Association.
Dunteman, G. H. (1989). Principal components analysis. Newbury Park, CA: Sage Publications.
Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., & Strahan, E. J. (1999). Evaluating the use of exploratory factor analysis in psychological research. Psychological Methods, 4(3), 272-299.
También te puede interesar: Experimentos basados en Internet