Técnicas Avanzadas de Análisis Multivariante: ACM, AID, CHAID, Análisis Conjunto, MONANOVA, Correlaciones Canónicas y Redes Neuronales
Clasificado en Francés
Escrito el en español con un tamaño de 4,66 KB
Técnicas de Análisis Multivariante
Análisis de Correspondencias Múltiples (ACM)
El Análisis de Correspondencias Múltiples (ACM) analiza la relación entre una **variable dependiente** y varias **variables independientes**. La primera se mide en una escala métrica, mientras que las segundas son no métricas. El modelo es aditivo, pero puede detectar relaciones no lineales. También mide el efecto global de cada variable explicativa.
Los coeficientes se estiman mediante el método de mínimos cuadrados. La proporción de la varianza de la variable dependiente explicada por cada una de las variables independientes se llama eta cuadrado. La medida de la relación entre una variable independiente y la variable dependiente, manteniendo constantes las demás, se llama beta cuadrado.
Análisis Automático de la Interacción (AID)
El Análisis Automático de la Interacción (AID) estudia la relación de dependencia entre una **variable dependiente** y múltiples **variables independientes**. Detecta el efecto y las interacciones entre las variables explicativas. Su función principal es la segmentación de mercados. Las variables explicativas se miden con escalas nominales, mientras que la variable dependiente puede ser métrica o dicotómica.
Análisis de Interacción de Chi-Cuadrado (CHAID)
El Análisis de Interacción de Chi-Cuadrado (CHAID) es un método de análisis de dependencia entre una **variable dependiente** y múltiples **variables independientes** categóricas. Identifica diferencias en la distribución de las respuestas de la variable dependiente sobre la base de las características de las variables independientes.
Análisis Conjunto
El Análisis Conjunto determina el efecto conjunto de dos o más atributos de las **variables independientes** sobre la evaluación de un objeto (**variable dependiente**). El análisis conjunto categórico es aquel en el que tanto la variable dependiente como las variables independientes son categóricas.
MONANOVA
MONANOVA es un método para el desarrollo del análisis conjunto ordinal. Es un modelo aditivo que determina los efectos principales de las **variables independientes** a partir de un diseño factorial completo. Busca minimizar el estrés, que puede considerarse como la varianza residual dividida por la varianza total, y utiliza para ello el gradiente.
Análisis de Correlaciones Canónicas
El Análisis de Correlaciones Canónicas analiza la relación entre múltiples **variables dependientes** y múltiples **variables independientes**, todas con escalas métricas. El análisis de regresión múltiple es un caso particular de este. Un requisito es que el número de variables dependientes sea menor o igual que el de variables independientes. Las funciones canónicas tienen la propiedad de maximizar la correlación entre las combinaciones lineales de las variables dependientes e independientes.
Redes Neuronales Artificiales
En las Redes Neuronales Artificiales, las neuronas de entrada representan las **variables independientes** y las neuronas de salida representan las **variables dependientes**. El aprendizaje o entrenamiento de una red es el proceso por el cual las neuronas ajustan sus respuestas para que el comportamiento de la red se ajuste al esperado. Tiene como finalidad reducir los errores entre los valores de salida finales reales y los esperados. Los datos utilizados en el proceso de aprendizaje se denominan conjunto de entrenamiento.
El algoritmo por el que se ajustan los pesos sinápticos se llama retropropagación, mediante la tasa de aprendizaje que oscila entre 1 y 0. Las correcciones en los pesos sinápticos también se modifican con el momento, que varía entre 0 y 1, y contribuye a que los pesos cambien de valor siempre en la misma dirección, teniendo como finalidad tratar de impedir los mínimos locales.
La medida del rendimiento de una red neuronal se determina por el error cuadrático medio, que es el resultado de dividir la suma de los cuadrados de los errores entre los valores estimados y reales de las variables de salida por el número total de estimaciones en cada iteración. La interpretación de los coeficientes es difícil porque no proporciona información sobre la importancia relativa de las variables de entrada y los valores de los pesos sinápticos no son idénticos en dos entrenamientos sucesivos.