¿CÓMO HACER UN ANÁLISIS DISCRIMINANTE MÚLTIPLE (Obsequio Libro Diseño de Experimentos de Montgomery)

CÓMO HACER UN ANÁLISIS DISCRIMINANTE MÚLTIPLE 

(Obsequio Libro Diseño de Experimentos de Montgomery)


ANÁLISIS DISCRIMINANTE MÚLTIPLE

Planteamiento del problema

Como una continuación del artículo presentado el día 15 de agosto de 2015 (http://plepso.blogspot.com/2015/08/analisis-discriminante-de-dos-grupos.html) a continuación se desarrolla el procedimiento para la aplicación del Análisis Discriminante Múltiple. En aqulla oportunidad se tomo como ejemplo.
Como se recordará se busca determinar las características sobresalientes de las familias que han visitado un centro vacacional durante los últimos dos años. Se tienen los siguientes datos:
Los cuales también pueden usarse para ilustrar el análisis discriminante de tres grupos. En la última columna de esas tablas, se clasifican las familias en tres categorías, según la cantidad gastada en las vacaciones familiares (alta, media o baja) L, M y H según sus letra inicial en Inglés. En cada categoría caen diez familias. La pregunta de interés es si pueden diferenciarse las familias que gastan cantidades altas, medias o bajas en sus vacaciones (CANTIDAD), en términos del ingreso anual de la familia (INGRESO), actitud hacia los viajes (VIAJES), importancia atribuida a las vacaciones familiares (VACACIONES), tamaño de la familia (TAMAÑOF) y edad del jefe de familia (EDAD).

Cálculo de los coeficientes de la función discriminante

La tabla anterior presenta los resultados del cálculo del análisis discriminante de tres grupos. Un examen de las medias del grupo indica que el ingreso parece separar más a los grupos que cualquier otra variable.
Existe cierta separación entre viaje y vacaciones. Los grupos 1 y 2 están muy cercanos en términos del tamaño de la familia y la edad. La edad tiene una desviación estándar grande en relación con la separación entre los grupos. La matriz de correlaciones agrupadas intragrupales indica cierta correlación de las vacaciones y el tamaño de la familia con los ingresos. La edad tiene cierta correlación negativa con los viajes. Sin embargo, esas correlaciones están en la parte inferior, lo cual indica que aunque pueden existir algunos problemas con la multicolinealidad, no es probable que sean de gravedad. La significancia asignada a las razones F univariadas indica que cuando los predictivo se consideran de manera individual, sólo el ingreso y los viajes son significativos para diferenciar entre los dos grupos.
En el análisis discriminante múltiple, si existen G grupos, pueden calcularse G – 1 funciones discriminantes, si el número de predictivos es mayor que esta cantidad. En general con G grupos y k predictivos, es posible calcular las funciones discriminantes más pequeñas de G – 1 o k. La primera función tiene la razón más elevada de la suma de cuadrados entre e intragrupos. La segunda función, no correlacionada con la primera, tiene la segunda razón más alta y así sucesivamente. Sin embargo, no todas las funciones pueden ser estadísticamente significativas.
Dado que hay tres grupos, puede extraerse un máximo de dos funciones. El valor propio asociado con la primera función es 3,8190 y esta función da cuenta del 93,93 por ciento de la varianza explicada. Como el valor propio es grande, es probable que la primera función sea superior.
El valor propio de la segunda función es pequeño (0,2469) y sólo da cuenta de 6,07 por ciento de la varianza explicada.

Determinar la significancia de la función discriminante

Para probar la hipótesis nula de que los centroides de los grupos son iguales, ambas funciones deben considerarse al mismo tiempo. Si se prueban primero todas las medias al mismo tiempo, será posible probar las medias de las funciones de manera sucesiva. Luego se excluye una función a la vez y se prueban en cada paso las medias de las funciones restantes. En la tabla 18,5 el 0 debajo del encabezado Función posterior indica que no se eliminó ninguna función. El valor de λ de Wilks es 0,1644, que se transforma en una chi cuadrada de  c2 = 44,831, con 10 grados de libertad, lo cual es significativo más allá del nivel de 0,05. Por lo tanto, ambas funciones en conjunto hacen una discriminación significativa entre los tres grupos. Sin embargo, cuando se elimina la primera función, la λ de Wilks asociada con la segunda función es 0,8020, lo que no es significativa al nivel de 0,05.
Por consiguiente, la segunda función no hace una contribución significativa a las diferencias entre los grupos.

Interpretación de los resultados

La interpretación de los resultados se facilita al examinar los coeficientes estandarizados de la función discriminante, la estructura de correlaciones y ciertas gráficas.
Los coeficientes estandarizados indican un coeficiente grande para el ingreso en la función 1; mientras que la función 2 tiene coeficientes relativamente altos para viajes, vacaciones y edad. Cuando se examina la matriz estructural se llega a una conclusión similar véase la tabla de resultados. Para ayudar a la interpretación de las funciones, se agruparon las variables con coeficientes altos para una función particular.
Esas agrupaciones se muestran con asteriscos. Por lo tanto, ingreso y tamaño de familia tienen asteriscos en la función 1, porque estas variables tienen coeficientes mayores en la función 1 que en la función 2. Esas variables se asocian sobre todo con la función 1. Por otro lado, los viajes, las vacaciones y la edad se asocian en forma predominante con la función 2, como lo señalan los asteriscos.
La figura que se presenta a continuación es un diagrama de dispersión de todos los grupos en la función 1 y en la función 2.
Se observa que el grupo 3 tiene el valor más alto en la función 1 y el grupo 1 el menor. Dado que la función 1 se asocia sobre todo con el ingreso y el tamaño de familia, se esperaría que los tres grupos estén ordenados en esas dos variables. Es probable que las personas con altos ingresos y familias grandes gasten mucho dinero en sus vacaciones y que, a la inversa, el gasto en vacaciones sea menor entre las personas con bajos ingresos y familias de menor tamaño. Esta interpretación se fortalece al examinar las medias de los grupos en ingreso y tamaño de la familia.
La siguiente figura indica también que la función 2 tiende a separar el grupo 1 (valor más alto) del grupo 2 (valor más bajo). Esta función se asocia sobre todo con viajes, vacaciones y edad. Dadas las correlaciones positivas de estas variables con la función 2 en la matriz estructural, esperamos encontrar que el grupo 1 sea mayor que el grupo 2, en términos de viajes, vacaciones y edad.
Esto es real para viajes y vacaciones, como lo indican las medias de los grupos en estas variables. Si las familias del grupo 1 tienen actitudes más favorables hacia los viajes y dan más importancia a las vacaciones familiares que las familias del grupo 2, ¿por qué gastan menos dinero? Quizá les gustaría gastar más en vacaciones, pero no pueden hacerlo porque tienen bajos ingresos.
Se obtiene una interpretación similar al examinar un mapa territorial, como se muestra en la figura. En un mapa territorial, un asterisco señala el centroide de cada grupo. Los límites de los grupos se indican con los números que les corresponden. Por lo tanto, el centroide del grupo 1 está limitado por los números 1, el centroide del grupo 2 por números 2 y el centroide del grupo 3 por números 3.

Evaluación de la validez del Análisis Discriminante

Los resultados de la clasificación que se basan en la muestra de análisis indican una correcta clasificación de (9 + 9 + 8)/30 = 86,7 por ciento de los casos. La validación cruzada con exclusión clasifica correctamente apenas a (7 + 5 + 8)/30 = 0,667 o 66,7 por ciento de los casos. Cuando se realiza el análisis de clasificación sobre la muestra de validación independiente de la tabla se obtiene una proporción de aciertos de (3 + 3 + 3)/12 = 75 por ciento. Dados tres grupos de igual tamaño, se esperaría por simple azar una proporción de aciertos de 1/3 = 0,333 o 33,3 por ciento. Por consiguiente, la mejoría sobre el azar es mayor del 25 por ciento, lo cual indica una validez por lo menos satisfactoria.
Es bueno mencionar que todos los resultados aquí presentados fueron generados con la utilización del software Statistical Package for Social Sciences (SPSS) en castellano Paquete Estadístico para las Ciencias Sociales.

(Obsequio Libro Diseño de Experimentos de Montgomery)


Si te gustó el artículo o tienes alguna crítica constructiva coméntalo  y recuerda suscribirte al blog. Ah, y comparte con un Tiweet, +1 o por Facebook tus comentarios. Hasta una próxima entrega.
Para diseños de investigación de mercados, levantamiento de estudios de opinión pública y de seguimiento electoral no dude en contactar a Plepso Investigación, C. A. por sus teléfonos 0243 237.54.06 y 0412 439.25.85, o al correo electrónico  jpleal@yahoo.com
PALABRA CLAVE: #QuédateEnCasa, #CoroNaVirus, #Covid-19, Universidad Central de Venezuela - UJAP - Universidad de Carabobo - UBA- Universidad Simón Bolívar - Universidad de Oriente - Universidad Santa María - Universidad Bicentenaria


FUENTES BIBLIOGRÁFICAS Y DOCUMENTALES
Aaker, D. y Day, G. S. (1989) Investigación de Mercados. México. Tercera Edición. Segunda Edición en Castellano. Mc Graw-Hill
Abraira Santos, Víctor. Métodos Multivariantes en bioestadística.
Cuadras, Carles (2008). «Capítulo 6: Análisis factorial». Nuevos métodos de análisis multivariante. CMC Editions.
Kotler, Philup y Armstrong, Gary (1991) Fundamentos de Mercadotecnia. 2da Edición. México. Prentice-Hall Hispanoamericana
Lovelock, Christopher (1997) Mercadotecnia de Servicios. 3ra Edición. México. Prentice-Hall Hispanoamericana
Malhotra, N (1997) Investigación de mercado, un enfoque práctico. Naucalpan de Juárez México. Prentice Hall Segunda Edición
Pérez Leal, J. (2015) Análisis Discriminante de Dos Grupos. [Artículo en línea] disponible en: http://plepso.blogspot.com/2015/08/analisis-discriminante-de-dos-grupos.html [Consulta: 2015, agosto 22]
Spearman, Charles (1927). The Abilities of Man.
Zikmund, W (1998) Investigación de Mercados. 6ta edición. Naucalpán de Juárez - México Prentice-Hall Hispanoamericana, A. A.

Comentarios