¿CÓMO HACER UN ANÁLISIS DISCRIMINANTE MÚLTIPLE (Obsequio Libro Diseño de Experimentos de Montgomery)
CÓMO HACER UN ANÁLISIS DISCRIMINANTE MÚLTIPLE
(Obsequio Libro Diseño de Experimentos de Montgomery)
ANÁLISIS DISCRIMINANTE MÚLTIPLE
Planteamiento del problema
Como una continuación del artículo
presentado el día 15 de agosto de 2015 (http://plepso.blogspot.com/2015/08/analisis-discriminante-de-dos-grupos.html)
a continuación se desarrolla el procedimiento para la aplicación del Análisis
Discriminante Múltiple. En aqulla oportunidad se tomo como ejemplo.
Como se recordará se busca
determinar las características sobresalientes de las familias que han visitado
un centro vacacional durante los últimos dos años. Se tienen los siguientes
datos:
Los cuales también pueden usarse
para ilustrar el análisis discriminante de tres grupos. En la última columna de
esas tablas, se clasifican las familias en tres categorías, según la cantidad
gastada en las vacaciones familiares (alta, media o baja) L, M y H según sus
letra inicial en Inglés. En cada categoría caen diez familias. La pregunta de
interés es si pueden diferenciarse las familias que gastan cantidades altas,
medias o bajas en sus vacaciones (CANTIDAD), en términos del ingreso anual de
la familia (INGRESO), actitud hacia los viajes (VIAJES), importancia atribuida
a las vacaciones familiares (VACACIONES), tamaño de la familia (TAMAÑOF) y edad
del jefe de familia (EDAD).
Cálculo de los coeficientes de la función discriminante
La tabla anterior presenta los
resultados del cálculo del análisis discriminante de tres grupos. Un examen de
las medias del grupo indica que el ingreso parece separar más a los grupos que
cualquier otra variable.
Existe cierta separación entre
viaje y vacaciones. Los grupos 1 y 2 están muy cercanos en términos del tamaño
de la familia y la edad. La edad tiene una desviación estándar grande en
relación con la separación entre los grupos. La matriz de correlaciones
agrupadas intragrupales indica cierta correlación de las vacaciones y el tamaño
de la familia con los ingresos. La edad tiene cierta correlación negativa con
los viajes. Sin embargo, esas correlaciones están en la parte inferior, lo cual
indica que aunque pueden existir algunos problemas con la multicolinealidad, no
es probable que sean de gravedad. La significancia asignada a las razones F
univariadas indica que cuando los predictivo se consideran de manera
individual, sólo el ingreso y los viajes son significativos para diferenciar entre
los dos grupos.
En el análisis discriminante
múltiple, si existen G grupos, pueden calcularse G – 1 funciones discriminantes,
si el número de predictivos es mayor que esta cantidad. En general con G grupos
y k predictivos, es posible calcular las funciones discriminantes más pequeñas
de G – 1 o k. La primera función tiene la razón más elevada de la suma de
cuadrados entre e intragrupos. La segunda función, no correlacionada con la
primera, tiene la segunda razón más alta y así sucesivamente. Sin embargo, no
todas las funciones pueden ser estadísticamente significativas.
Dado que hay tres grupos, puede
extraerse un máximo de dos funciones. El valor propio asociado con la primera
función es 3,8190 y esta función da cuenta del 93,93 por ciento de la varianza explicada.
Como el valor propio es grande, es probable que la primera función sea
superior.
El valor propio de la segunda
función es pequeño (0,2469) y sólo da cuenta de 6,07 por ciento de la varianza
explicada.
Determinar la significancia de la función discriminante
Para probar la hipótesis nula de
que los centroides de los grupos son iguales, ambas funciones deben considerarse
al mismo tiempo. Si se prueban primero todas las medias al mismo tiempo, será posible
probar las medias de las funciones de manera sucesiva. Luego se excluye una
función a la vez y se prueban en cada paso las medias de las funciones
restantes. En la tabla 18,5 el 0 debajo del encabezado Función posterior indica que no se eliminó ninguna función. El
valor de λ de Wilks es 0,1644, que se transforma en una chi cuadrada de c2 = 44,831, con 10 grados de libertad, lo
cual es significativo más allá del nivel de 0,05. Por lo tanto, ambas funciones
en conjunto hacen una discriminación significativa entre los tres grupos. Sin
embargo, cuando se elimina la primera función, la λ de Wilks asociada con la
segunda función es 0,8020, lo que no es significativa al nivel de 0,05.
Por consiguiente, la segunda
función no hace una contribución significativa a las diferencias entre los
grupos.
Interpretación de los resultados
La interpretación de los
resultados se facilita al examinar los coeficientes estandarizados de la función
discriminante, la estructura de correlaciones y ciertas gráficas.
Los coeficientes estandarizados indican
un coeficiente grande para el ingreso en la función 1; mientras que la función
2 tiene coeficientes relativamente altos para viajes, vacaciones y edad. Cuando
se examina la matriz estructural se llega a una conclusión similar véase la
tabla de resultados. Para ayudar a la interpretación de las funciones, se agruparon
las variables con coeficientes altos para una función particular.
Esas agrupaciones se muestran con
asteriscos. Por lo tanto, ingreso y tamaño de familia tienen asteriscos en la
función 1, porque estas variables tienen coeficientes mayores en la función 1
que en la función 2. Esas variables se asocian sobre todo con la función 1. Por
otro lado, los viajes, las vacaciones y la edad se asocian en forma
predominante con la función 2, como lo señalan los asteriscos.
La figura que se presenta a
continuación es un diagrama de dispersión de todos los grupos en la función 1 y
en la función 2.
Se observa que el grupo 3 tiene el
valor más alto en la función 1 y el grupo 1 el menor. Dado que la función 1 se
asocia sobre todo con el ingreso y el tamaño de familia, se esperaría que los
tres grupos estén ordenados en esas dos variables. Es probable que las personas
con altos ingresos y familias grandes gasten mucho dinero en sus vacaciones y
que, a la inversa, el gasto en vacaciones sea menor entre las personas con bajos
ingresos y familias de menor tamaño. Esta interpretación se fortalece al
examinar las medias de los grupos en ingreso y tamaño de la familia.
La siguiente figura indica también
que la función 2 tiende a separar el grupo 1 (valor más alto) del grupo 2
(valor más bajo). Esta función se asocia sobre todo con viajes, vacaciones y
edad. Dadas las correlaciones positivas de estas variables con la función 2 en
la matriz estructural, esperamos encontrar que el grupo 1 sea mayor que el
grupo 2, en términos de viajes, vacaciones y edad.
Esto es real para viajes y
vacaciones, como lo indican las medias de los grupos en estas variables. Si las
familias del grupo 1 tienen actitudes más favorables hacia los viajes y dan más
importancia a las vacaciones familiares que las familias del grupo 2, ¿por qué
gastan menos dinero? Quizá les gustaría gastar más en vacaciones, pero no
pueden hacerlo porque tienen bajos ingresos.
Se obtiene una interpretación
similar al examinar un mapa territorial, como se muestra en la figura. En un
mapa territorial, un asterisco señala el centroide de cada grupo. Los límites
de los grupos se indican con los números que les corresponden. Por lo tanto, el
centroide del grupo 1 está limitado por los números 1, el centroide del grupo 2
por números 2 y el centroide del grupo 3 por números 3.
Evaluación de la validez del Análisis Discriminante
Los resultados de la clasificación
que se basan en la muestra de análisis indican una correcta clasificación de (9
+ 9 + 8)/30 = 86,7 por ciento de los casos. La validación cruzada con exclusión
clasifica correctamente apenas a (7 + 5 + 8)/30 = 0,667 o 66,7 por ciento de
los casos. Cuando se realiza el análisis de clasificación sobre la muestra de
validación independiente de la tabla se obtiene una proporción de aciertos de
(3 + 3 + 3)/12 = 75 por ciento. Dados tres grupos de igual tamaño, se esperaría
por simple azar una proporción de aciertos de 1/3 = 0,333 o 33,3 por ciento.
Por consiguiente, la mejoría sobre el azar es mayor del 25 por ciento, lo cual
indica una validez por lo menos satisfactoria.
Es bueno mencionar que todos los
resultados aquí presentados fueron generados con la utilización del software Statistical
Package for Social Sciences (SPSS) en castellano Paquete Estadístico para las Ciencias Sociales.
(Obsequio Libro Diseño de Experimentos de Montgomery)
Si te gustó el artículo o tienes alguna crítica constructiva coméntalo y recuerda suscribirte al blog. Ah, y comparte con un Tiweet, +1 o por Facebook tus comentarios. Hasta una próxima entrega.
Para diseños de investigación de
mercados, levantamiento de estudios de opinión pública y de seguimiento
electoral no dude en contactar a Plepso Investigación, C. A. por sus teléfonos
0243 237.54.06 y 0412 439.25.85, o al
correo electrónico jpleal@yahoo.com
OTROS ARTÍCULOS DE
INTERÉS
|
|
PALABRA CLAVE: #QuédateEnCasa, #CoroNaVirus, #Covid-19, Universidad
Central de Venezuela - UJAP - Universidad de Carabobo - UBA- Universidad
Simón Bolívar - Universidad de Oriente - Universidad Santa María -
Universidad Bicentenaria
FUENTES BIBLIOGRÁFICAS Y DOCUMENTALES
Aaker, D. y
Day, G. S. (1989) Investigación de Mercados. México. Tercera Edición. Segunda
Edición en Castellano. Mc Graw-Hill
Abraira Santos,
Víctor. Métodos Multivariantes en bioestadística.
Cuadras, Carles
(2008). «Capítulo 6: Análisis factorial». Nuevos métodos de análisis
multivariante. CMC Editions.
Kotler, Philup
y Armstrong, Gary (1991) Fundamentos de Mercadotecnia. 2da Edición. México.
Prentice-Hall Hispanoamericana
Lovelock,
Christopher (1997) Mercadotecnia de Servicios. 3ra Edición. México.
Prentice-Hall Hispanoamericana
Malhotra, N
(1997) Investigación de mercado, un enfoque práctico. Naucalpan de Juárez
México. Prentice Hall Segunda Edición
Pérez Leal, J.
(2015) Análisis Discriminante de Dos Grupos. [Artículo en línea] disponible en:
http://plepso.blogspot.com/2015/08/analisis-discriminante-de-dos-grupos.html
[Consulta: 2015, agosto 22]
Spearman,
Charles (1927). The Abilities of Man.
Zikmund, W
(1998) Investigación de Mercados. 6ta edición. Naucalpán de Juárez - México
Prentice-Hall Hispanoamericana, A. A.
Comentarios
Publicar un comentario
Aquí puede comentar este artículo o enviar su mensaje directo a asesoriatesis60@gmail.com