Correspondencias

Inicio  Anterior  Siguiente

El análisis de correspondencias, en su versión más simple, es un análisis geométrico de tablas de contingencia. Así, para llevarlo a cabo necesitaremos disponer de una fuente de datos con un estructura muy particular.

La fuente de datos válida para el análisis de correspondencias debe  tener un campo de tipo alfanumérico donde se definan los nombres de las filas y tantas columnas más como sea necesario. Cada fila será un punto fila y cada columna exceptuando la que nomina las filas, será un punto columna. Así, la tabla que mostramos a continuación como ejemplo, cumple con estas necesidades de análisis.

Subject

Big

Athletic

Friendly

Trainable

Resourceful

Animal

Lucky

Dog

80

20

90

90

5

100

40

Cat

50

40

40

70

10

100

40

Rat

10

70

20

90

80

99

40

Cockroach

0

80

2

20

95

20

40

Wallaby

35

52

38

47

48

80

40

Esta fuente de datos, tiene 8 campos, el primero de ellos alfanumérico (su contenido son los diferentes puntos fila) y los siguientes campos son los diferentes puntos columna a representar. Esta tabla de contingencia sería el resultado de cuestionar a una muestra de individuos acerca de que tres rasgos caracterizarían a cada uno de los animales indicados. Sobre esta tabla de contingencia se realizaría el análisis.

El análisis solicita identificar:

Descripción
Fuente de datos, que debe tener una configuración específica
Campos (desarrollamos posteriormente)
Opciones (desarrollamos posteriormente)
Cabecera y pie
Permisos

Selección de campos

Se diferencia entre campo para los perfiles de fila (muestra sólo las variables de tipo alfanumérico) y entre campos para los perfiles de columna (donde se incluyen las medidas de cada uno de ellos). En nuestro ejemplo, el primer campo seleccionado arriba es SUBJECT (contiene los nombres de los perfiles de fila), mientras que el resto de campo (BIG, ATHLETIC...) se ubican en la caja inferior.

clip0172

Opciones específicas de  tabla

Particularmente este análisis dispone de las siguientes opciones:

Número de dimensiones, fijo, que será siempre el menor número de perfiles de fila o perfiles de columna -1. En nuestro ejemplo, 5 animales o 7 rasgos, ofrecen el 4 como mayor número de dimensiones posible.
El análisis tiene la posibilidad de identificar perfiles de fila o columna suplementarios, que no intervienen en el cálculo, pero sí son representados en el mapa final.

Resultado de la salida en forma de tabla

Los diferentes resultados publicados son:

la tabla de contingencia con los valores observados
la prueba Chisq de Pearson, que sirve a modo de test de homogeneidad; el rechazo de la hipótesis nula, implica que existe heterogeneidad en la tabla analizada por tanto, existen similitudes y diferencias entre los diferentes perfiles analizados.
la tabla de contingencia con los valores esperados
la tabla de contingencia mostrando los residuos estandarizados
resumen del análisis donde se listan :
olos valores propios (inercias principales),
oporcentajes con respecto a la inercia total,
ográfico de barras básico.
... para el conjunto de filas y columnas, se proporciona una tabla de resultados en un formato estándar, donde las cantidades se multiplican por 1000 para una mejor lectura, mostrándose:
ola masa de cada punto,
ola calidad de visualización en el subespacio del número de dimensiones
ola inercia del punto (en miles de la inercia total),
... para cada dimensión de la solución.
ola coordenada principal,
ola contribución (relativa) COR del eje principal a la inercia del punto,
ola contribución (absoluta) CTR del punto a la inercia del eje.

Para los posibles puntos suplementarios, las masas, las inercias y las contribuciones absolutas (CTR) no son aplicables, pero las contribuciones relativas (COR) son válidas, así como su suma sobre el conjunto de dimensiones (QLT).

Opciones específicas de gráfico

Mapa bidimensional del análisis creado respecto a las dos dimensiones seleccionadas. Particularmente este análisis dispone de las siguientes opciones

Dimensión 1, correspondiente al eje de las X, número de componente a representar;
Dimensión 2, correspondiente al eje de las Y, número de componente a representar;
Tipo de mapa. Por defecto, la opción de escala del mapa es "simétrica", que es el llamado mapa asimétrico. En este mapa, los puntos de la fila y la columna se escalan para tener inercias (variaciones ponderadas) iguales a la inercia principal (valor propio o valor singular al cuadrado) a lo largo de los principales ejes, es decir, tanto las filas como las columnas están en coordenadas principales (ver más info en https://cran.r-project.org/web/packages/ca/ca.pdf para otras opciones).
Masa (1 y 2), indica si el gráfico imprime la masa de ambas dimensiones
Flecha (1 y 2), indica si se imprimen las flechas para una mejor lectura del gráfico y los ángulos formados por los puntos de fila o de columna.
Colores (1 y 2), indica los colores para los perfiles de fila y de columna.

Resultado de la salida en forma de gráfico

Mapa de dos dimensiones, con flechas (si seleccionadas) que señalan desde el baricentro del gráfico hasta el punto fila o columna, desarrollando la intensidad de color según su masa. Si no se imprimen las flechas, se muestran solo los puntos diferenciados fila y columna, con sus etiquetas.

clip0173