análisis de componentes principales en la estimación de
TRANSCRIPT
Análisis de componentes principales en la estimación de índices de
empoderamiento en mujeres de Colombia
Trabajo Fin de Master
Autora: Dayan Paola Peña Méndez
Director: Ramón Gutiérrez Sánchez
Máster en estadística aplicada
Departamento de estadística e investigación operativa
Universidad de Granada
2014
2
Tabla de Contenido
Introducción ............................................................................................................................................ 3
Análisis de componentes principales ........................................................................................................ 4
1. Obtención de las componentes principales ............................................................................................. 4
2. Variabilidad explicada por las componentes ............................................................................................ 7
3. Representación de una matriz de datos ................................................................................................... 7
4. Inferencia ................................................................................................................................................ 10
4.1 Estimación y distribución asintótica ............................................................................................... 11
4.2 Contraste de hipótesis .................................................................................................................... 12
5. Número de componentes principales .................................................................................................... 15
5.1 Criterio del porcentaje .................................................................................................................... 15
5.2 Criterio de Kaiser ............................................................................................................................ 15
5.3 Test de esfericidad .......................................................................................................................... 16
5.4 Criterio del bastón roto .................................................................................................................. 16
6. Biplot ...................................................................................................................................................... 17
Metodología México .............................................................................................................................. 19
Aplicación caso Colombia ....................................................................................................................... 21
1. Análisis descriptivo de la base de datos ................................................................................................. 22
2. Estimación del índice de poder de decisión ........................................................................................... 25
3. Estimación del índice de autonomía ..................................................................................................... 34
4. Estimación del índice de Roles de género .............................................................................................. 41
Conclusiones .......................................................................................................................................... 48
Bibliografía ............................................................................................................................................ 49
3
Introducción
Este trabajo tiene como objetivo utilizar la metodología de Componentes principales para calcular el
índice de empoderamiento de mujeres colombianas, que participaron en el año 2012 en el programa
de gobierno “Mujeres Ahorradoras en Acción”, el cual busca “Contribuir a la superación de la pobreza
extrema de mujeres en situación de vulnerabilidad, abriéndoles posibilidades de acceso real al
sistema microfinanciero y a la generación de ingresos por medio del fortalecimiento
microempresarial”1.
Dentro de este proyecto se realiza un seguimiento, por medio de encuestas, a las mujeres inscritas al
programa, en donde se analiza su situación económica y se dedica un capítulo completo a preguntas
que conlleven a entender el proceso de empoderamiento de ellas. El análisis de esta información se
ha basado durante muchos años en el resultado de un estudio hecho en México por el Instituto
Nacional de las Mujeres, en donde se utilizó el análisis de componentes principales para generar
índices de empoderamiento y los índices obtenidos allí se aplicaban a la base de Colombia.
El objetivo de este trabajo es realizar la estimación de estos índices con base en la información de
Colombia, recolectada bajo el programa de Mujeres Ahorradoras en Acción, y entregar al programa
estos cálculos para que sean utilizados en el estudio.
1 http://www.dps.gov.co/contenido/contenido.aspx?catID=629&conID=179&pagID=4469
4
Análisis de componentes principales
El análisis de componentes principales es una metodología desarrollada en 1901 por Karl Pearson,
la cual permite obtener información acerca de la interdependencia entre las variables analizadas,
es decir, permite hallar asociaciones entre las variables disponibles y reducir el número de estas
para facilitar su análisis.
El ACP busca la estructuración de un conjunto de datos multivariado mediante la reducción del
número de variables originales a un conjunto más pequeño de estas, las cuales son combinaciones
lineales de aquellas que recogen la mayor parte de la variabilidad del conjunto inicial de variables.
Una de las principales ventajas de esta metodología es que no parte de ninguna distribución de
probabilidad para su análisis y dentro de los objetivos del análisis están:
Generar nuevas variables que expresen información acerca del conjunto de datos
Reducir la dimensión del espacio en el que están contenidos los datos
Eliminar (si es posible) las variables que aportan poca información al estudio del problema
Facilitar la interpretación de la información contenida en los datos
Determinación de unos pocos factores (componentes principales) que retengan la mayor
variabilidad contenida en los datos. Las nuevas variables generadas cumplen con las
características de independencia (bajo el supuesto de normalidad) y no correlación.
1. Obtención de las componentes principales
Sea 𝑿 = [𝑋1, … , 𝑋𝑝] una matriz de datos multivariantes, en donde las filas representan los
individuos y las columnas las p variables continuas analizadas. Las componentes principales son
unas variables compuestas incorrelacionadas tales que unas pocas explican la mayor parte de la
variabilidad de X.
5
Definición 1.1. Las componentes principales son las variables compuestas
𝑌1 = 𝑋𝑡1, 𝑌2 = 𝑋𝑡2, … , 𝑌𝑝 = 𝑋𝑡𝑝,
tales que:
1. Var(Y1) es máxima condicionado a 𝑡1′ 𝑡1 = 1
2. Entre todas las variables compuestas Y tales que Cov(Y1,Y)=0, la variable Y2 es tal que
Var(Y2) es máxima condicionado a 𝑡2′ 𝑡2 = 1
3. Si 𝑝 ≥ 3, la componente Y3 es una variable incorrelacionada con Y1, Y2 con varianza
máxima.
4. Análogamente se definen las demás componentes principales si 𝑝 > 3.
Si 𝑻 = [𝑡1, … , 𝑡𝑝] es la matriz pxp cuyas columnas son los vectores que definen las componentes
principales, entonces la transformación lineal 𝑋 → 𝑌
Y=XT (1.1)
Se llama transformación por componentes principales.
Teorema 1.1. Sean 𝑡1, 𝑡2, … , 𝑡𝑝 los p vectores propios normalizados de la matriz de covarianzas S,
𝑺𝒕𝒊 = 𝝀𝒊𝒕𝒊, 𝒕𝒊′𝒕𝒊 = 𝟏, 𝒊 = 𝟏, … , 𝒑
Entonces:
1. Las variables compuestas 𝒀𝑖 = 𝑿𝑡𝑖, 𝑖 = 1,2, … , 𝑝, son las componentes principales.
2. Las varianzas son los valores propios de S
𝑉𝑎𝑟(𝑌𝑖) = 𝜆𝑖, 𝑖 = 1,2, … , 𝑝
3. Las componentes principales son variables incorrelacionadas:
𝑐𝑜𝑣(𝑌𝑖, 𝑌𝑗) = 0, 𝑖 ≠ 𝑗 = 1, … , 𝑝
6
Demostración: Supongamos 𝜆1 > 𝜆2 > ⋯ 𝜆𝑝 > 0. Probemos que las variables 𝑌𝑖 = 𝑋𝑡𝑖,
𝑖 = 1,2, … , 𝑝, están incorrelacionadas.
Además:
Sea ahora una variable compuesta tal que .
Entonces
Que prueba que Y1 tiene varianza máxima.
Consideremos ahora las variables Y incorrelacionadas con Y1. Las podemos expresar como:
Entonces:
Y por lo tanto Y2 está incorrelacionada con Y1 y tiene varianza máxima. Si 𝑝 ≥ 3, la demostración de que
Y3,…., Yp son también componentes principales es análoga □.
covYi,Yj t iSt j t i
jt j jt it j,
covYj,Yi t jSt i t j
it i it jt i,
j it it j 0, t i
t j 0, covYi,Yj jt it j 0, si i j
Y p
i1
biX i p
i2
iYi condicionado a
p
i2
i2 1
VarY Var
p
i2
iYi p
i2
i2VarYi
p
i2
i2 i
p
i2
i2 2 VarY2
Y p
i1
aiX i p
i1
iYi
p
i1
i2 1
VarY Varp
i1
iYi p
i1
i2VarYi
p
i1
i2 i
p
i1
i2 1 VarY1
VarYi it it j i
7
2. Variabilidad explicada por las componentes
La varianza de la componente principal Yi es 𝑉𝑎𝑟(𝑌𝑖) = 𝜆𝑖 y la variación total es 𝑡𝑟(𝑆) =
∑ 𝜆𝑖𝑝𝑖=1 . Por lo tanto:
1. Yi contribuye con la cantidad 𝜆𝑖 a la variación total tr(S).
2. Si m<p, Y1, ... ,Ym contribuyen con la cantidad ∑ 𝜆𝑖𝑚𝑖=1 a la variación total tr(S).
3. El porcentaje de variabilidad explicada por las m primeras componentes
principales es:
𝑃𝑚 = 100 𝜆1+⋯+ 𝜆𝑚
𝜆1+⋯+ 𝜆𝑝 (1.2)
En las aplicaciones cabe esperar que las primeras componentes expliquen un elevado
porcentaje de la variabilidad total. Por ejemplo, si m=2< p, y P2 = 90 %, las dos primeras
componentes explican una gran parte de la variabilidad de las variables. Entonces podremos
sustituir X1,X2,...,XP por las componentes principales Y1, Y2 . En muchas aplicaciones, tales
componentes tienen interpretación experimental.
3. Representación de una matriz de datos
Sea 𝑿 = [𝑋1, … , 𝑋𝑝] una matriz n x p de datos multivariantes. Queremos representar, en un
espacio de dimensión reducida m (por ejemplo, m = 2), las filas 𝑥1′ , 𝑥2
′ , … , 𝑥𝑛′ de X, por lo que
necesitamos introducir una distancia:
Definición 3.1: La distancia euclídea (al cuadrado) entre dos filas de X
Es
La matriz es la matriz nxn de las distancias entre las filas.
x i x i1 , . . . . ,x ip, x j
x j1 , . . . . ,x jp,
ij2 x i x jx i x j
p
h1
x ih x jh2
ij
8
Podemos representar las n filas de X como n puntos en el espacio Rp distanciados de acuerdo
con la métrica 𝛿𝑖𝑗. Pero si p es grande, esta representación no se puede visualizar. Necesitamos
reducir la dimensión.
Definición 3.2. La variabilidad geométrica de la matriz de distancias ∆ es el promedio de sus
elementos al cuadrado
Si Y=XT es una transformación lineal de X, donde T es una matriz p x m de constantes,
Es la distancia euclídea entre dos filas de Y. La variabilidad geométrica en dimensión 𝑚 ≤ 𝑝 es
Teorema 3.1 La variabilidad geométrica de la distancia euclídea es la traza de la
matriz de covarianzas
Demostración: Si x1,x2,…,xn es una muestra univariante con varianza s2, entonces
(1.3)
En efecto, si x̅ es la media
VX 1
2n 2
n
i,j1
ij2
ij2m yi yjyi yj
m
h1
yih yjh2
VYm 1
2n 2
n
i,j1
ij2m
VX trS p
h1
h
1
n 2
n
i,j1
x i x j 2 1
n 2
n
i,j1
x i x x j x2
1
n 2
n
i,j1
x i x2 1
n 2
n
i,j1
x j x2
2
n 2
n
i,j1
x i xx j x2 1n ns2 1
n ns2 0 2s2
1
2n 2
n
i,j1
x i x j 2 s2
9
Aplicando (1.3) a cada columna de X y sumando obtenemos
Una buena representación en dimensión reducida m (por ejemplo, m=2) será aquella
que tenga máxima variabilidad geométrica, a fin de que los puntos estén lo más
separados posible.
Teorema 3.2. La transformación lineal T que maximiza la variabilidad geométrica en
dimensión m es la transformación por componentes principales Y=XT, es decir,
T=[t1, ... ,tm] contiene los m primeros vectores propios normalizados de S.
Demostración: Utilizando (1.3), la variabilidad geométrica de Z =XV, donde
V=[v1, ... ,vm] es p x m cualquiera, es
siendo 𝑠2(𝑍𝑗) = 𝑣′𝑗𝑆𝑣𝑗; la varianza de la variable compuesta Zj . Alcanzamos la máxima varianza
cuando Zj es una componente principal: 𝑠2(𝑍𝑗) < 𝜆𝑗. Así:
El porcentaje de variabilidad geométrica explicada por Y es
𝑃𝑚 = 100𝑉𝛿(𝑌)𝑚
𝑉𝛿(𝑋)𝑝= 100
𝜆1 + ⋯ + 𝜆𝑚
𝜆1 + ⋯ + 𝜆𝑝
maxVYm m
j1
j
VX p
j1
sjj trS
10
Supongamos ahora m=2. Si aplicamos la transformación Y=XT, la matriz de datos X se reduce a
Entonces, representando los puntos de coordenadas (yi1, yi2), i=1,…,n, obtenemos una
representación óptima en dimensión 2 de las filas de X.
4. Inferencia
Se ha planteado el ACP sobre la matriz S, pero también se puede plantear sobre la matriz de
covarianzas poblacionales Σ. Las componentes principales obtenidas sobre S son, en realidad,
estimaciones de las componentes principales sobre Σ.
Sea X matriz de datos n x p donde las filas son independientes con distribución 𝑁𝑝(𝜇, Σ).
Recordemos que:
1. �̅� 𝑒𝑠 𝑁𝑝(𝜇, Σ/n).
2. U =nS es Wishart 𝑊𝑝(Σ, 𝑛 − 1)
3. �̅� 𝑦 𝑆 son estocásticamente independientes.
Sea Σ = ΓΛΓ′ la diagonalización de Σ Indiquemos
Los vectores propios y valores propios de Σ. Por otra parte, sea S=GLG' la
diagonalización de S. Indiquemos:
𝐺 = [𝑔1, . . . , 𝑔𝑝], 𝑙 = [𝑙1, . . . , 𝑙𝑝], 𝐿 = 𝑑𝑖𝑎𝑔[𝑙1, . . . , 𝑙𝑝]
Y
y11 y12
yi1 yi2
yn1 yn2
|1 , . . . ,p |, |1 , . . . ,p |, diag1 , . . . ,p
11
los vectores propios y valores propios de S. A partir de ahora supondremos
4.1 Estimación y distribución asintótica
Teorema 4.1.1. Se verifica:
1. Si los valores propios son diferentes, los valores y vectores propios obtenidos a
partir de S son estimadores máximo-verosímiles de los obtenidos a partir de 𝛴:
𝜆�̂� = 𝑙𝑖 , 𝛾�̂� = 𝑔𝑖, 𝑖 = 1, … , 𝑝
2. Cuando k > 1 valores propios son iguales a 𝜆
el estimador máximo verosímil de 𝜆 es la media de los correspondientes valores
propios de S
�̂� = (𝑙𝑝−𝑘+1 + ⋯ + 𝑙𝑝)/𝑘
Demostración: Los valores y vectores propios están biunívocamente relacionados con
Σ por lo tanto 1) es consecuencia de la propiedad de invariancia de la estimación
máximo verosímil. La demostración de 2) se encuentra en Anderson (1959).
Teorema 4.1.2. Los vectores propios 𝐺 = [𝑔1, . . . , 𝑔𝑝], y los valores propios 𝑙 = [𝑙1, . . . , 𝑙𝑝]
verifican asintóticamente:
1. 𝑙 𝑒𝑠 𝑁𝑝(𝜆,2𝛬2
𝑛). En particular:
𝑙𝑖 𝑒𝑠 𝑁 (𝜆𝑖,2𝜆𝑖
2
𝑛 ) , 𝑐𝑜𝑣(𝑙𝑖 , 𝑙𝑗) = 0, 𝑖 ≠ 𝑗
12
es decir, 𝑙𝑖 , 𝑙𝑗; son normales e independientes.
2. 𝑔𝑖 𝑒𝑠 𝑁𝑝(𝛾𝑖 ,𝑉𝑖
𝑛) donde
3. 𝑙 es independiente de G.
Demostración: Anderson (1959), Mardia, Kent y Bibby (1979) □.
Como consecuencia de que l𝑖 es N (𝜆𝑖,2λ𝑖
2
𝑛 ), obtenemos el intervalo de confianza asintótico con
coeficiente de confianza 1 − 𝛼,
siendo 𝛼2 =2
𝑛−1 y 𝑃 (|𝑍| > 𝑧𝛼
2⁄ ) = 𝛼/2 , donde Z es N(0, 1).
Se obtiene otro intervalo de confianza como consecuencia de que log l𝑖 es N (𝑙𝑜𝑔𝜆𝑖,2
𝑛−1 )
4.2 Contraste de hipótesis
Determinados contrastes de hipótesis relativos a las componentes principales son casos
particulares de un test sobre la estructura de la matriz Σ.
A. Supongamos que queremos decidir si la matriz Σ; es igual a una matriz
determinada Σ0 . Sea X un matriz n x p con filas independientes 𝑒𝑠 𝑁𝑝(𝜇, Σ). El test es:
𝐻0: Σ = Σ0 (𝜇 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎)
li
1z/21/2 i
li
1z/21/2
liez/2 i lie
z/2
13
Si L es la verosimilitud de la muestra, el máximo de log L bajo H0 es
El máximo no restringido es
El estadístico basado en la razón de verosimilitud 𝜆𝑅 es:
(1.4)
Si 𝐿1, … , 𝐿𝑝 son los valores propios de Σ0−1𝑆 y a, g son las medias aritmética y
geométrica
𝑎 =(𝐿1 + ⋯ + 𝐿𝑝)
𝑝, 𝑔 = (𝐿1 + ⋯ + 𝐿𝑝)1 𝑝⁄ (1.5)
entonces, asintóticamente
(1.6)
siendo q=p(p+1)/2-par(𝛴0) el número de parámetros libres de Σ menos el número de
parámetros libres de Σ0.
B. Test de independencia completa.
Si la hipótesis nula afirma que las p variables son estocásticamente independientes, el
test se formula como
𝐻0: Σ = Σd = 𝑑𝑖𝑎𝑔(𝜎11, … , 𝜎𝑝𝑝) (𝜇 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎)
14
p
Bajo H0 la estimación de Σ𝑑 es S𝑑 = 𝑑𝑖𝑎𝑔(𝑠11, … , 𝑠𝑝𝑝) y 𝑆𝑑−1𝑆 = 𝑅 es la matriz de correlaciones.
De (1.4) y de 𝑙𝑜𝑔|2𝜋𝑆𝑑| − 𝑙𝑜𝑔|2𝜋𝑆| = log|𝑅| , 𝑡𝑟(𝑅) = 𝑝 obtenemos:
Siendo q=p(p+1)/2-p=p(p-1)/2. Si el estadístico −𝑛 log|𝑅|no es significativo, entonces
podemos aceptar que las variables están incorrelacionadas y por lo tanto, como hay
normalidad multivariante, independientes. Entonces las propias variables serían
componentes principales.
C. Test de igualdad de valores propios.
Es éste un test importante en ACP. La hipótesis nula es:
𝐻0: 𝜆1 > ⋯ > 𝜆𝑝−𝑘 = 𝜆𝑝−𝑘+1 = ⋯ = 𝜆𝑝 = 𝜆
Indicamos los valores propios de S y de So (estimación de Σ si H0 es cierta)
𝑆 ∼ (𝑙1, … , 𝑙𝑘 , 𝑙𝑘+1, … 𝑙𝑝), 𝑆0 ∼ (𝑙1, … , 𝑙𝑘 , 𝑎0, … , 𝑎0)
donde 𝑎0 = (𝑙𝑘+1, … , 𝑙𝑝)/(𝑝 − 𝑘) (Teorema 4.1). Entonces
𝑆0−1𝑆 ∼ (1, … ,1, 𝑙𝑘+1/𝑎0, … , 𝑙𝑝/𝑎0)
las medias (1.5) son 𝑎 = 1, 𝑦 𝑔 = (𝑙𝑘+1 × … × 𝑙𝑝)1/𝑝𝑎0(𝑘−𝑝) 𝑝⁄
, y aplicando (1.6)
(1.7)
donde q=(p - k)(p - k + 1)/2-1. Para una versión más general de este test, véase Mardia
et al. (1979).
15
5. Número de componentes principales
En esta sección se presentan algunos criterios para determinar el número m < p de componentes
principales.
5.1 Criterio del porcentaje
El número m de componentes principales se toma de modo que Pm sea próximo a un valor
especificado por el usuario, por ejemplo el 80%. Por otra parte, si la representación de
P1, P2 ,…,Pk,… con respecto de k prácticamente se estabiliza a partir de un cierto m, entonces
aumentar la dimensión apenas aporta más variabilidad explicada.
5.2 Criterio de Kaiser
Obtener las componentes principales a partir de la matriz de correlaciones R equivale a suponer
que las variables observables tengan varianza 1. Por lo tanto una componente principal con
varianza inferior a 1 explica menos variabilidad que una variable observable. El criterio, llamado
de Kaiser, es entonces:
Retenemos las m primeras componentes tales que λ𝑚 ≥ 1 , donde λ1 ≥… ≥ λ𝑝
son los valores propios de R, que también son las varianzas de las componentes.
Estudios de Montecarlo prueban que es más correcto el punto de corte 𝜆∗ = 0.7,
que es más pequeño que 1.
Este criterio se puede extender a la matriz de covarianzas. Por ejemplo, m podría ser tal que
λ𝑚 ≥ 𝑣, donde 𝑣 = 𝑡𝑟(𝑆)/𝑝 es la media de las varianzas. También es aconsejable considerar el
punto de corte 0.7 × 𝑣.
16
1 1
5.3 Test de esfericidad
Supongamos que la matriz de datos proviene de una población normal multivariante
𝑁𝑝(𝜇, Σ). Si la hipótesis
𝐻0(𝑚)
: 𝜆1 > ⋯ > 𝜆𝑚 > 𝜆𝑚+1 = ⋯ => 𝜆𝑝
es cierta, no tiene sentido considerar más de m componentes principales. En efecto,
no hay direcciones de máxima variabilidad a partir de m, es decir, la distribución de los
datos es esférica. El test para decidir sobre 𝐻0(𝑚)
está basado en el estadístico ji-
cuadrado (1.7) y se aplica secuencialmente: Si aceptamos 𝐻0(0)
es decir, m=0, todos los
valores propios son iguales y no hay direcciones principales. Si rechazamos 𝐻0(0)
,
entonces repetimos el test con 𝐻0(1)
. Si aceptamos 𝐻0(1)
entonces m=1, pero si
rechazamos 𝐻0(1)
repetimos el test con 𝐻0(2)
, y así sucesivamente. Por ejemplo si p=4,
tendríamos que m=2 si rechazamos 𝐻0(0)
, 𝐻0(1)
y aceptamos 𝐻0(2)
: 𝜆1 > 𝜆2 > 𝜆3 = 𝜆4.
5.4 Criterio del bastón roto
La suma de los valores propios es Vt= tr(S), que es la variabilidad total. Imaginemos un
bastón de longitud Vt, que rompemos en p trozos al azar (asignando p-1 puntos
uniformemente sobre el intervalo (0, Vt,)) y que los trozos ordenados son los valores
propios 𝑙1 > 𝑙2 > ⋯ 𝑙𝑝. Si normalizamos a Vt=100, entonces el valor esperado de 𝑙𝑗 es
Las m primeras componentes son significativas si el porcentaje de varianza explicada
supera claramente el valor de E(L1)+…+ E(Lm)· Por ejemplo, si p=4 los valores son
Porcentaje E(L1) E(L2 ) E(L3 ) E(L4 )
Esperado 52.08 27.08 14.58 6.25
Acumulado 52.0 79.16 93.74 100
17
Si V2 = 93.92 pero V3 = 97.15, entonces tomaremos sólo dos componentes.
6. Biplot
Un biplot es una representación, en un mismo gráfico, de las filas (individuos) y las columnas
(variables) de una matriz de datos X (n x p). Suponiendo X matriz centrada, el biplot clásico (debido
a K. R. Gabriel), se lleva a cabo mediante la descomposición singular
donde U es una matriz nxp con columnas ortonormales, V es una matriz pxp ortogonal, y Λ es
una matriz diagonal con los valores singulares de X ordenados de mayor a menor. Es
decir, 𝑈′𝑈 = 𝐼𝑛, 𝑉′𝑉 = 𝐼𝑝, Λ = 𝑑𝑖𝑎𝑔(𝜆1, … , 𝜆𝑝) .Como X′X = U′Λ2𝑈 vemos que 𝑋𝑉 = 𝑈Λ es la
transformación en componentes principales (1.1), luego las coordenadas para representar las n
filas están contenidas en 𝑈Λ. Las coordenadas de las p columnas son las filas de la matriz 𝑉. Filas
y columnas se pueden representar (tomando las dos primeras coordenadas) sobre el mismo
gráfico, como en la figura siguiente.
En general la solución biplot consiste en representar simultáneamente las matrices
𝑨 = 𝑼𝚲𝜶 𝒚 𝑩 = 𝑽𝚲𝟏−𝜶, para un 𝜶 tal que 𝟎 ≤ 𝜶 ≤ 𝟏. Entonces AB’=X y el gráfico reproduce las
filas y columnas de X. La calidad en la representación depende del valor asignado al parámetro
α. Si α=1 se representan las filas con máxima resolución, si α=0 la mejor resolución corresponde
a las columnas. Se puede tomar el valor intermedio α=1/2.
18
Podemos plantear el biplot de una manera alternativa (propuesta por J. C. Gower). La
transformación por componentes principales Y=XT permite representar las filas. Para
representar también las columnas, podemos entender una variable Xj como el conjunto de
puntos de coordenadas
𝑥𝑗(𝛼𝑗) = (0, … , 𝛼𝑗, … ,0) 𝑚𝑗 ≤ 𝛼𝑗 ≤ 𝑀𝑗
donde 𝛼𝑗 es un parámetro que varía entre el mínimo valor mj y el máximo valor Mj de
Xj. Entonces la representación de Xj; es simplemente el eje 𝑥𝑗(𝛼)𝑇.
Siguiendo este procedimiento, es fácil ver que mediante la transformación Y=XT, la
representación de las variables se identifica con el haz de segmentos
(𝛼1𝑡1, … , 𝛼𝑝𝑡𝑝)
donde t1,…,tP son las filas de T. Véase Greenacre (2010) para una moderna versión práctica de
esta interesante técnica.
Metodología México
La Encuesta Nacional sobre la Dinámica de las Relaciones en los Hogares (ENDIREH), es un
estudio que se ha llevado a cabo en México durante varios años y busca entender la violencia
de género que sufren las mujeres casadas de más de 15 años de edad tanto en el ámbito público
como el privado. De allí se generó un trabajo presentado como “Violencia de género en las
parejas mexicanas2”, el cual se basó en los datos de ENDIREH 2006, y analizó la violencia que
sufren las mujeres por parte de sus parejas o esposos, debido a que esta es la de mayor
prevalencia y posiblemente la que mayor cantidad de secuelas deja debido a: el lazo emocional
que tiene la mujer con su pareja y a que la mujer debe convivir diariamente con este maltrato.
Dentro del contenido desarrollado en él se identificaron las mujeres con mayor propensión a
sufrir violencia de pareja de acuerdo con las condiciones socioeconómicas, sus antecedentes de
violencia en la niñez y la aplicación de estos resultados en políticas públicas. Adicionalmente, se
construyeron índices de empoderamiento de las mujeres: índice de poder de decisión, índice de
autonomía o libertad de movimientos e índice de roles de género.
De acuerdo con el autor3, el cálculo de estos índices nace de la necesidad de entender la
situación de empoderamiento en las mujeres mexicanas, ya que la adquisición de este repercute
en un mayor control de las vidas de ellas y su participación en actividades a las que
tradicionalmente no tienen acceso.
Para medir este empoderamiento la metodología planteada consiste en estimar índices atados
a tres dimensiones del empoderamiento: índice de poder de decisión, índice de autonomía e
índice de roles de género.
2 Este estudio fue realizado por el Instituto Nacional de las Mujeres, en el marco del Programa Nacional para la
igualdad entre mujeres y hombres 2008-2012 y de la Ley General de Acceso de las Mujeres a una vida libre de
violencia.
3 Coordinadores del proyecto: Roberto Castro e Irene Casique
20
Los datos en los que basaron el desarrollo de la metodología fueron tomados de ENDIREH 2006
y con base en las preguntas allí planteadas se realizaron análisis de componentes principales,
con grupos de variables que permitían la definición de ellos.
21
Aplicación caso Colombia
Basado en la metodología utilizada para la creación de los indicadores de empoderamientos en
México, se decidió tomar los datos de un estudio colombiano para determinar el índice de
empoderamiento de la mujer y lograr entender su comportamiento dentro de la sociedad.
El estudio tomado se desarrolla en el marco del proyecto gubernamental Mujeres Ahorradoras
en Acción, el cual busca “Contribuir a la superación de la pobreza extrema de mujeres en
situación de vulnerabilidad, abriéndoles posibilidades de acceso real al sistema microfinanciero
y a la generación de ingresos por medio del fortalecimiento microempresarial. Este objeto se
logra a través de:
1. La Educación Financiera y la generación de una cultura del ahorro.
2. La vinculación formal al Sistema Microfinanciero: Bancarización, ahorro y microcrédito.
3. La aplicación de un incentivo al ahorro.
4. La formación integral con enfoque de género.
5. La instalación de capacidades socioempresariales.
6. El fortalecimiento de emprendimientos productivos de las mujeres.
7. El intercambio de saberes y experiencias entre las participantes.
8. La promoción de las organizaciones de mujeres.
9. El uso de microseguros.
10. La articulación institucional, en especial con la Red de Superación de la pobreza extrema
JUNTOS.4”
Con base en una muestra de 7.267 mujeres de toda Colombia, inscritas en el estudio
mencionado anteriormente en el año 2012, se replicó la metodología utilizada en México
obteniendo los resultados que se exponen a continuación.
4 http://www.dps.gov.co/contenido/contenido.aspx?catID=629&conID=179&pagID=4469
22
1. Análisis descriptivo de la base de datos
La base analizada cuenta con 7.267 mujeres de diferentes regiones del país, tanto urbanas como
rurales, quienes para ser parte de este estudio se inscribieron al programa de gobierno “Mujeres
ahorradoras en acción” con el fin de empezar a hacer crecer sus negocios propios por medio de
incentivos y capacitaciones que brinda el gobierno; de esta forma ellas empiezan a tener
educación y apoyo que les permite empezar a ahorrar y hacer progresar sus negocios.
A nivel departamental, la muestra se distribuye como se muestra en el gráfico.
Gráfico 1. Distribución por departamentos y ruralidad
En el gráfico 1 se puede observar que la mayor proporción de la muestra se encuentra en los
departamentos del Tolima (13%), Boyacá (9.7%) y Cauca (9.3%). Del total de la muestra el 58%
de las mujeres habitan en zona urbana, mientras que el 42% lo hacen en zona rural y los
departamentos que tiene mayor porcentaje de personas en área urbana son Tolima, Cesar,
Atlántico, Bolívar, Arauca y Córdoba.
0
100
200
300
400
500
600
700
800
900
1000
Distribución por departamentos y ruralidad
RURAL URBANO
23
Gráfico 2. Distribución por edad
Al examinar la variable edad se observa que el 59% de las mujeres entrevistadas se encuentran
en edades de 30 a 49 años. El porcentaje de mujeres jóvenes (18 a 24) es el menor de todos
(5.7%), siendo incluso más pequeño que el de las mujeres de más de 60 años (7.6%). Por lo tanto
estamos hablando de una muestra de mujeres en su gran mayoría adultas. Esto se debe en
mayor medida a que para ser parte de este programa las mujeres debían tener ya su negocio y
esta característica se presenta en mayor proporción en personas adultas.
Gráfico 3. Distribución por nivel educativo
El nivel educativo de las mujeres analizadas se puede calificar como bajo, debido a que el 89%
de ellas tienen como máximo nivel alcanzado secundaria completa, y el 47% tienen hasta nivel
18-24
25-29
30-34
35-39
40-44
45-49
50-54
55-59
60 o más
5,7
9,8
13,7
15,4
16,0
13,7
10,9
7,1
7,6
Distribución porcentual por edad
,3%
24,8%
21,4%
18,2%
24,4%
6,4%
1,2% ,1%
3,0%
,1%
Nivel educativo
24
de primaria. Este nivel educativo es de esperarse en personas que se inscriben a programas de
gobierno, debido a que la mayoría de ellas tienen acceso limitado a la educación.
En cuanto al estado civil se tiene que el 70% de ellas viven con su pareja, bien sea casadas o
viviendo en unión libre, lo cual es una característica que va a influir en la estimación de los
índices de empoderamiento.
Gráfico 4. Distribución por estado civil
En cuanto al nivel de ingresos el 67% de las mujeres tienen ingresos inferiores a un salario
mínimo, es decir, estamos hablando de una población con bajos recursos y cuya principal fuente
de ingresos son sus propios negocios.
Gráfico 5. Distribución por ingresos
Unión libre43%
Casada27%
Soltera17%
Separada o divorciada
8%
Viuda5%
67%
17%
10%6%
Ingresos
Menos de un salario mínimo Entre 1 y 2 salarios mínimos
Más de 2 salarios mínimos Sin ingresos
25
2. Estimación del índice de poder de decisión
Con ayuda de este índice se pretende conocer el comportamiento en la toma de decisiones en
el hogar y de la pareja a través de preguntas que permiten identificar quién es la persona que
toma las decisiones en la mayoría de las veces en cuanto a:
1. Si la mujer puede trabajar o estudiar
2. Si la mujer puede salir su casa
3. Qué hacer con el dinero que ella gana
4. Si puede comprar cosas para ella
5. Si puede participar en eventos de la comunidad
6. Cómo gasta el dinero en casa
7. Sobre los permisos de los hijos
8. Cambiarse de casa o ciudad
9. Tener relaciones sexuales
10. Si se usan anticonceptivos
11. Quién usa los anticonceptivos
Para cada una de las decisiones expuestas anteriormente se evaluaron 5 respuestas posibles:
Sólo la entrevistada
Sólo el esposo o pareja
Ambos
Otras personas
No aplica
Debido a una amplia tradición machista las mujeres han estado supeditadas a seguir las
decisiones de su compañero debido a su cultura o a la fuerza que él pueda infringir sobre ella,
por esto con estas sencillas preguntas se puede determinar cuál es la participación de ellas en
las decisiones del hogar y qué tanto control tienen en su vida.
26
Lo primero que se hizo para crear este índice fue categorizar las respuestas posibles en puntajes
en orden ascendente que indiquen la incidencia de la mujer en la toma de decisiones así: Sólo
el esposo o pareja: 1 punto, ambos: 2 puntos y sólo la mujer entrevistada: 3 puntos. Los casos
en los que la respuesta fue otra persona o no aplica, fueron excluidos del análisis, dado que no
proporciona información alguna acerca de poder de decisión de la mujer. Por lo tanto de 7.267
mujeres, para la construcción de este índice sólo se tomaron las respuestas de 4158.
Una vez recodificadas las respuestas, se tienen los resultados en la tabla1.
Sólo él Ambos Sólo ella
Si usted puede trabajar o estudiar 1,4% 39,5% 59,1%
Si usted puede salir de la casa 1,1% 28,4% 70,5%
Qué hacer con el dinero que usted gana 0,6% 30,6% 68,8%
Si puede comprar cosas para usted 0,8% 18,4% 80,8%
Si usted puede participar en los eventos de la comunidad 1,2% 33,5% 65,3%
Como se gasta el dinero en casa 1,4% 63,8% 34,8%
Sobre los permisos de los hijos(as) 2,2% 69,5% 28,3%
Cambiarse de casa o ciudad 2,6% 71,4% 26,1%
Cuando tener relaciones sexuales 2,2% 69,6% 28,2%
Sobre el uso de anticonceptivos 1,5% 60,3% 38,2%
Sobre quién debe usar los anticonceptivos 3,3% 56,6% 40,0%
Tabla 1. ¿Quién decide la mayor parte de las veces en el hogar o en su relación de pareja.
Aquí se puede observar que en 6 de las 11 decisiones, más del 50% de las veces éstas son
tomadas por ambos y están relacionadas con las decisiones del hogar: Como se gasta el dinero
en casa(63,8%), Sobre los permisos de los hijos(as) (69,5%), Cambiarse de casa o ciudad (71,4%),
Cuando tener relaciones sexuales (69,6%), Sobre el uso de anticonceptivos (60,3%), Sobre quién
debe usar los anticonceptivos (56,6%); mientras que las decisiones que afectan directa y
únicamente a la mujer las toma solamente ella la gran mayoría de los casos: Si usted puede
trabajar o estudiar (59,1%), Si usted puede salir de la casa (70,5%), Qué hacer con el dinero que
usted gana(68,8%), Si puede comprar cosas para usted (80,8%), Si usted puede participar en los
eventos de la comunidad (65,3%).
27
De aquí se puede concluir que las decisiones en el hogar se toman de forma equitativa entre
hombres y mujeres; sin embargo, para llegar a una deducción más acertada es necesario
considerar la correlación que existe entre las variables evaluadas para así generar indicadores
multivariados que permitan valorar el poder de decisión.
Los estadísticos de las variables estudiadas (Tabla2) muestran que las primeras 5 variables
tienen en promedio resultados más cercanos a 3, es decir hacia decisiones tomadas por la mujer,
mientras que las últimas se acercan en promedio más hacia 2, es decir puntajes inclinados hacia
la toma de decisión de ambos. Los coeficientes de variación se encuentran casi todos alrededor
del 20% indicando una variabilidad baja en las respuestas de las mujeres.
Variable Promedio Desviación estándar
Coeficiente de variación
Si usted puede trabajar o estudiar 2,58 0,52 20,2%
Si usted puede salir de la casa 2,69 0,48 17,9%
Qué hacer con el dinero que usted gana 2,68 0,48 17,9%
Si puede comprar cosas para usted 2,80 0,42 14,9%
Si usted puede participar en los eventos de la comunidad 2,64 0,50 19,1%
Como se gasta el dinero en casa 2,33 0,50 21,5%
Sobre los permisos de los hijos(as) 2,26 0,49 21,5%
Cambiarse de casa o ciudad 2,23 0,48 21,5%
Cuando tener relaciones sexuales 2,26 0,49 21,5%
Sobre el uso de anticonceptivos 2,37 0,51 21,6%
Sobre quien debe usar los anticonceptivos 2,37 0,55 23,1%
Tabla 2. Estadísticos descriptivos variables empoderamiento
Al observar la matriz de correlaciones en la tabla 3, se ve que las correlaciones más altas se
encuentran entre las 5 últimas variables, las cuales son concernientes a las decisiones del hogar.
28
Tabla 3. Matriz de correlaciones
Para integrar las 11 variables estudiadas anteriormente se realiza un análisis de componentes
principales obteniendo los resultados que aparecen en la tabla 4, en donde se observa que el
primer factor explica el 51.34% del total de la varianza, el segundo el 15.69% y los demás menos
del 7% del total de la inercia cada uno. De allí se tiene que con los dos primeros ejes se está
explicando el 67% del total de la inercia.
Al observar los resultados de la tabla 4, se ve que solamente los dos primeros autovalores son
mayores que 1, por lo tanto tomando el criterio de Kaiser se tomarán estos componentes para
el análisis subsiguiente. El gráfico 6 de sedimentación ayuda a confirmar que se deben tomar las
dos primeras componentes.
Si usted
puede
trabajar o
estudiar
Si usted
puede
salir de la
casa
Qué hacer
con el
dinero
que usted
gana
Si puede
comprar
cosas para
usted
Si usted
puede
participar
en los
eventos
de la
comunida
d
Como se
gasta el
dinero en
casa
Sobre los
permisos
de los
hijos(as)
Cambiars
e de casa
o ciudad
Cuando
tener
relaciones
sexuales
Sobre el
uso de
anticonce
ptivos
Sobre
quien
debe usar
los
anticonce
ptivos
Si usted puede trabajar o estudiar 1,0
Si usted puede salir de la casa 0,6 1,0
Qué hacer con el dinero que
usted gana0,5 0,5 1,0
Si puede comprar cosas para
usted0,5 0,6 0,6 1,0
Si usted puede participar en los
eventos de la comunidad0,5 0,5 0,5 0,5 1,0
Como se gasta el dinero en casa 0,5 0,4 0,4 0,3 0,5 1,0
Sobre los permisos de los
hijos(as)0,4 0,4 0,4 0,3 0,4 0,7 1,0
Cambiarse de casa o ciudad 0,5 0,4 0,4 0,3 0,4 0,7 0,8 1,0
Cuando tener relaciones sexuales 0,4 0,3 0,4 0,3 0,4 0,6 0,7 0,7 1,0
Sobre el uso de anticonceptivos 0,4 0,3 0,3 0,2 0,3 0,5 0,6 0,6 0,7 1,0
Sobre quien debe usar los
anticonceptivos0,3 0,3 0,3 0,2 0,3 0,5 0,5 0,5 0,6 0,8 1,0
29
Tabla 4.Componentes extraídas Gráfico 6. Gráfico de Sedimentación
Al graficar las componentes principales de las columnas (gráfico 7), se observan claramente dos
grupos de variables en donde en la parte superior se tienen aquellas relacionadas directamente
con decisiones del hogar, mientras que en contraposición se tienen las que tienen que ver con
las decisiones propias que debe tomar una persona en su individualidad como por ejemplo: si
puede trabajar o estudiar, salir de la casa, qué hacer con su dinero, entre otros.
Gráfico 7. Componentes principales de las columnas
Factor Inercia PorcentajePorcentaje
acumulado
1 5,65 51,34 51,34
2 1,73 15,69 67,03
3 0,76 6,87 73,90
4 0,56 5,07 78,97
5 0,53 4,80 83,76
6 0,41 3,69 87,46
7 0,38 3,48 90,93
8 0,34 3,07 94,00
9 0,27 2,46 96,46
10 0,20 1,85 98,31
11 0,19 1,69 100,00
01
23
45
d = 0.2
Dec.trabajar.estudiar
Dec.puedesalirdelacasa Dec.quehacerconeldineroquegana
Dec.sipuedecomprarcosasparausted
Dec.puedeparticipareventoscomunidad
Dec.comogastaeldineroencasa
Dec.sobrepermisosdeloshijos Dec.cambiarsedecasaociudad
Dec.tenerrelacionessexuales Dec.usodeanticonceptivos
Dec.quienusaanticonceptivos
30
Al ver el comportamiento de cada variable en las dos componentes (tabla 5), se advierte que las
5 primeras se comportan de manera muy similar frente a la primera componente, tomando
valores similares, aun cuando la variable Si puede comprar cosas para usted tiene un
coeficiente más bajo (0.57). En la segunda componentes se tiene que el primer grupo de
variables, aquellas relacionadas con el desarrollo personal del individuo, se contrapone al
segundo grupo que corresponde a las decisiones del hogar.
Tabla 5. Cargas de las componentes
El gráfico de correlaciones de las variables (gráfico 8) ratifica los dos grupos de variables
mencionados anteriormente. Allí se ve una clara contraposición de estos, evidenciando que las
decisiones en estos grupos de variables son tomadas de forma diferente por los miembros del
hogar. De igual manera se puede ver que las características evaluadas en los grupos se
encuentran fuertemente correlacionados dentro de ellos.
Variable Componente 1 Componente 2
Si usted puede trabajar o estudiar 0,69 -0,32
Si usted puede salir de la casa 0,64 -0,50
Qué hacer con el dinero que usted gana 0,63 -0,48
Si puede comprar cosas para usted 0,57 -0,60
Si usted puede participar en los eventos de la comunidad 0,65 -0,39
Como se gasta el dinero en casa 0,78 0,15
Sobre los permisos de los hijos(as) 0,80 0,31
Cambiarse de casa o ciudad 0,82 0,31
Cuando tener relaciones sexuales 0,81 0,35
Sobre el uso de anticonceptivos 0,74 0,38
Sobre quien debe usar los anticonceptivos 0,70 0,37
31
Gráfico 8. Gráfico de correlaciones
Con base en los resultados obtenidos con la metodología de componentes principales, se
consigue caracterizar las dos componentes de la siguiente forma:
Componente 1: Explica el 51.34% del total de la varianza y allí sobresalen por su aporte
las siguientes variables: cuándo tener relaciones sexuales, cambiarse de casa o ciudad
sobre el permiso de los hijos y cómo se gasta el dinero en la casa; por lo tanto, este
factor puede ser considerado como aquel que indica el control sobre las decisiones del
hogar y los hijos.
Componente 2: Explica el 15.7% de la varianza y está relacionado con aquellas variables
que tienen que ver con decisiones acerca del desarrollo del individuo como: estudiar,
cómo gastar su dinero, salir de la casa, comprar cosas para ella y participar en eventos
de la comunidad. A esta componente se le puede llamar desarrollo de la individualidad.
Una vez obtenidos los ítems que más influyen sobre cada componente, se procede a crear dos
subíndices para poder fusionarlos y generar un único índice, de la siguiente forma:
32
El primer subíndice estará compuesto por los ítems:
o Como se gasta el dinero en casa
o Sobre los permisos de los hijos(as)
o Cambiarse de casa o ciudad
o Cuando tener relaciones sexuales
o Sobre el uso de anticonceptivos
o Sobre quién debe usar los anticonceptivos
Y se calcula sumando los valores de las variables mencionadas anteriormente (ya recodificadas),
y se estandariza dividiendo el resultado de la suma que se obtiene para cada individuo, en el
mayor valor que podría tomar la sumatoria.
De igual forma se calcula el segundo subíndice, tomando los valores de las siguientes variables.
Estos se estandarizan de la misma forma que se realizó para la primera componente:
o Si usted puede trabajar o estudiar
o Si usted puede salir de la casa
o Qué hacer con el dinero que usted gana
o Si puede comprar cosas para usted
o Si usted puede participar en los eventos de la comunidad
Así, se obtienen dos resultados que se combinan por medio de una suma ponderada, cuyo
ponderador está dado por el porcentaje de varianza que aporta cada componente a la varianza
total explicada de la siguiente manera:
Total de la varianza explicada: 67.03
Peso del subíndice 1: 51.34/67.03=76.6%
Peso del subíndice 2: 15.69/67.03=23.4%
Índice de poder de decisión = 0.766*(Subíndice de control sobre las decisiones del hogar y los hijos
+0.234*(Subíndice de desarrollo de la individualidad)
33
El resultado del índice de poder de decisión toma valores entre 0 y 1, en donde valores cercanos
a 0 representan los casos de mujeres sin poder de decisión, es decir, que la mayoría de las
decisiones son tomadas por su esposo, mientras que 1 involucra a las mujeres que toman sus
decisiones de manera autónoma, sin involucrar a sus parejas.
Al calcular el índice sobre la base de datos analizada se tiene que el valor promedio del índice es
de 0.8, y la mediana es de 0.74, lo que indica que la mayoría de las mujeres se encuentran en
valores altos del índice, evidenciando una tendencia hacia la autonomía en las decisiones
(gráfico 9).
Gráfico 9. Histograma índice de poder de decisión.
También se calculó el índice de Cronbach con los 11 ítems incluidos en el análisis de
componentes principales y se obtuvo un valor de 0.9, mostrando consistencia en el índice
calculado.
34
3. Estimación del índice de autonomía
En el cuestionario se establecen preguntas que ayudan a determinar la autonomía de la mujer
con respecto a su pareja en el momento de realizar las siguientes actividades:
Para trabajar por una remuneración
Para ir a comprar cosas para el hogar
Para visitar parientes o amistades
Si puede comprar cosas para usted
Para participar en actividades comunales
Para hacer amigos(as) que su familia no conoce
Para votar por algún candidato en especial
Como alternativas de respuesta se tienen: Le debe pedir permiso, le avisa, va acompañada, no
tiene que hacer nada y otro. La recodificación para estas respuestas es la siguiente: le debe pedir
permiso 1 punto, le avisa 2 puntos, va acompañada 0 puntos y no tiene que hacer nada son 3
puntos.
Los casos en donde la respuesta fue “No aplica”, se excluyeron del análisis ya que no
proporcionan información relevante para estimar la autonomía de las mujeres. Por lo tanto de
7.267 mujeres, para la construcción de este índice sólo se tomaron las respuestas de 5.989.
Una vez codificadas las respuestas se tienen los siguientes resultados:
Ir
acompañada
Pedir
permiso
Avisar Nada
Para trabajar por una remuneración 1,6% 5,7% 49,9% 42,8%
Para ir a comprar cosas para el hogar 11,6% 2,0% 42,0% 44,4%
Para visitar parientes o amistades 8,7% 3,2% 47,9% 40,2%
35
Si puede comprar cosas para usted 4,4% 1,0% 29,1% 65,5%
Para participar en actividades comunales 4,9% 4,1% 42,9% 48,1%
Para hacer amigos(as) que su familia no conoce 3,1% 2,6% 33,0% 61,4%
Para votar por algún candidato en especial 2,7% 1,7% 23,0% 72,6%
Tabla 6. Para las siguientes actividades que le voy a nombrar usted tiene que…
Dentro de las variables que se usan para este este índice, no se observan posiciones claras para
la mayoría de las participantes en ítems como: Para ir a comprar cosas para el hogar o para
visitar parientes o amistades, ya que el porcentaje está dividido entre avisar o no hacer nada.
En la característica Trabajar por una remuneración se da el mayor porcentaje de mujeres que
tiene que pedir permiso, y por el contrario Si puede comprar cosas para usted es una variable
en la que el porcentaje de permisos solicitados es el menor.
Los estadísticos de las variables estudiadas muestran que todos los promedios están sobre 2,
manifestando una tendencia hacia avisar o no hacer nada para realizar estas actividades. Las
que más puntúan en promedio hacia no tener que hacer nada son: si puede comprar cosas para
usted, para hacer amigos que su familia no conoce y para votar por algún candidato en especial.
Los coeficientes de variación más altos se presentan en: Para visitar parientes o amistades y Para
participar en actividades comunales.
Promedio Desviación
estándar
Coeficiente de
variación
Para trabajar por una remuneración 2,339 0,659 28%
Para ir a comprar cosas para el hogar 2,191 0,945 43%
Para visitar parientes o amistades 2,196 0,862 39%
Si puede comprar cosas para usted 2,557 0,729 29%
Para participar en actividades comunales 2,343 0,774 33%
Para hacer amigos(as) que su familia no
conoce
2,526 0,697 28%
Para votar por algún candidato en especial 2,656 0,649 24%
Tabla 7. Estadísticos descriptivos
36
La matriz de correlación (tabla 8) muestra que las asociaciones entre las variables analizadas no
son muy altas, teniendo como máximo el valor 0.53 entre comprar cosas para el hogar y para
visitar parientes o amistades; y el 0.50 entre para hacer amigos que su familia no conoce y
participar en actividades comunales.
Tabla 8. Matriz de correlaciones
Para integrar las 7 actividades se realiza un análisis de componentes principales obteniendo los
resultados que aparecen en la tabla 9, en donde se tiene que el primer factor explica el 49.27%
del total de la varianza, el segundo el 12.36% y los demás menos del 10% del total de la inercia
cada uno. De esta forma se tiene que con los dos primeros ejes se está explicando el 61.6% del
total de la inercia.
En este caso, solo el primer autovalor es mayor que 1, por lo que aplicando el criterio de Kaiser
se debería tomar solamente este; de igual forma el gráfico de sedimentación muestra que de
ahí en adelante no se gana un porcentaje de inercia importante.
Para trabajar
por una
remuneración
Para ir a
comprar
cosas para
el hogar
Para visitar
parientes o
amistades
Si puede
comprar
cosas para
usted
Para
participar
en
actividades
comunales
Para hacer
amigos(as)
que su
familia no
conoce
Para votar
por algún
candidato
en especial
Para trabajar por una
remuneración1,00
Para ir a comprar cosas para el
hogar0,39 1,00
Para visitar parientes o amistades 0,42 0,53 1,00
Si puede comprar cosas para
usted0,38 0,40 0,42 1,00
Para participar en actividades
comunales0,49 0,43 0,47 0,46 1,00
Para hacer amigos(as) que su
familia no conoce0,39 0,32 0,38 0,44 0,50 1,00
Para votar por algún candidato en
especial0,36 0,28 0,28 0,39 0,36 0,43 1,00
37
Tabla 9. Componentes principales Gráfico 10. Gráfico de sedimentación
Al graficar las componentes principales de las columnas (gráfico 11) se diferencian tres grupos
de variables, en donde en la parte superior se tienen aquellas en las que las mujeres tienen
mayor autonomía: hacer amigos que su familia no conoce, votar por algún candidato en especial
y comprar cosas para usted; en el segundo grupo están trabajar por un pago remunerado, y
participar en actividades comunales, las cuales son las que mayor porcentaje de mujeres deben
pedir permiso; mientras que en el tercero están comprar cosas para el hogar y visitar parientes
o amistades, en donde los porcentajes se dividen entre avisar y nada.
Gráfico 11. Gráfico de columnas de las componentes principales
Factor Autovalor PorcentajePorcentaje
acumulado
1 3,45 49,3 49,3
2 0,87 12,4 61,6
3 0,63 9,1 70,7
4 0,60 8,6 79,3
5 0,54 7,7 87,0
6 0,46 6,6 93,6
7 0,45 6,4 100,0
38
Al ver el comportamiento de cada variable en la primera componente (tabla 9), se tiene que
todas se relacionan de forma positiva, en especial para participar en actividades comunales
(0.77) y la que menos se relaciona es para votar por algún candidato en especial (0.62).
Tabla 9. Cargas de las componentes
El gráfico de correlaciones de las variables (gráfico 11), ratifica los tres grupos de variables
mencionados anteriormente. Allí se ve una clara contraposición de dos grupos en donde en la
parte superior están aquellos en los que la autonomía de la mujer es muy clara, mientras que
en el grupo 3, de la parte inferior de la gráfica, están las actividades en las que el mayor
porcentaje de las mujeres se divide entre avisar y no hacer nada. Muy cerca al eje están las
actividades en las que se encuentra el mayor porcentaje de mujeres que deben pedir permiso.
Variable Componente 1
Para trabajar por una remuneración 0,70
Para ir a comprar cosas para el hogar 0,68
Para visitar parientes o amistades 0,72
Si puede comprar cosas para usted 0,72
Para participar en actividades comunales 0,77
Para hacer amigos(as) que su familia no
conoce0,71
Para votar por algún candidato en
especial0,62
39
Gráfico 12. Gráfico de correlaciones
En este caso, como sólo se trabajó con una componente, el índice está compuesto por todos los
ítems evaluados anteriormente, por lo que se procede a calcularlo y estandarizarlo de la misma
forma en la que se hizo para calcular el índice de poder de decisión, y así obtener valores entre
0 y 1.
Índice de autonomía =∑ 𝒙𝒊
𝒏𝒊=𝟏
𝟐𝟏
Al aplicar el índice obtenido en la base de datos se tiene la distribución presentada en el
histograma del gráfico 13, en donde se ve una clara tendencia hacia valores altos de este; su
media es de 0.8 mostrando una tendencia hacia la autonomía de la mujer en la mayoría de las
actividades analizadas.
40
Gráfico 13. Histograma índice de autonomía
En este indicador el alfa de Cronbach es de 0.82, indicando que las variables utilizadas son
adecuadas para el cálculo del índice
41
4. Estimación del índice de Roles de género
Durante muchos años el rol de la mujer en el hogar ha sido asignado como subordinado al
hombre, lo cual la ha llevado a tener limitantes en cuanto a sus opciones y capacidades, por lo
tanto toma relevancia el analizar cuál es la postura de la mujer ante este hecho, es decir, si lo
acepta o lo rechaza y por ende su concepción como individuos iguales con los mismos derechos.
Para analizar este hecho se realizaron 11 preguntas en las que ellas deberían decidir si están de
acuerdo o en desacuerdo con los siguientes ítems:
Una buena esposa debe obedecer a su esposo en todo lo que ordene
Una mujer puede escoger a sus amistades aunque a su esposo no le guste
El hombre debe responsabilizarse de todos los gastos de la familia
Una mujer tiene la misma capacidad que un hombre para ganar dinero
Es obligación de la mujer tener relaciones sexuales con su esposo aunque ella no
quiera
Cuando la mujer no cumple con sus obligaciones el marido tiene derecho a pegarle
Las mujeres y los hombres tienen los mismos derechos para tomar sus decisiones
Las mujeres y los hombres tienen la misma libertad
Las mujeres tienen el derecho a defenderse y a denunciar cualquier maltrato y
agresión
Las mujeres tienen la posibilidad de decidir sobre su propia vida
Las mujeres tienen el derecho a vivir una vida libre de violencia
Como alternativas de respuesta se tienen: de acuerdo y en desacuerdo, pero en este caso la
valoración depende de la pregunta que se está realizando, allí la codificación 0 indica que se
mantienen los roles tradicionales, mientras que el 1 indica un cambio de pensamiento. De esta
forma la codificación se establece según la tabla 10:
42
Tabla 10. Codificación de las variables
En este caso se tomaron 7245 casos para el análisis y una vez codificadas las respuestas se tienen
los siguientes resultados:
Variable De acuerdo En desacuerdo
Una buena esposa debe obedecer a su esposo en todo lo que ordene 18% 82%
Una mujer puede escoger a sus amistades aunque a su esposo no le guste 65% 35%
El hombre debe responsabilizarse de todos los gastos de la familia 29% 71%
Una mujer tiene la misma capacidad que un hombre para ganar dinero 88% 12%
Es obligación de la mujer tener relaciones sexuales con su esposo aunque ella
no quiera
3% 97%
Cuando la mujer no cumple con sus obligaciones el marido tiene derecho a
pegarle
3% 97%
Las mujeres y los hombres tienen los mismos derechos para tomar sus
decisiones
95% 5%
Las mujeres y los hombres tienen la misma libertad 83% 17%
Las mujeres tienen el derecho a defenderse y a denunciar cualquier maltrato
y agresión
99% 1%
Las mujeres tienen la posibilidad de decidir sobre su propia vida 98% 2%
Las mujeres tienen el derecho a vivir una vida libre de violencia 99% 1%
Tabla 11. Resultados variables recodificadas
Con base en las respuestas observadas en las tabla 11, se tiene que la gran mayoría de las
mujeres se encuentran concentradas en un cambio de pensamiento en el rol de la mujer,
especialmente en cuanto al derecho a defenderse y denunciar cualquier maltrato o agresión y
tener la posibilidad de decidir sobre su propia vida.
Variable De acuerdoEn
desacuerdo
Una buena esposa debe obedecer a su esposo en todo lo que ordene 0 1
Una mujer puede escoger a sus amistades aunque a su esposo no le guste 1 0
El hombre debe responsabilizarse de todos los gastos de la familia 0 1
Una mujer tiene la misma capacidad que un hombre para ganar dinero 1 0
Es obligación de la mujer tener relaciones sexuales con su esposo aunque ella no quiera 0 1
Cuando la mujer no cumple con sus obligaciones el marido tiene derecho a pegarle 0 1
Las mujeres y los hombres tienen los mismos derechos para tomar sus decisiones 1 0
Las mujeres y los hombres tienen la misma libertad 1 0
Las mujeres tienen el derecho a defenderse y a denunciar cualquier maltrato y agresión 1 0
Las mujeres tienen la posibilidad de decidir sobre su propia vida 1 0
Las mujeres tienen el derecho a vivir una vida libre de violencia 1 0
43
En la matriz de correlaciones se puede ver que las asociaciones entre las variables son en su
mayoría bajas, a excepción de aquellas que tratan acerca de los derechos de las mujeres, la
posibilidad de decidir y tener una vida libre de violencia, en donde se tienen valores superiores
al 40% (Tabla 12) .
Tabla 12. Matriz de correlaciones
Para integrar las 11 posiciones frente a los roles de género se realiza un análisis de componentes
principales obteniendo los resultados que aparecen en la tabla 13, en donde se observa que el
primer factor explica el 21.6% del total de la varianza, y con el segundo se tiene un porcentaje
de varianza acumulado de tan solo el 35%. De esta forma, para lograr obtener un mayor
porcentaje de varianza explicada, y basados en el criterio de Kaiser se toman 4 factores para
tener un porcentaje acumulado de varianza del 54%.
Una buena
esposa
debe
obedecer a
su esposo
en todo lo
que ordene
Una mujer
puede
escoger a
sus
amistades
aunque a su
esposo no
le guste
El hombre
debe
responsabili
zarse de
todos los
gastos de la
familia
Una mujer
tiene la
misma
capacidad
que un
hombre
para ganar
dinero
Es
obligación
de la mujer
tener
relaciones
sexuales
con su
esposo
aunque ella
no quiera
Cuando la
mujer no
cumple con
sus
obligacione
s el marido
tiene
derecho a
pegarle
Las mujeres
y los
hombres
tienen los
mismos
derechos
para tomar
sus
decisiones
Las mujeres
y los
hombres
tienen la
misma
libertad
Las mujeres
tienen el
derecho a
defenderse
y a
denunciar
cualquier
maltrato y
agresión
Las mujeres
tienen la
posibilidad
de decidir
sobre su
propia vida
Las mujeres
tienen el
derecho a
vivir una
vida libre de
violencia
Una buena esposa debe obedecer a su esposo en
todo lo que ordene1,00
Una mujer puede escoger a sus amistades aunque
a su esposo no le guste0,15 1,00
El hombre debe responsabilizarse de todos los
gastos de la familia0,24 0,06 1,00
Una mujer tiene la misma capacidad que un
hombre para ganar dinero0,15 0,11 0,10 1,00
Es obligación de la mujer tener relaciones
sexuales con su esposo aunque ella no quiera0,13 0,05 0,08 0,12 1,00
Cuando la mujer no cumple con sus obligaciones el
marido tiene derecho a pegarle0,05 0,01 0,07 0,10 0,17 1,00
Las mujeres y los hombres tienen los mismos
derechos para tomar sus decisiones0,09 0,10 0,08 0,22 0,12 0,06 1,00
Las mujeres y los hombres tienen la misma
libertad0,20 0,15 0,11 0,21 0,09 0,02 0,22 1,00
Las mujeres tienen el derecho a defenderse y a
denunciar cualquier maltrato y agresión0,04 0,06 0,03 0,06 0,08 0,05 0,19 0,11 1,00
Las mujeres tienen la posibilidad de decidir sobre
su propia vida0,07 0,08 0,03 0,12 0,07 0,03 0,26 0,17 0,41 1,00
Las mujeres tienen el derecho a vivir una vida
libre de violencia0,03 0,05 0,02 0,07 0,07 0,06 0,17 0,10 0,50 0,45 1,00
44
Tabla 13. Matriz de correlaciones Gráfico Gráfico 14. Gráfico de sedimentación
Al graficar las componentes principales de las columnas (gráfico 15), se generan dos grupos de
variables en donde en la parte superior están aquellas que se refieren a los derechos de las
mujeres a decidir y a vivir una vida libre de agresiones, estas variables son: Las mujeres tienen
el derecho a defenderse y a denunciar cualquier maltrato y agresión, las mujeres tienen la
posibilidad de decidir sobre su propia vida, las mujeres tienen el derecho a vivir una vida libre
de violencia. En estas características la mayoría de las mujeres se oponen al rol tradicional.
En contraposición se encuentra en la parte inferior del gráfico 15, aquellas en las que la posición
de acuerdo o desacuerdo no es tan unánime como en el grupo anterior.
Gráfico 15. Gráfico de columnas de las componentes principales
Factor Autovalor PorcentajePorcentaje
acumulado
1 2,3278 21,16 21,16
2 1,5063 13,69 34,86
3 1,1003 10,00 44,86
4 0,9980 9,07 53,93
5 0,9111 8,28 62,21
6 0,8385 7,62 69,84
7 0,7785 7,08 76,91
8 0,7613 6,92 83,84
9 0,7073 6,43 90,27
10 0,5774 5,25 95,51
11 0,4935 4,49 100,00
0.0
0.5
1.0
1.5
2.0
d = 0.2
PUNTAJEAF1
PUNTAJEAF2
PUNTAJEAF3
PUNTAJEAF4
PUNTAJEAF5
PUNTAJEAF6
PUNTAJEAF7
PUNTAJEAF8
PUNTAJEAF9
PUNTAJEAF10
PUNTAJEAF11
45
Al ver el comportamiento de cada variable en las componentes (tabla 14) se tiene que en la
primera de ellas las variables que más aportan son aquellas que tratan acerca del rol de la mujer
cuando a exige sus derechos, su libertad y tener una vida libre de agresiones. El segundo factor
está determinado por la variable obediencia, la tercera se refiere a las obligaciones con su
cónyuge y sus relaciones con otras personas, mientras que el cuarto está determinado por las
responsabilidades de gastos en el hogar y la capacidad de la mujer para aportar dinero en el
hogar.
Tabla 14. Matriz de correlaciones Gráfico
De acuerdo con los resultados obtenidos, los factores quedan determinados de la siguiente
manera:
Componente 1: Está determinado por las siguientes variables, las cuales son las que más le
aportan: las mujeres y los hombres tienen los mismos derechos para tomar sus decisiones, las
mujeres y los hombres tienen la misma libertad, las mujeres tienen el derecho a defenderse y a
denunciar cualquier maltrato y agresión, las mujeres tienen la posibilidad de decidir sobre su
propia vida y las mujeres tienen el derecho a vivir una vida libre de violencia. Por lo tanto este
será el factor de derechos de las mujeres y la no violencia.
Variable Factor 1 Factor 2 Factor 3 Factor 4
Una buena esposa debe obedecer a su esposo en
todo lo que ordene0,34 0,52 0,12 -0,42
Una mujer puede escoger a sus amistades aunque a
su esposo no le guste0,28 0,28 0,37 0,08
El hombre debe responsabilizarse de todos los gastos
de la familia0,25 0,45 -0,05 -0,62
Una mujer tiene la misma capacidad que un hombre
para ganar dinero0,41 0,38 0,03 0,43
Es obligación de la mujer tener relaciones sexuales
con su esposo aunque ella no quiera0,31 0,27 -0,54 0,11
Cuando la mujer no cumple con sus obligaciones el
marido tiene derecho a pegarle0,19 0,19 -0,74 0,09
Las mujeres y los hombres tienen los mismos
derechos para tomar sus decisiones0,54 0,10 0,07 0,37
Las mujeres y los hombres tienen la misma libertad 0,46 0,33 0,31 0,18
Las mujeres tienen el derecho a defenderse y a
denunciar cualquier maltrato y agresión0,64 -0,46 -0,04 -0,17
Las mujeres tienen la posibilidad de decidir sobre su
propia vida0,67 -0,37 0,06 -0,04
Las mujeres tienen el derecho a vivir una vida libre
de violencia0,64 -0,48 -0,05 -0,16
46
Componente 2: Está conformado por la variable una buena esposa debe obedecer a su esposo
en todo lo que ordene, por lo tanto será el factor de obediencia.
Componente 3: Tiene como eje las variables: una mujer puede escoger a sus amistades aunque
a su esposo no le guste, es obligación de la mujer tener relaciones sexuales con su esposo
aunque ella no quiera, cuando la mujer no cumple con sus obligaciones el marido tiene derecho
a pegarle. Por lo tanto será el factor de relaciones con su cónyuge y con otras personas.
Componente 4: Está conformado por: el hombre debe responsabilizarse de todos los gastos de
la familia y una mujer tiene la misma capacidad que un hombre para ganar dinero, en
consecuencia será el de aporte económico de la mujer al hogar.
El gráfico de correlaciones de las variables (gráfico 16), ratifica los dos grupos de variables
determinados con el gráfico 15. Allí se ve una clara contraposición de dos grupos en donde en
la parte superior están aquellos en los las mujeres no están totalmente en desacuerdo con el rol
tradicional de la mujer, mientras que en la parte de abajo están aquellas en las que el cambio
de pensamiento acerca de los roles tradicionales de género se da casi en el 100% de las mujeres.
Gráfico 16. Gráfico de correlaciones
47
El índice de roles de género se calcula estandarizando los subíndices compuestos por las
variables que más aportan a cada factor y multiplicándolos por su factor de ponderación, tal
como se hizo en el índice de poder de decisión, teniendo como resultado la siguiente ecuación:
Í𝒏𝒅𝒊𝒄𝒆 𝒅𝒆 𝒓𝒐𝒍𝒆𝒔 𝒅𝒆 𝒈é𝒏𝒆𝒓𝒐 = 𝟎. 𝟑𝟗𝟐 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓𝟏 + 𝟎. 𝟐𝟓𝟒 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓𝟐 +
𝟎. 𝟏𝟖𝟓 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓 𝟑 + 𝟎. 𝟏𝟔𝟖 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓 𝟒
Al calcular el índice para las mujeres de la base de datos, se tiene la distribución dada en el
gráfico 17, que muestra una distribución asimétrica negativa, lo que indica que hay una postura
de género igualitaria en cuanto a roles de género, entre hombres y mujeres. El alfa de Cronbach
para este índice es de 0.53, muy inferior al valor esperado 0.8, lo que podría ser un indicador de
que es necesario realizar un cambio de preguntas hacia aquellas que permitan medir de mejor
forma los roles de género.
Gráfico 17. Histograma roles de género
48
Conclusiones
El análisis de componentes principales es una metodología muy poderosa que permite además
de reducir dimensiones, generar índices que aplicados en áreas como las ciencias sociales son
muy útiles.
Los resultados obtenidos en este trabajo, aun cuando siguen la misma metodología aplicada en
México, revelan hallazgos muy diferentes a los encontrados allí, debido principalmente al tipo
de mujeres seleccionadas para el análisis. Como se mencionó en los estadísticos descriptivos de
la base, la mayoría de las mujeres seleccionadas tienen su propio negocio, lo que las hace de
alguna manera personas más empoderadas, con mayor autonomía e inclinación hacia unos roles
de género mucho más equitativos.
Esto mismo no sucede en México debido a que la muestra es totalmente aleatoria y no tiene en
cuenta que las mujeres estén inscritas a un programa como el que existe en Colombia de
Mujeres Ahorradoras en Acción.
Uno de los puntos a mejorar en este análisis es el grupo de preguntas con el que se calcula el
índice de roles de género, debido a que el índice de Cronbach es bajo (0.53) y brinda una alerta
acerca de la utilidad de las preguntas analizadas para calcularlo. Se podría plantear un cambio
bien sea en el contenido de estas o en la forma en la que se pregunta ya que este tipo de
cuestionamientos, realizados de la manera en la que se hicieron, generan confusión en el
entrevistado, lo que puede llevar a encontrar resultados erróneos.
49
Bibliografía
1. http://www.dps.gov.co
2. Castro, Roberto y Casique Irene (2008). Violencia de género en las parejas mexicanas.
Análisis de resultados de la Encuesta Nacional sobre la dinámica de las relaciones en los
hogares 2006. Instituto Nacional de las mujeres. México.
3. Pardo, Campo Elías (2003). Lebart et al Statisquique exploratoire multimensionnelle
Traducción provisional. Universidad Nacional de Colombia.
4. Díaz, Luis G. Estadística multivariada: inferencia y métodos (2002). Universidad Nacional
de Colombia.
5. Anderson, T.W. (1984). An introduction to Multivariate Statistical Analysis. John Wiley
& Sons.
6. Gutiérrez, R. y González, A. (1991). Estadística Multivariable. Introducción al análisis
multivariante. Servicio de Reprografía de la Facultad de Ciencias. Universidad de
Granada.
7. Hair, J.; Anderson, R.; Tatham, R. y Black, W. (2000). Análisis Multivariante. 5ª Edición
(en español). Prentice Hall.
8. Johnson, R.A. y Wichern, D.W. (1988). Applied Multivariate Analysis. Prentice Hall
International,Inc.
9. Martínez Arias, R. (1999). El análisis multivariante en la investigación científica.
Colección Cuadernos de Estadística, 1. Hespérides.
10. Timm, N. H. (1975). Multivariate Analysis with applications in education and psychology.
Brooks/Cole Publishing.