Página 37 - ANAlitica6

Versión de HTML Básico

Construcción del Índice de Cohesión Social para México
Analíti a
k
6
Revista de Análisis Estadístico
Journal of Statistical Analysis
la identificación de sistemas, subsistemas y supra-sistemas
que tienen injerencia en el problema (Luna y Infante, 2005).
2.2 Análisis de Componente Principales
Sea
X
= [
X
1, . . . ,
Xp
]
una matriz de datos multivarian-
tes. Lo que sigue también vale si
X
es un vector forma-
do por
p
variables observables. Por definición, los compo-
nentes principales son las variables compuestas (Corallini,
2005).
Y
1
=
Xt
1
,
Y
2
=
Xt
2
, . . . ,
Y
p
=
Xt
p
,
donde
t
1
,
t
2
, . . . ,
t
p
son los componentes principales.
Bajo los siguientes supuestos:
1. Var
(
Y
1
)
es máxima, condicionada a
t
1
t
1
=
1.
2. Entre todas las variables compuestas
Y
tales que
Cov
(
Y
1,
Y
) =
0, la variables
Y
2 es tal que Var
(
Y
2
)
es máxima condicionado a
t
2
t
2
=
1. Esta es una con-
dición del modelo empleado
3. Si
p
>
3, la componente
Y
3
es una variable no corre-
lacionada con
Y
1
,
Y
2
con varianza máxima.
4. Análogamente, se definen las demás componentes
principales si
p
>
3.
Si
T
= [
t
1
,
t
2
, . . . ,
t
p
]
es la matriz
p
×
p
, cuyas columnas
son los vectores que definen los principales componentes,
entonces la transformación lineal
X
Y
,
Y
=
XT
.
Con base en lo anterior, el primer componente principal
será la combinación lineal de las variables originales que
tenga varianza máxima. Los valores de este primer compo-
nente están compuestos por (Montgomery, 2007),
Y
1
=
Xt
1
.
Como las variables originales tienen media cero, igual que
Y
1
, también la varianza de
Y
1
será Var
(
Y
1
) =
t
1
St
1
, donde
S
es la matriz de varianzas y covarianza de las observacio-
nes. Aumentado el módulo del vector
t
1
, se maximiza la
varianza sin límite. Para que la maximización de Var
(
Y
1
)
tenga solución se debe imponer una restricción al módu-
lo del vector
t
1
, y, sin pérdida de generalidad, se impondrá
que
t
1
t
1
=
1. Al introducir esta restricción mediante el mul-
tiplicador de Lagrange,
M
=
t
1
St
1
λ
(
t
1
t
1
1
)
.
Al minimizar esta expresión respecto de la forma habitual,
derivando respecto a los componentes de
t
1
, e igualando a
cero. Entonces,
M
t
1
=
2
St
1
2
λ
t
1
=
0,
cuya solución es
St
1
=
λ
t
1
,
donde
t
1
es un vector propio de la matriz
S
, y
λ
su corres-
pondiente valor propio. Para determinar qué valor propio
de
S
es la solución de
St
1
se tendrá en cuenta que, multipli-
cando por la izquierda por
t
1
esta ecuación (Montgomery,
2007)
t
1
St
1
=
t
1
λ
t
1
=
λ
.
En conclusión,
λ
es la varianza de
t
1
. Como esta es la canti-
dad que se desea maximizar,
λ
será el mayor valor propio
de la matriz
S
. Su vector asociado,
t
1
, define los coeficientes
de cada variable en el primer componente.
Para el segundo componente, se debe obtener el mejor
plano de proyección de las variables
X
. Se establece como
función objetivo que la suma de las varianzas de
Y
1
=
X
1
t
1
y
Y
2
t
2
sea máxima, donde
t
1
y
t
2
son los vectores que defi-
nen el plano. La función objetivo será (Peña, 2002),
Θ
=
t
1
St
1
+
t
2
St
2
λ
1
(
t
1
t
1
1
)
λ
2
(
t
2
t
2
1
)
,
que incorpora las restricciones de que las direcciones de-
ben tener módulo unitario
(
t
i
t
i
) =
1,
i
=
1, 2. Derivando e
igualando a cero,
Θ
t
1
=
2
St
1
2
λ
1
t
1
=
0,
Θ
t
2
=
2
St
2
2
λ
2
t
2
=
0,
la solución de este sistema es,
St
1
=
λ
1
t
1
,
St
2
=
λ
2
t
2
.
Esto indica que
t
1
y
t
2
deben ser vectores propios de
S
. To-
mando los vectores propios de norma uno y sustituyendo
en
Θ
, se obtiene que, en el máximo, la función objetivo es,
Θ
=
λ
1
+
λ
2
;
es claro que
λ
1
y
λ
2
deben ser los dos autovalores mayores
de la matriz
S
, y
t
1
y
t
2
sus correspondientes autovectores.
La covarianza entre
Y
1
y
Y
2
, dada por
t
1
St
2
es cero,
t
1
t
1
=
0,
y las variables
Y
1
y
Y
2
estarán no correlacionadas.
Con base en lo anterior, la técnica de análisis de compo-
nentes principales tiene como propósito:
Reducir el espacio muestral de un determinado fenó-
meno. Crear nuevas variables, las cuales serán inses-
gadas.
Maximizar la varianza de cada componente con res-
pecto de la varianza total.
Crear indicadores a través de los componentes prin-
cipales, los cuales, al conjuntarse forman el Índice de
Cohesión Social.
3 Metodología
Para la CEPAL, la Cohesión Social se divide en tres ru-
bros; el primero, se compone por los indicadores de dis-
tancia, los cuales hacen referencia a la desigualdad de in-
gresos, pobreza e indigencia, empleo, educación, salud, vi-
vienda y pensiones; el segundo, corresponde a los indica-
dores institucionales, tales como: funcionamiento de la de-
mocracia factibilidad del Estado e integración familiar; y, el
tercero, lo constituyen los indicadores de pertenencia: mul-
ticulturalismo, confianza y participación ciudadana, soli-
daridad social y expectativas de movilidad. Conforme a lo
planteado anteriormente, el Índice de Cohesión Social se
estructura de la siguiente forma (Sojo y Uthoff, 2007):
Analítika,
Revista de análisis estadístico
, 3 (2013), Vol. 6(2): 33-47
35