Página 39 - ANAlitica6

Versión de HTML Básico

Construcción del Índice de Cohesión Social para México
Analíti a
k
6
Revista de Análisis Estadístico
Journal of Statistical Analysis
Tabla 5.
Variables altamente correlacionadas. Fuente: Elaboración propia. Obtenida a través de la matriz correlación (Guerrero, 2013)
X
1
X
2
X
3
X
5
X
6
X
7
X
8
X
9
X
10
X
17
X
18
X
19
X
23
X
1
X
2
X
3
-0.798
X
4
-0.846
X
5
X
6
0.735
-0.682
0.613
X
7
-0.668 -0.910
X
8
0.662
-0.770
0.867
-0.787
X
9
0.684
-0.686
X
10
0.668
-0.798
0.741
-0.797
X
11
-0.613
0.724
0.796
-0.832
0.680
0.708 -0.787
X
18
0.729
X
19
0.639 0.737
X
20
0.892
0.892
X
24
0.689
4 Aplicación y Resultados
En la Tabla 5 se puede observar que las variables
X
1
,
X
2
,
X
3
,
X
6
,
X
7
,
X
8
,
X
9
,
X
10
,
X
11
,
X
17
,
X
18
,
X
19
y
X
20
están altamente correlacionadas.
Estadísticamente, la correlación surge cuando dos o
más variables independientes del modelo están asociadas
como una correlación de Pearson. En la Tabla 5, por ejem-
plo se puede apreciar que los valores
X
2
=
0,846 y
X
4
=
0,846 tienen alta correlación negativa. Suele ser un
problema muestral que se presenta normalmente en da-
tos con perfil de series de tiempos (Peña, 2002). Así, por
ejemplo, los años de educación y el alfabetismo, con fre-
cuencia presentan una alta correlación, pues ambas evolu-
cionan conjuntamente: a mayor alfabetismo se presupone
más años de educación. Por tal motivo, será difícil separar
el efecto de cada una sobre la variable dependiente y que
se produzca multicolinealidad, debido a la relación causal
existente entre dichas variables.
0.0000
1.0000
2.0000
3.0000
4.0000
5.0000
6.0000
7.0000
8.0000
9.0000
Comp 1
Comp 2
Comp 3
Comp 4
Comp 5
Comp 6
Comp 7
Comp 8
Comp 9
Comp 10
Comp 11
Comp 12
Comp 13
Comp 14
Comp 15
Comp 16
Comp 17
Comp 18
Comp 19
Comp 20
Comp 21
Comp 22
Comp 23
Comp 24
Comp 25
Comp 26
Comp 27
Comp 28
Comp 29
Comp 30
Varianza
Figura 2.
Screet Plot sobre los componentes principales. Fuen-
te: Elaboración propia. Optimización de las variables originales
(Guerrero, 2013).
4.1 Variabilidad de las variables
En la Tabla 6, se puede observar que
X
1
,
X
9
,
X
10
,
X
12
,
X
17
,
X
18
,
X
19
,
X
20
, y
X
23
tienen varianzas muy altas en com-
paración con las demás; no obstante,
X
12
representa el 99 %
de la varianza total. Todo esto puede ocasionar sesgo hacia
las variables que presentan datos con valores grandes, pues
no hay una distribución simétrica entre ellos.
Aplicando la técnica de análisis de componentes princi-
pales sobre la matriz correlación, se obtiene lo indicado en
le Figura 2.
En la Tabla 7 y en la Figura 1 se puede observar que
el primer componente tiene una varianza de 7.9575 y re-
presenta el 26.5 % de la varianza total; en el segundo com-
ponente, su varianza es de 3.6515 y simboliza el 12.2 % de
la varianza total; por último, el tercer componente perso-
nifica el 9.4 % de la varianza. Se puede ver que los nueve
primeros componentes explican más del 75 % de la varian-
za total, por tanto, son los adecuados para determinar los
distintos Índices que conformarían a la Cohesión Social.
Los diversos investigadores sugieren que, para datos ti-
po laboratorio, es de suma importancia que se tomen los
componentes necesarios para explicar el 95 % de la varian-
za total. Para datos de personas, negocios, estudios de mer-
cado, entre otros, se debe tomar los componentes que expli-
quen entre el 70 % y 75 % de la variación total (Peña, 2002).
En el Figura 3 se observa que los nueve componentes
elegidos explican el 75.30 % de la variabilidad total; sin em-
bargo, el porcentaje correspondiente al componente uno es
de 35.19 %, frente al 16.20 %, 12.48 %, 8.76 %, 7.04 %, 6.11 %,
5.31 %, 4.65 %, y 4.38 % en los componentes 2, 3, 4, 5, 6, 7, 8,
y 9, respectivamente. Teniendo en cuenta estos porcentajes,
es posible decir que todas las variables pueden resumirse
en nueve componentes, esto se puede reconfirmar con los
resultados mostrados en la Tabla 7.
La varianza explicada también permite determinar el
número de componentes principales adecuados, pues el
número de componentes principales está dado por aque-
llos eigenvalores mayores a uno (Montgomery, 2007). En
este caso, los ocho primeros componentes cumplen con es-
ta regla; no obstante, para este trabajo de investigación se
trabajará con nueva componentes, pues eso brindará ma-
yor claridad sobre el Índice de Cohesión Social.
Analítika,
Revista de análisis estadístico
, 3 (2013), Vol. 6(2): 33-47
37