Página 54 - ANAlitica3

Versión de HTML Básico

Adrián Gutiérrez Cabello y Andrés Salama
Analíti a
k
3
Revista de Análisis Estadístico
Journal of Statistical Analysis
El análisis de los promedios simples de las participa-
ciones permite determinar el grado de homogeneidad que
tienen los grupos, medido a través del coeficiente de varia-
ción, y definido como:
Coeficiente de variación
cv
=
σ
¯
x
donde:
σ
=
desvío estándar,
(1)
¯
x
=
media.
(2)
Los datos para Provincia de Buenos Aires están divididos
en Conurbano e Interior; dadas las distintas característi-
cas que tienen ambas zonas, en el proceso de conformación
de los conjuntos la información es procesada por regiones,
sin considerar la provincia en su conjunto. Las diferencias
mencionadas entre el Conurbano y el Interior de Buenos
Aires quedan en evidencia al ver que están en distintos
conglomerados.
3.4 Número de conglomerados
El análisis jerárquico de conglomerados da la posibili-
dad de elegir el número de soluciones final de grupos que
se pueden formar; ese número varía desde cada observa-
ción. Su puede configurar desde un grupo hasta un solo
conglomerado que incluya al total de los elementos.
Existen varias herramientas para decidir cuál es el nú-
mero óptimo de clústeres; una de ellas es el dendograma,
que es una representación gráfica en forma de árbol que
resume el proceso de agrupación en un análisis de clúste-
res. Los objetos similares se conectan mediante enlaces cu-
ya posición en el diagrama está determinada por el nivel
de similitud/disimilitud entre los objetos. De este modo,
se refleja el historial de conglomeración, que indica como
cada individuo que forma un grupo independiente se va
agrupando con los más cercanos hasta forman un solo gru-
po.
El software SPSS propone el dendograma como medio
para determinar el número de clústeres en forma directa.
Otra forma de hacerlo es mediante el cálculo de la tasa de
variación entre los coeficientes conglomeración que se ob-
tienen en las distintas etapas en las que se fusionan los gru-
pos. Este método, propuesto por Hair, Anderson, Tatham
y Black, sugiere que el momento de detener las fusiones es
cuando la tasa de variación sea significativamente superior
a la anterior.
Si se analiza el dendograma, se observa que se inicia
con nueve conglomerados que se van fusionando, hasta
que a una distancia de 25 se forma un solo grupo. En es-
te punto, la literatura
3
sugiere que haciendo un corte a una
distancia de 13 unidades, quedan determinados dos gru-
pos; sin embargo, también se puede apreciar que tres es
una solución posible, dado el importante salto que se ob-
serva después de la formación de tres conglomerados.
Aplicando la técnica de determinación de números con-
glomerados, de acuerdo al historial de conglomeración, se
puede inferir que el número de grupos es dos, dado que
el mayor salto en la tasa de variación de los coeficientes es
entre la etapa 23 y 24, donde se forman dos clústeres.
Si bien en la primera etapa hay una variación importan-
te en la tasa de variación, esto supondría que cada provin-
cia o región formaría un clúster.
Etapa Coeficientes
Tasa de
variación
Grupos
1
13,8
170,7 %
24
2
37,4
72,1 %
23
3
64,4
58,7 %
22
4
102,1
39,8 %
21
5
142,8
29,5 %
20
6
184,9
24,2 %
19
7
229,6
24,0 %
18
8
284,8
21,2 %
17
9
345,3
20,5 %
16
10
415,9
17,2 %
15
11
487,6
15,0 %
14
12
560,8
20,0 %
13
13
673,0
17,9 %
12
14
793,3
19,7 %
11
15
949,7
19,2 %
10
16
1132,1
23,6 %
9
17
1399,6
19,3 %
8
18
1670,4
29,1 %
7
19
2156,0
25,6 %
6
20
2708,7
27,2 %
5
21
3444,3
23,0 %
4
22
4235,1
44,5 %
3
23
6121,0
81,6 %
2
24
11115,6
1
Tabla 3.
Historial de conglomeración
Si bien desde el punto de vista estadístico el número de
conglomerados sería dos, es importante destacar que, pa-
ra los fines analíticos del presente trabajo se consideraron
nueve (los primeros grupos que muestra el dendograma)
dadas las características sociales y económicas de la Repú-
blica Argentina, en la cual la Ciudad Autónoma de Buenos
Aires tiene particularidades que la diferencian claramente
del resto del país.
Junto con lo anterior, la formación de estos conglome-
rados (con mayor desagregación), permitirá comparar la
estructura productiva de cada uno, medido como la con-
tribución de los sectores económico en el Producto Bruto
Geográfico provincial, con la participación de cada activi-
dad en la demanda de crédito bancario.
3
Ver por ejemplo [10].
52
Analítika,
Revista de análisis estadístico
, 2 (2012), Vol. 3(1): 45-59