Analíti a
k
9
Revista de Análisis Estadístico
Journal of Statistical Analysis
Analítika, Revista de análisis estadístico, (2015), Vol. 9
Localizacion de centros de empleo y su influencia sobre la distribucion de la poblacion en el Distrito...
77
de mejor desempe˜no pr´actico en la selecci´on de modelos
21
.
En el modelo se incluye
D
−
1
ij
y
−
D
ij
, para que los estimadores lineales en la regresi´on
semiparam´etrica tengan una relaci´on positiva con el logaritmo de la densidad si ejercen
alguna influencia sobre la densidad de empleo. A continuaci´on se corre el modelo utilizando
un proceso de regresi´on de selecci´on inversa en que se incluyen todas las variables de distancia
antes mencionadas para todos los candidatos en el modelo y se elimina aquella cuyo valor t
sea el m´as bajo de todos y se vuelve a correr el modelo. As´ı hasta que todos los estimadores
sean significativos al 10 %
22 23
. En todos los pasos se forza a los t´erminos de la expansi´on y
al intercepto a permanecer en el modelo. Es as´ı que son subcentros aquellos candidatos que
tengan variables de distancia con efectos significativamente positivos en el logaritmo de la
densidad del empleo al final del proceso de regresi´on de selecci´on inversa.
El span utilizado para el ajuste es de 0,05; esto a pesar de que el trabajo original de
McMillen (2001) establece un span de 0,5. La decisi´on de usar un span tan peque˜no se
toma, en primer lugar, debido a la evidente diferencia que se reflej´o, tanto en el an´alisis
exploratorio como en la funci´on estimada, de la macrocentralidad y del resto de la ciudad;
en segundo lugar debido a que un span tan grande como 0,5 puede hacer que no se capturen
las particularidades de las localidades m´as peque˜nas (Redfearn (2007)). Tras la detecci´on de
los lugares con residuos significativos se realiza una identificaci´on de candidatos, estos son
m´aximos locales dentro de un radio de 2.000 metros. Tras esto se procede a la segunda fase
del m´etodo que es una evaluaci´on de los efectos de cada uno de estos centros de empleo sobre
la densidad de empleo para confirmar que estos candidatos son en efecto centros de empleo.
Los resultados obtenidos en trabajos previos con esta metodolog´ıa muestran resultados
consistentes al usar este span; sin embargo el ejercicio de identificaci´on de candidatos se
realizo usando distintos span. Espec´ıficamente a la distancias de dos kil´ometros; adem´as los
span utilizados son de 0.05, 0.15, 0,25 y 0.5. Los resultados muestran que niveles de span
muy grandes la t´ecnica no logra detectar todas las localidades que el conocimiento general
de la ciudad indicar´ıa como centros de empleo. Pero m´as all´a de eso adem´as es evidente por
el an´alisis exploratorio que el n´umero de subcentros y sus localizaciones son m´as consistentes
con el span m´as peque˜no de 0.05. El cambio de distancia solo cambia el n´umero de candidatos
mas no la localizaci´on de los que ya han sido detectados; esto se puede apreciar en el Figura 9.
En el panel (a) se pueden ver los candidatos obtenidos con un span de 5 % de las observaciones
con distancias de 1.000 y 2.000 metros; en el panel (b) los obtenidos con un span de 25 %
de las observaciones con distancias de 1.000 y 2.000 metros. Es evidente que el span es lo
que determina la localizaci´on de los candidatos y en cierta medida el n´umero. La distancia
21
Para ver las ventajas del AIC sobre el SIC (o BIC), v´ease Burnham and Anderson (2002); Burnham and
Anderson (2004).
22
La metodolog´ıa original McMillen (2001) considera un nivel del 20 % de confianza sin embargo por la
reducci´on del span antes explicada, se utiliza un filtro m´as riguroso en la significancia de la relaci´on entre
las variables dependientes y los regresores.
23
La variable que se borra puede ser significativa si su coeficiente es negativo.
23