Análisis de Movilidad Social en el Ecuador
Analíti a
k
8
Revista de Análisis Estadístico
Journal of Statistical Analysis
y
y
i
2
=
β
2
x
i
2
+
ε
i
2
.
(2)
Considerando las líneas de pobreza de la primera ronda
(
z
1
)
y de la segunda
(
z
2
)
, la primera aproximación para
medir la movilidad hacia afuera de la pobreza está dada
por la probabilidad de que un hogar pase de ser pobre en
el primer periodo a superar el umbral de pobreza en el se-
gundo periodo. Es decir:
P
(
y
i
1
<
z
1
∩
y
i
2
>
z
2
)
, expresión
que se puede reescribir como
8
:
Pr
(
ε
i
1
<
z
1
−
β
1
x
i
1
∩
ε
i
2
>
z
2
−
β
2
x
i
21
)
(3)
Dado que la línea de pobreza y el vector de caracte-
rísticas son datos para ambas rondas de la encuesta, la
expresión (3) indica que la probabilidad de que un hogar
pase de ser pobre a no pobre depende del término de error
de la ecuación del ingreso.
Figura 4.
Variables características y proyección del ingreso. En es-
ta ilustración el ingreso y la línea de pobreza se encuentra expre-
sado en dólares actuales. Elaboración propia.
La Figura 4 refleja la dinámica de la movilidad en base
al ingreso del hogar. El ingreso es la variable de resultado
de una proyección y está expresado en dólares del perio-
do final; por ello, solo hay una línea de pobreza; los casos
desde
M
1
hasta
M
4
indican pares de hogares con perfiles
similares según sus características
(
x
1
y x
2
)
, para am-
bas rondas. El caso
M
2
es un caso de alta movilidad, dado
que ambos hogares tienen un perfil similar pero su ingre-
so resulta muy distinto entre el periodo 1 y periodo 2; en
tal caso, los términos de error tienen una correlación baja
(
ρ
−→
0); es decir que, entre más independientes sean los
ingresos del primer y segundo periodo y en consecuencia
los términos de error, existe una probabilidad de movilidad
más alta ya sea hacia afuera o hacia dentro de la pobreza.
El segundo supuesto necesario para estimar la movi-
lidad mediante este enfoque, consiste en asumir que la
correlación entre
ε
1
y
ε
2
es no negativa; es decir, se asume
que si el ingreso fuera sobre (sub) estimado en el primer
periodo, se esperaría que fuera sobre (sub) estimado en el
segundo periodo. En otras palabras, si el ingreso es esti-
mado de manera incorrecta, esta estimación errónea se da
en la misma dirección. Adicionalmente, el análisis se limita
a hogares cuyos jefes de hogar están entre 20 y 60 años.
El autor menciona que estimar la movilidad fuera de esos
rangos de edad es más difícil, porque se trata de hogares
que están empezando a formarse o disolverse [6] y en tal
caso es insostenible la hipótesis de que las variables usadas
son invariantes en el tiempo.
Como se mencionó antes, lo que se estimará son unas
cotas superior e inferior del indicador que se derivan de
los valores que pueda tomar
ρ
. La estimación del Límite
superior para los casos de movilidad, cuando la correla-
ción es nula (
ρ
=
0), se lleva a cabo mediante el siguiente
procedimiento:
Se estima el ingreso de la ronda 1 mediante un modelo
lineal, el cual se replica para la ronda 2 utilizando las mis-
mas variables; se obtienen así los vectores de parámetros
β
1
y
β
2
y los términos de error
ε
1
y
ε
2
, respectivamente. A
continuación, se hace la siguiente pregunta. ¿Cuál hubie-
ra sido el ingreso de un hogar de la ronda 2 en la ronda
1? (la pregunta inversa también es válida y debería arrojar
aproximadamente los mismos resultados). Para responder,
se utilizan los parámetros y el término de error de la ronda
1 para aproximar el ingreso de un hogar de la ronda 2:
ˆ
y
i
1
=
ˆ
β
1
x
i
2
+
ε
⋆
i
1
,
(4)
donde ˆ
y
i
1
denota el ingreso de un hogar en el periodo 1,
estimado con la información del periodo 2. En la expresión
4 se conoce el vector de parámetros
β
1
; se conoce para cada
hogar de la segunda ronda sus características
x
i
2
, pero no
se conoce el término de error
ε
i
1
de los hogares de la ronda
2 en la 1. Para resolver este problema existen dos alterna-
tivas: i) realizar un muestreo aleatorio con repetición del
término de error de la ronda 1 y asignar esta variable a los
hogares de la ronda 2; dicho proceso se repite un número
determinado de veces
9
. Nótese que cada vez que se realice
una asignación del vector de error se tendrá una valora-
ción distinta del vector de ingresos
10
. Es de esperar que,
al ser el término de error asignado de manera aleatoria, al
computar la correlación entre los términos de error para los
diferentes ingresos entre las dos rondas, dicha correlación
sea marginal; se realiza, en consecuencia, la hipótesis de
correlación nula, ii) la segunda alternativa para resolver el
problema es asignar una distribución normal para el tér-
mino de error de la ronda 1 con la media y varianza del
término de error del periodo 1, es decir
ε
⋆
i
1
∼
N
(
¯
ε
1
,
σ
ε
1
)
.
Al igual que en el caso anterior, este proceso se repite un
8
En ausencia de paneles genuinos, no se puede observar en el periodo 1 y 2 al hogar
i
.
9
Tomar en cuenta que el tamaño muestral de la encuesta siempre aumenta entre un periodo y otro.
10
La implementación de Bootstrap para el presente ejercicio comprobó que usar un número de repeticiones pequeño, como 20, o grande, como 150, tuvo una repercusión
marginal sobre los indicadores de movilidad. En concreto, se tomaron 100 selecciones del término de error para asignarlos a los hogares de la ronda 2, obteniéndose 100
estimaciones distintas de ingreso; para la estimación de las probabilidades, se consideró el indicador promedio de pobreza por ingresos con las diferentes estimaciones del
ingreso.
Analítika,
Revista de análisis estadístico
, 4 (2014), Vol. 8(2): 53-68
57