Página 135 - ANALITIK-11

Versión de HTML Básico

Analítika, Revista de análisis estadístico, (2016), Vol. 11
Propuesta de modelación basada en un enfoque de redes probabilísticas: una aplicación a la consistencia
macroeconómica
131
mensuales que pueden dar alguna luz sobre lo que est´a ocurriendo en el sistema econ´omico y
que tienen relaci´on con el PIB, como el consumo de energ´ıa el´ectrica o el ´Indice de Actividad
Econ´omica Coyuntural (Ideac), por ejemplo, pero dicha relaci´on no es f´acilmente explicitada
precisamente por la falta de herramientas que permitan hacerlo.
La idea, entonces, del aprendizaje del modelo que se plantea en este trabajo consiste
en construir en primera instancia un LTM con la mayor cantidad de variables observables
mensualmente posibles. Una vez seleccionado el mejor modelo en funci´on de los criterios
explicados anteriormente, el siguiente paso consiste en buscar una explicaci´on econ´omica a
las variables latentes encontradas. Para esto, se plantea un barrido de todas las opciones
posibles, descartando aquellas que por una simple aplicaci´on de conceptos econ´omicos no
ser´ıan plausibles a la luz de las variables observables que est´an conectadas a las variables
latentes en cuesti´on. As´ı, para continuar con el ejemplo anterior, si una variable latente
H
est´a conectada directamente en el LTM a las variables
X
1
: empleo y
X
2
: consumo total de
energ´ıa el´ectrica, una alternativa factible para explicar esa variable latente podr´ıa ser el PIB
pero, por otro lado, ser´ıa muy poco probable que el efecto no observable com´un a
X
1
y
X
2
sea el consumo del sector p´ublico.
M´as all´a del aporte de esta investigaci´on en cuanto a lo novedoso y las ya mencionadas
potencialidades de utilizar modelos gr´aficos con variables latentes para tratar explicar un
´ambito de consistencia macroecon´omica, una contribuci´on adicional consiste en buscar dar
contenido a las variables latentes, precisamente por el hecho de estar modelando un sistema
econ´omico y se puede tener bastante claridad sobre el tema a la luz de la teor´ıa econ´omica.
Resumiendo, en cuanto al aprendizaje del ´arbol, se construye el mejor LTM con un amplio
conjunto de datos de la mayor periodicidad posible (mensual, en este caso) y luego se prue-
ba la explicaci´on de las variables latentes halladas “calzando” con los principales agregados
macroecon´omicos en el siguiente nivel de desagregaci´on en el que dicha informaci´on est´e dis-
ponible (trimestralmente en Ecuador). La comparaci´on entre modelos se realiza utilizando
la distancia de Kullback-Leibler (definida en una secci´on previa) entre las distribuciones re-
sultantes de los mismos, bajo el supuesto de que la distribuci´on original es la que se obtiene
en el primer LTM, es decir, en el que las variables latentes no est´an asociadas a un indicador
macroecon´omico a´un.
4.2.3 Tercera etapa: inferencia
Como ya se dijo antes, por inferencia se entiende responder a preguntas del tipo
P
(
X
|
E, M
),
donde
X
es la variable (o conjunto de variables) sobre la que se desea conocer algo,
M
es el
modelo probabil´ıstico que se desea utilizar para responder a la pregunta y
E
es la evidencia o
informaci´on observable disponible para “refinar” dicha respuesta. Puntualmente, en el caso
de los LTM, la inferencia ser´ıa de la forma
P
(
W
|
X, H
;
θ
ML
, T
), donde
W
es el conjunto
de variables sobre las que se desea inferir (responder) algo,
X
es el conjunto de las dem´as
variables observables,
H
el conjunto de variables latentes,
θ
ML
el conjunto de par´ametros
21