Página 156 - ANALITIK-11

Versión de HTML Básico

Jaime Fernández
Analítika, Revista de análisis estadístico, (2016), Vol. 11
152
Si
X
Y
|
Z
y
X
W
|
(
Y, Z
), entonces
X
(
Y, W
)
|
Z
;
Si
X
Y
|
Z
y
X
Z
|
Y
, entonces
X
(
Y, Z
); y
X
Y
|
Z
f
(
x, y, z
)
f
(
z
) =
f
(
x, z
)
f
(
y, z
)
⇔ ∃
a, b
:
f
(
x, y, z
) =
a
(
x, z
)
b
(
y, z
).
Propiedades de la distancia de Kullback-Leibler
Esta distancia de Kullback-Leibler no cumple con las propiedades usuales de una dis-
tancia definida sobre un espacio m´etrico, pues, ni es sim´etrica, i.e.
D
(
b
(
{
x
}
)
||
P
(
{
x
}
)) =
D
(
P
(
{
x
}
)
||
b
(
{
x
}
)), ni cumple con la desigualdad triangular:
D
(
b
(
{
x
}
)
||
P
(
{
x
}
))+
D
(
P
(
{
x
}
)
||
q
(
{
x
}
))
D
(
b
(
{
x
}
)
||
q
(
{
x
}
)).
Por otro lado, las otras dos propiedades usuales de una distancia si son cumplidas por la
distancia de Kullback-Leibler, estas son:
i
D
(
b
(
{
x
}
)
||
P
(
{
x
}
))
0, para cualquiera
b
y
P
, y;
ii
D
(
b
(
{
x
}
)
||
P
(
{
x
}
)) = 0 si y solamente si las dos funciones de probabilidad
b
y
P
son
iguales.
Algunos aspectos de los LTM
Scoring y elecci´on del modelo
En los modelos gr´aficos un indicador de scoring es siempre deseable para poder comparar
entre distintas alternativas para una elecci´on final. Aunque varios tipos de score pueden ser
utilizados para “medir” modelos de ´arbol con variables latentes, el criterio de informaci´on
bayesiana (BIC, por sus siglas en ingl´es) es el que se utiliza de forma casi general en la
literatura especializada y los trabajos experimentales desarrollados.
Consid´erese un conjunto de
n
variables observables
X
=
{
X
1
, ..., X
n
}
y una colecci´on de
N
observaciones independientes id´enticamente distribuidas (i.i.d.)
D
x
=
{
x
1
, ..., x
N
}
, BIC
del ´arbol relacionado a estas variables se calcular´ıa como sigue:
BIC
(
T, D
x
) =
logP
(
D
x
|
θ
ML
, T
)
1
2
dim(
T
)
logN
(9)
Siendo
θ
ML
el conjunto de par´ametros estimados por m´axima verosimilitud y dim(T) la
dimensi´on del modelo. El primer t´ermino del BIC eval´ua la calidad de ajuste del modelo a los
datos y el segundo t´ermino penaliza el indicador en funci´on de la dimensi´on del modelo. En
los LTM, al incluir variables latentes, la dimensi´on no puede ser calculada simplemente como
el n´umero de par´ametros libres. En su lugar, se calcula una dimensi´on “efectiva” como el
rango de la matriz jacobiana que mapea los par´ametros del modelo a la distribuci´on conjunta
de las variables observables.
42