Página 122 - ANALITIK-11

Versión de HTML Básico

Jaime Fernández
Analítika, Revista de análisis estadístico, (2016), Vol. 11
118
Utilizando el ejemplo planteado, se puede introducir la siguiente propiedad de las redes
bayesianas: la probabilidad de que la variable asociada a un nodo se encuentre en un estado
dado depende ´unicamente del estado de las variables que se encuentran en sus nodos padres.
Otra propiedad que se puede ilustrar en este ejemplo es la de independencia condicional.
As´ı, por ejemplo,
C
y
B
son condicionalmente independientes dada
F
, es decir,
P
(
b, c
|
f
) =
P
(
b
|
f
)
P
(
c
|
f
). La intuici´on de esta afirmaci´on ser´ıa que la probabilidad de tener c´ancer de
pulm´on (
C
) no se ve afectada por el hecho de tener o no bronquitis (
B
), dado que se conoce
si el paciente tiene o no el h´abito de fumar (
F
), y viceversa.
En la redes bayesianas y, en general, en los modelos gr´aficos es deseable tener grafos
dispersos, es decir, grafos en donde la mayor parte de los nodos no tengan una relaci´on
directa de dependencia probabil´ıstica, lo cual implica que no existan “demasiadas” aristas;
los algoritmos, de soluci´on exacta en unos casos y aproximada en otros, funcionan mejor y
los tiempos de c´alculo son eficientes cuando ´esto sucede.
Volviendo al ejemplo, se define la siguiente notaci´on:
y
=
a, f, t, c, b, e, x, d
, es decir,
y
representa una combinaci´on posible de s´ıntomas, resultados de ex´amenes y enfermedades.
As´ı, utilizando las propiedades de independencia condicional y el teorema de factorizaci´on
de probabilidades, se tiene:
P
(
y
) =
P
(
a
)
P
(
f
)
P
(
t
|
a
)
P
(
c
|
f
)
P
(
b
|
f
)
P
(
e
|
t, c
)
P
(
d
|
b, e
)
P
(
x
|
e
)
(1)
De manera general, en una red bayesiana formada por
N
variables:
x
1
, x
2
, ..., x
N
, la
funci´on de probabilidad conjunta se puede escribir:
P
(
x
1
, x
2
, ..., x
N
) =
N
i
=1
P
(
x
i
|
pa
(
x
i
))
(2)
donde
pa
(
x
i
) se refiere a los estados de las variables que se encuentran en los nodos padre
del nodo
i
:
Una vez estructuradas las redes, el objetivo principal ser´a calcular las distribuciones
marginales de algunas variables, a lo cual se conocer´a como “inferencia” en este sentido.
Estas probabildades marginales para un nodo dado, en el caso de que todas las variables de
la red tengan un n´umero finito de estados, se calculan como la suma sobre todos los dem´as
estados de las otras variables de la red.
En la red del ejemplo, una probabilidad marginal deseada ser´ıa la de tener cierta en-
fermedad, sup´ongase bronquitis. En este caso, la expresi´on para la distribuci´on marginal
ser´ıa:
P
(
b
) =
a f t
c e x d
P
(
a, f, t, c, b, e, x, d
)
(3)
En el sentido tradicional del c´alculo de las probabilidades marginales, esta sumatoria
puede involucrar una cantidad demasiado grande de operaciones, sin embargo, al aprovechar
11