Página 28 - ANAlitica3

Versión de HTML Básico

Rodrigo Cajamarca y Hermann Mena
Analíti a
k
3
Revista de Análisis Estadístico
Journal of Statistical Analysis
2.3 Mínimos cuadrados recursivo (MCR)
El método de mínimos cuadrados recursivo es, como
su nombre lo indica, una versión recursiva del método de
mínimos cuadrados por lotes. Este método utiliza en cada
iteración una parte del conjunto de entrenamiento y no re-
quiere el cálculo de la inversa de
Φ
Φ
; de esta manera su
desempeño es más eficiente que el MCL. El algoritmo cal-
cula ˆ
θ
(
k
)
mediante ˆ
θ
(
k
1
)
,
x
k
, y
y
k
; donde
k
representa un
ciclo sobre el conjunto de entrenamiento
G
, la iteración se
repite
K
veces; para más detalles ver [11].
Al igual que para el MCL, se utiliza la función de per-
tenencia Gaussiana para las entradas y una función Delta
para las salidas. Los parámetros
b
l
,
c
l
j
y
σ
l
j
>
0 se definen
como en el método anterior.
Sea
P
(
k
)
la matriz
n
×
n
definida como
P
(
k
) =
Φ
Φ
1
=
k
i
=
1
x
i
(
x
i
)
!
1
,
(8)
se obtiene
P
(
k
) =
P
(
k
1
)
P
(
k
1
)
x
k
(
I
+ (
x
k
)
P
(
k
1
)
x
k
)
1
(
x
k
)
P
(
k
1
)
,
(9)
y
ˆ
θ
(
k
) =
ˆ
θ
(
k
1
) +
P
(
k
)
x
k
(
y
k
(
x
k
)
ˆ
θ
(
k
1
))
.
(10)
Si se aplica el lema de la matriz inversa, se evita la in-
versión de una matriz; y, en su lugar, únicamente se calcula
el inverso del escalar
(
I
+ (
x
k
)
P
(
k
1
)
x
k
)
1
. Las ecuacio-
nes (9) y (10) caracterizan
P
(
k
)
y ˆ
θ
(
k
)
y permiten describir
el método de mínimos cuadrados recursivo.
Para inicializar el algoritmo, se emplean generalmente
ˆ
θ
(
0
) =
0 y
P
(
0
) =
P
0
=
α
I
para algún
α
>
0. Otra opción
es utilizar una aproximación heurística.
Además se puede usar el método de mínimos cuadra-
dos recursivo ponderado. En este caso se utiliza un factor
0
<
λ
1 que se conoce como un “factor de pérdida de
memoria” y sirve para dar mayor peso a la información
mas reciente. Si
λ
=
1 se obtiene el método MCR original.
En el método de mínimos cuadrados recursivo
P
(
k
)
se de-
fine como:
P
(
k
) =
1
λ
(
I
P
(
k
1
)
x
k
(
λ
I
+ (
x
k
)
P
(
k
1
)
x
k
)
1
(
x
k
)
)
P
(
k
1
)
ˆ
θ
(
k
) =
ˆ
θ
(
k
1
) +
P
(
k
)
x
k
(
y
k
(
x
k
)
ˆ
θ
(
k
1
))
(11)
Si en el sistema difuso (3), se reemplaza
x
k
con
ξ
(
x
k
)
en
(11) se obtiene
P
(
k
) =
1
λ
n
I
P
(
k
1
)
ξ
(
x
k
)
h
λ
I
+ (
ξ
(
x
k
))
P
(
k
1
)
ξ
(
x
k
)
i
1
(
ξ
(
x
k
))
o
P
(
k
1
)
ˆ
θ
(
k
) =
ˆ
θ
(
k
1
) +
P
(
k
)
ξ
(
x
k
)
h
y
k
(
ξ
(
x
k
))
ˆ
θ
(
k
1
)
i
Al igual que en la sección anterior, se generalizó este
método para el caso de entrada-salida múltiple; ver Algo-
ritmo 2.
2.4 Aprendizaje desde el ejemplo modificado
(AEM)
Este método tiene un enfoque muy intuitivo para la
construcción de un sistema difuso el cual se basa en téc-
nicas de optimización para determinar los parámetros del
sistema. En el AEM se generan automáticamente reglas y
funciones de pertenencia; por esta razón, este método es
una alternativa viable a problemas en los cuales se carece
de información
a priori
del sistema. De manera análoga a
la sección anterior, se consideran funciones de pertenencia
Gaussiana y Delta; el método se describe de la siguiente
manera:
1. Construcción de un sistema difuso inicial
: dados el par
de datos de entrada y salida
(
x
i
,
y
j
)
G
,
i
=
1, . . . ,
M
,
se forma un sistema difuso inicial con
(
x
1
,
y
1
)
y se ini-
cializa el número de reglas
R
=
1
f
(
x
i
|
θ
) =
b
1
(12)
para
c
1
j
=
x
1
j
,
σ
1
j
=
σ
0
(parámetros de las funciones de
pertenencia de las variables de entrada) y
b
1
=
y
1
(pa-
rámetro de la función de pertenencia de la variable de
salida), para todo
j
=
1, . . . ,
n
.
2. Evaluación de los datos de entrenamiento
: se utiliza un
factor de tolerancia
ε
f
que determina el error. Para cada
(
x
i
,
y
j
)
G
se evalúa:
si
|
f
(
x
i
|
θ
)
y
i
| ≤
ε
f
, entonces el sistema difuso
f
representa correctamente
(
x
i
,
y
i
)
, y por lo tanto, no
es necesario añadir ninguna regla. Se repite este pa-
so, con el siguiente par de datos de entrenamiento.
si
|
f
(
x
i
|
θ
)
y
i
|
>
ε
f
, entonces se añade una regla
para representar
(
x
i
,
y
i
)
modificando los parámetros
de las funciones de pertenencia; continuar al Paso 3
3. Codificación de parámetros del sistema difuso
: si no se
cumple la condición del Paso 2, se añade una nueva re-
gla
R
=
R
+
1,
b
R
=
y
i
y
c
i
j
=
x
i
j
, para todo
j
=
1, . . . ,
n
.
La modificación de los
σ
i
j
para
i
=
R
se realiza utili-
zando los centros de las funciones de pertenencia de la
forma;
n
j
=
arg
m´ın
{|
c
i
j
c
i
j
|
:
i
=
1, 2, . . . ,
R
,
i
6
=
i
}
,
26
Analítika,
Revista de análisis estadístico
, 2 (2012), Vol. 3(1): 23-42