Página 28 - ANAlitica3

Versión de HTML Básico

Pulse aquí para ver la versión completa.

Tabla de Contenidos

Página 27

Página 29

Rodrigo Cajamarca y Hermann Mena

Analíti a

Revista de Análisis Estadístico

Journal of Statistical Analysis

2.3 Mínimos cuadrados recursivo (MCR)

El método de mínimos cuadrados recursivo es, como

su nombre lo indica, una versión recursiva del método de

mínimos cuadrados por lotes. Este método utiliza en cada

iteración una parte del conjunto de entrenamiento y no re-

quiere el cálculo de la inversa de

⊤

; de esta manera su

desempeño es más eficiente que el MCL. El algoritmo cal-

cula ˆ

(

)

mediante ˆ

(

−

)

, y

; donde

representa un

ciclo sobre el conjunto de entrenamiento

, la iteración se

repite

veces; para más detalles ver [11].

Al igual que para el MCL, se utiliza la función de per-

tenencia Gaussiana para las entradas y una función Delta

para las salidas. Los parámetros

0 se definen

como en el método anterior.

Sea

(

)

la matriz

definida como

(

) =

⊤

−

∑

(

)

⊤

−

(8)

se obtiene

(

) =

(

−

)

−

(

−

)

(

+ (

)

⊤

(

−

)

−

(

)

⊤

(

−

)

(9)

(

) =

(

−

) +

(

)

(

−

(

)

⊤

(

−

))

(10)

Si se aplica el lema de la matriz inversa, se evita la in-

versión de una matriz; y, en su lugar, únicamente se calcula

el inverso del escalar

(

+ (

)

⊤

(

−

)

−

. Las ecuacio-

nes (9) y (10) caracterizan

(

)

y ˆ

(

)

y permiten describir

el método de mínimos cuadrados recursivo.

Para inicializar el algoritmo, se emplean generalmente

(

) =

0 y

(

) =

para algún

0. Otra opción

es utilizar una aproximación heurística.

Además se puede usar el método de mínimos cuadra-

dos recursivo ponderado. En este caso se utiliza un factor

≤

1 que se conoce como un “factor de pérdida de

memoria” y sirve para dar mayor peso a la información

mas reciente. Si

1 se obtiene el método MCR original.

En el método de mínimos cuadrados recursivo

(

)

se de-

fine como:

(

) =

(

−

(

−

)

(

+ (

)

⊤

(

−

)

−

(

)

⊤

)

(

−

)

(

) =

(

−

) +

(

)

(

−

(

)

⊤

(

−

))

(11)

Si en el sistema difuso (3), se reemplaza

con

(

)

(11) se obtiene

(

) =

−

(

−

)

(

)

+ (

(

))

⊤

(

−

)

(

)

−

(

))

⊤

(

−

)

(

) =

(

−

) +

(

)

(

)

−

(

))

⊤

(

−

)

Al igual que en la sección anterior, se generalizó este

método para el caso de entrada-salida múltiple; ver Algo-

ritmo 2.

2.4 Aprendizaje desde el ejemplo modificado

(AEM)

Este método tiene un enfoque muy intuitivo para la

construcción de un sistema difuso el cual se basa en téc-

nicas de optimización para determinar los parámetros del

sistema. En el AEM se generan automáticamente reglas y

funciones de pertenencia; por esta razón, este método es

una alternativa viable a problemas en los cuales se carece

de información

a priori

del sistema. De manera análoga a

la sección anterior, se consideran funciones de pertenencia

Gaussiana y Delta; el método se describe de la siguiente

manera:

1. Construcción de un sistema difuso inicial

: dados el par

de datos de entrada y salida

(

)

∈

1, . . . ,

se forma un sistema difuso inicial con

(

)

y se ini-

cializa el número de reglas

(

) =

(12)

para

(parámetros de las funciones de

pertenencia de las variables de entrada) y

(pa-

rámetro de la función de pertenencia de la variable de

salida), para todo

1, . . . ,

2. Evaluación de los datos de entrenamiento

: se utiliza un

factor de tolerancia

que determina el error. Para cada

(

)

∈

se evalúa:

•

(

)

−

| ≤

, entonces el sistema difuso

representa correctamente

(

)

, y por lo tanto, no

es necesario añadir ninguna regla. Se repite este pa-

so, con el siguiente par de datos de entrenamiento.

•

(

)

−

, entonces se añade una regla

para representar

(

)

modificando los parámetros

de las funciones de pertenencia; continuar al Paso 3

3. Codificación de parámetros del sistema difuso

: si no se

cumple la condición del Paso 2, se añade una nueva re-

gla

, para todo

1, . . . ,

La modificación de los

para

se realiza utili-

zando los centros de las funciones de pertenencia de la

forma;

∗

arg

m´ın

′

−

′

1, 2, . . . ,

′

}

Analítika,

Revista de análisis estadístico

, 2 (2012), Vol. 3(1): 23-42