Página 15 - ANAlitica8

Versión de HTML Básico

Estimación espectral de datos ambientales no equiespaciados vía el periodograma...
Analíti a
k
8
Revista de Análisis Estadístico
Journal of Statistical Analysis
adaptaciones a REDFIT, introduciendo el error de las da-
taciones de muestras paleoclimáticas en la estimación del
espectro. Sin embargo, estas mejoras sólo aplican a series
temporales ambientales cuyos tiempos de muestreo con-
tienen errores considerables que podrían afectar la estima-
ción del espectro. Un año después, Mudelsee [23] (capítu-
lo 5) proporcionó, entre otras temáticas relacionadas con
el análisis de series temporales ambientales, una amplia
revisión de los principales conceptos teóricos y diversos
algoritmos para la estimación espectral de series tempora-
les ambientales no equiespaciadas vía el periodograma de
Lomb-Scargle.
Por otro lado, un poco más recientemente, Pardo-
Iguzquiza y Rodríguez-Tovar [28, 29] introdujeron una
nueva forma de estimar la significación estadística de los
picos espectrales obtenidos mediante el periodograma sua-
vizado de Lomb-Scargle. Esta novel implementación con-
siste en el uso de un test de permutación para evaluar la
significación estadística de los picos estimados mediante
el PLS, tanto para el caso uni-variante como para el bi-
variante [27, 28, 29]. Pardo-Iguzquiza y Rodríguez-Tovar
[29] también liberaron un par de programas (SLOMBS y
CSLOMBS) de dominio público para llevar a cabo estas
tareas. Sin embargo, a pesar de la importancia, tanto des-
de el punto de vista metodológico como computacional,
es importante tener en consideración que un test de per-
mutación implica un ruido de fondo “blanco” (plano). Sin
embargo, la amplitud espectral, en la mayoría de las series
ambientales, disminuye exponencialmente a medida que
decrecen sus frecuencias; esto implica mas bien un ruido
de fondo de tipo “rojo” [10, 13, 20, 42].
Debido a la necesidad de estimar el espectro en diferen-
tes tipos de series temporales ambientales no equiespa-
ciadas temporalmente –que provienen de diversas áreas
de la ciencia y la ingeniería– es necesario contar con in-
formación oportuna sobre esta temática. En lo que respec-
ta a información en lengua inglesa exista una gran can-
tidad de publicaciones al respecto (véase, por ejemplo,
[23, 24, 28, 29, 42, 43]). Sin embargo, no sucede lo mismo
en idioma español, con excepciones como las de Pardo-
Iguzquiza y Rodríguez-Tovar [27] y Polanco-Martínez [31].
La carencia de esta información en lenguaje español ha si-
do una de las principales motivaciones para la escritura de
este artículo.
Este artículo de revisión tiene como principal objetivo pro-
porcionar los principales aspectos matemáticos y compu-
tacionales en la estimación espectral (auto-espectro) vía el
periodograma suavizado de Lomb-Scargle, pero teniendo
en consideración el tipo de ruido de fondo de las series
temporales ambientales. El artículo se estructura de la si-
guiente manera: en la sección 1, se proporciona una breve
introducción del análisis espectral, se justifica el porque la
interpolación debería evitarse y se presenta el “estado del
arte” de esta metodología. En la sección 2 se presentan las
principales bases matemáticas del periodograma de Lomb-
Scargle. La sección 3 discute sobre las diferencias entre el
periodograma crudo versus el suavizado. En la sección 4
se introduce el test de significación estadística utilizado
cuando se estima el espectro mediante el PLS. La sección
5 presenta un par de ejemplos de la estimación del espec-
tro vía el PLS haciendo uso del paquete computacional
REDFIT. Por último, en la sección 6, se proporcionan las
conclusiones. Adicionalmente, en este trabajo se presenta
un par de anexos; el anexo A contiene los detalles técnicos
para el uso del programa computacional REDFIT [41]; el
anexo B, finalmente, presenta un programa en lenguaje R
[34] para graficar las salidas de REDFIT.
2 Consideraciones matemáticas del
periodograma de Lomb-Scargle
En esta sección, se presentan los principales aspectos
teóricos del periodograma de Lomb-Scargle: la definición,
las principales diferencias entre el periodograma clásico y
el de Lomb-Scargle, la definición de frecuencia de Nyquist
promedio, así como las frecuencias donde se estima el pe-
riodograma de Lomb-Scargle. Para mantener una nomen-
clatura adecuada y consistente, en este artículo se sigue
principalmente la nomenclatura de Horne y Baliunas [15],
Lomb [17], Press
et. al.
[32], Scargle [38] y Van-Donget
et. al.
[45].
2.1 Definición del periodograma de Lomb-
Scargle
Para una serie temporal
X
(
t
n
)
, donde
n
=
1, 2, ...,
N
(número de elementos de la serie temporal) con media cero
y varianza
σ
2
(
i. e.
, estacionaria de segundo orden) y sin la
presencia de tendencia y de valores extremos, el periodo-
grama de Lomb-Scargle (normalización de Lomb) se define
[15, 17, 32] como:
P
(
ω
i
=
2
π
f
i
) =
b
S
τ
(
ω
i
)
2
σ
2
=
1
2
σ
2
[
XC
2
τ
(
ω
i
)
CC
τ
(
ω
i
)
+
XS
2
τ
(
ω
i
)
SS
τ
(
ω
i
)
]
donde
ω
i
es la frecuencia angular y
f
i
>
0,
i
=
1, 2, ...
k
,
forman el conjunto de frecuencias en las que se desea cal-
cular el periodograma. Cada término de la relación (1) está
definido por
XC
τ
(
ω
i
) =
N
n
=
1
X
(
t
n
)
cos
[
ω
i
(
t
n
τ
(
ω
i
))]
(2)
CC
τ
(
ω
i
) =
N
n
=
1
cos
2
[
ω
i
(
t
n
τ
(
ω
i
))]
(3)
XS
τ
(
ω
i
) =
N
n
=
1
X
(
t
n
)
sen
[
ω
i
(
t
n
τ
(
ω
i
))]
(4)
SS
τ
(
ω
i
) =
N
n
=
1
sen
2
[
ω
i
(
t
n
τ
(
ω
i
))]
(5)
donde
τ
, la constante que asegura la invariancia en el tiem-
po [38], está definida por
Analítika,
Revista de análisis estadístico
, 4 (2014), Vol. 8(2): 7-23
9
,
(1)