Página 19 - ANAlitica8

Versión de HTML Básico

Estimación espectral de datos ambientales no equiespaciados vía el periodograma...
Analíti a
k
8
Revista de Análisis Estadístico
Journal of Statistical Analysis
[
ν
ˆ
G
xx
(
f
i
)
χ
2
ν
;
α
/2
G
xx
(
f
i
)
ν
ˆ
G
xx
(
f
i
)
χ
2
ν
;1
α
/2
]
.
(22)
Algunos autores [3, 30, 33] aplican una transformación
logarítmica del tipo 10
log
10
a la relación (22), esto con el
objeto de que los intervalos de confianza sean indepen-
dientes de la frecuencia y al graficar el ˆ
G
xx
se obtenga una
mejor visualización.
La mínima resolución de las frecuencias en ˆ
G
xx
,
i. e.
, el
ancho de banda espectral,
B
w
, se calcula como:
B
w
=
β
w
f
,
(23)
donde
β
w
es el ancho de banda normalizado y depende del
tipo de ventana (
taper
) utilizada; por ejemplo, para la ven-
tana de Hanning tiene un valor de 2 [12, 26, 43].
4 Contraste de hipótesis del periodo-
grama de Lomb-Scargle debido a
ruido rojo
Es bien sabido que muchos fenómenos ambientales
(climáticos, meteorológicos, etc.) o geofísicos presentan un
espectro de fondo rojo,
i.e.
, la intensidad o amplitud espec-
tral disminuye exponencialmente a medida que decrecen
sus frecuencias [10, 13, 42]. [13] propuso que un proce-
so estocástico autoregresivo de primer orden (AR1) es un
modelo adecuado para representar ese espectro de fondo
rojo, y que puede ser utilizado como una hipótesis nula
en un test de significación [23, 42]. Si
R
(
t
r
)
es un proceso
AR1, donde los tiempos de muestreo
t
r
(
r
=
1, 2, ...,
N
)
no están equiespaciados, la distribución del periodograma
de Lomb-Scargle para este proceso no puede ser calculada
analíticamente [23, 24, 42]. Por tanto, es necesario utilizar
métodos de simulación de Monte-Carlo para inferir las
propiedades estadísticas de la distribución del periodogra-
ma [24]. El sesgo en el espectro es debido a que las compo-
nentes individuales del periodograma de Lomb-Scargle no
son independientes unas de las otras [17, 38].
Schulz y Mudelsee [42] demostraron, por medio de simu-
laciones de Monte Carlo, que el periodograma de Lomb-
Scargle de un proceso AR1 no equiespaciado temporal-
mente sobrestima las amplitudes espectrales localizadas
en las altas frecuencias (
i. e.
, las frecuencias al final del es-
pectro). Ellos también desarrollaron un algoritmo compu-
tacional, conocido como REDFIT, para corregir ese sesgo.
De hecho, hasta donde se sabe, es el único algoritmo y
programa computacional existente que tiene en cuenta el
ruido rojo de fondo en la estimación del espectro suavi-
zado de series temporales ambientales no equiespaciadas,
vía el periodograma de Lomb-Scargle.
A continuación, se presentan los principales conceptos es-
tadísticos para luego proporcionar la descripción de RED-
FIT, siguiendo principalmente a Mudelsee [23] y Schulz
y Mudelsee [42]. Más detalles pueden consultarse en
[22, 23, 24, 42].
Un proceso discreto autoregresivo de orden 1 (AR1) y no
equiespaciado temporalmente está definido [24, 36, 42] por
la siguiente relación:
R
(
t
1
) =
E
N
(
0,1
)
,
para r=1
R
(
t
r
) =
ρ
r
R
(
t
r
1
) +
E
N
(
0,
σ
E
)
(
t
r
)
, para r=2, 3, . . . ,
N
ρ
r
=
exp
(
(
t
r
t
r
1
)
/
τ
m
)
,
(24)
donde
τ
m
es la escala temporal correspondiente al proceso
AR1 (una medida de su memoria o persistencia) y
E
es un
ruido Gaussiano de media cero y varianza
σ
2
E
=
1
exp
(
2
(
t
r
t
r
1
)
/
τ
m
)
.
(25)
El valor de
σ
2
E
asegura que el proceso AR1 sea estacionario
y tenga varianza unitaria [42].
El espectro teórico
2
G
rr
(
f
i
)
de un proceso AR1 (ecuación
24) está definido [30, 42] por
G
rr
(
f
i
) =
G
o
1
<
ρ
>
2
1
2
<
ρ
>
cos
(
π
f
i
/
<
f
Nyq
>
) +
<
ρ
>
2
,
(26)
para las frecuencias
f
i
,
j
=
1, 2, ...,
K
, desde la frecuencia
fundamental
f
(véase la relación (17)) hasta la frecuencia
promedio de Nyquist [42]. Allí,
G
o
es la amplitud espectral
promedio,
<
ρ
>
es el coeficiente de autocorrelación pro-
medio;
i. e.
,
<
ρ
>
=
exp
(
<
t
>
/
τ
m
)
, donde
<
t
>
es la media de los intervalos temporales del proceso AR1
[42] y el valor de
τ
m
se estima mediante el algoritmo y pro-
grama computacional de nombre TAUEST, propuesto por
Mudelsee [22].
Con el periodograma de Lomb-Scargle, la desviación sis-
temática entre un espectro teórico de ruido rojo (relación
26) y otro espectro estimado dependerá de los tiempos de
muestreo [17, 38]. Pero la carencia de una solución analíti-
ca para la desviación (sesgo) impide aplicar una corrección
directa al periodograma de Lomb-Scargle [42]. Para supe-
rar este obstáculo, se utilizan métodos de Monte-Carlo en
combinación con técnicas de
bootstrap
. Basada en los tiem-
pos de muestreo, se genera un
ensemble
de N series tem-
porales sintéticas AR1 (Ecuación (24)). La desviación del
espectro promedio del
ensemble
con respecto al espectro
teórico (Ecuación (26)) es utilizada para hacer la corrección
[24, 42].
A continuación, se describe el algoritmo REDFIT tal co-
mo es presentado por Schulz y Mudelsee [42].
2
Para el caso equiespaciado, el término coseno del espectro teórico de un AR1 está definido [16] por cos
(
2
π
f
i
t
)
, para
1
2
t
f
i
1
2
t
. Por esta
razón, el término coseno en la relación 26 al sustituir 2
<
t
>
por
1
<
F
Nyq
>
se expresa como cos
(
π
f
i
/
<
f
Nyq
>
)
.
Analítika,
Revista de análisis estadístico
, 4 (2014), Vol. 8(2): 7-23
13