Josué M. Polanco-Martínez
Analíti a
k
8
Revista de Análisis Estadístico
Journal of Statistical Analysis
1 Introducción
Hoy por hoy, el uso de la estadística en la investiga-
ción científica es una herramienta imprescindible en todas
las áreas de la ciencia e ingeniería, y las ciencias ambien-
tales (e.g., meteorología, climatología, hidrología, etc.), no
son una excepción. De hecho, una parte considerable del
tiempo que se dedica a investigación se invierte en cómo
enfrentar las particularidades (como la pérdida de datos, la
irregularidad temporal en el muestreo, la presencia de rui-
do, valores extremos, estacionalidad, no-estacionariedad,
etc.) que presentan los diferentes tipos de datos ambienta-
les (como los observacionales, los provenientes de medidas
instrumentales, de reconstrucciones paleoambientales, de
salidas de simulaciones numéricas, etc.), así como en ave-
riguar el tipo de técnicas estadísticas más adecuadas para
obtener información cuantitativa que nos permita ganar
conocimiento sobre un determinado fenómeno ambiental
que vayamos a estudiar [1, 23, 31, 47].
Entre las técnicas matemáticas más utilizadas para el análi-
sis de series temporales ambientales, destacan las técnicas
de análisis espectral mediante la transformada de Fourier.
Esta herramienta es sumamente útil para averiguar la po-
sible existencia de eventos periódicos o para indagar el
comportamiento de una serie que vayamos a estudiar en
el dominio de la frecuencia [9, 33, 51]. Existe una gran va-
riedad de métodos de análisis espectral, pero la mayoría
requiere que la serie esté equiespaciada temporalmente
[9, 48, 51], y este es un requisito que no siempre se cumple
con las series temporales ambientales. La forma clásica de
enfrentar el hecho de que la serie no es equiespaciada es
interpolar la serie original y convertirla en una serie tem-
poralmente equiespaciada, para que posteriormente se es-
time su espectro mediante algunas de las técnicas estándar
de análisis espectral. Sin embargo, la interpolación implica
un conocimiento previo del comportamiento de la variable
que se estudia, y suaviza los datos de tal modo que al calcu-
lar el espectro puede suprimir información espectral en las
altas frecuencias; en razón de que altera la estimación del
espectro, debería evitarse la interpolación [25, 42, 43, 48].
Otra solución consiste en utilizar métodos “no estándar”
de análisis espectral que puedan aplicarse directamente a
las series temporales ambientales, tales como el periodo-
grama de Lomb-Scargle [17, 28, 29, 38, 39, 42, 43], el método
CLEAN [14, 35], CLEANEST [5] o más recientemente, los
métodos de Mathias
et al.
[21] o Nava [25].
El periodograma de Lomb-Scargle (PLS), también cono-
cido como
Lomb-Scargle Fourier Transform
(LSFT), es una
técnica de análisis espectral que puede ser aplicada a series
temporales no equiespaciadas en el tiempo; forma parte de
los métodos de análisis espectral por mínimos cuadrados
(
Least-Squares Spectral Analysis
(LSSA) [17, 38, 39, 46]. El
origen del PLS, por lo general, está asociado a Lomb [17]
y Scargle [38]. Sin embargo, retornando un poco hacia el
pasado, en 1969, Barning [2] desarrolló una técnica similar
y, poco más tarde, en 1971, Vanicek [46] propuso la idea de
mínimos cuadrados para determinar el espectro.
Lomb [17] realizó una ampliación del trabajo de Barning
[2], de tal modo que estudió las propiedades estadísticas
del análisis de frecuencias por mínimos cuadrados para
series no equiespaciadas en el tiempo. Entre los resultados
estadísticos más importantes del trabajo de Lomb, están la
demostración de que las alturas de los picos del espectro
de un ruido Gaussiano tienen una distribución del tipo
χ
2
2
y la noción de que existe una correlación entre la altura
de este tipo de espectro para dos frecuencias cualesquiera
f
1
y
f
2
[17]. Un poco más recientemente, Scargle [38] de-
mostró que el espectro obtenido del ajuste de una función
armónica por mínimos cuadrados es equivalente al espec-
tro obtenido vía el periodograma. Scargle también realizó
un estudio muy detallado para estimar la significación es-
tadística de la detección de una señal.
El Periodograma de Lomb-Scargle se hizo ampliamente
conocido debido al trabajo de Press
et al.
[32], en parte
debido a que publicó una codificación computacional de
esta técnica. Originalmente, el PLS fue derivado para tra-
bajar con series temporales astronómicas [2, 17, 38, 39];
pero a finales de los noventa fue adaptado por Schulz
y Stattegger [43] en combinación con la técnica WOSA
(
Welch-Overlapped-Segment-Averaging
) [49], para trabajar
con series temporales ambientales (principalmente climá-
ticas). Schulz y Stattegger [43] proporcionaron los niveles
de significación estadística, tanto para el caso uni-variado
o auto-espectro (utilizaron el intervalo de confianza de los
métodos clásicos de análisis espectral [3, 43]) como para
el bi-variado o coherencia espectral
1
(utilizaron el algorit-
mo desarrollado por Scannell y Carter [37] para establecer
los niveles de significación estadística). Schulz y Stattegger
[43] también proporcionaron un paquete computacional
de nombre SPECTRUM para estimar el auto-espectro, el
espectro cruzado, la coherencia, la fase de la coherencia
así como análisis armónico. SPECTRUM es de uso gratui-
to y está disponible en
http://www.geo.uni-bremen.de/
geomod/staff/mschulz/#software1
.
Un poco más tarde, Schulz y Mudelsee [42] hicieron me-
joras al trabajo de Schulz y Stattegger [43], para tener en
cuenta el tipo de ruido de fondo (“rojo”) que se presenta
en las series ambientales en la determinación del auto-
espectro. Ellos también liberaron en internet un paquete
computacional de uso gratuito, de nombre REDFIT, dispo-
nible en
http://www.geo.uni-bremen.de/geomod/staff/
mschulz/#software2
; éste tiene en cuenta dichas mejoras;
es importante mencionar que REDFIT sólo aplica al caso
uni-variante, esto es, solo estima el auto-espectro suaviza-
do vía el periodograma de Lomb-Scargle.
Recientemente, Mudelsee
et al.
[24] presentaron algunas
1
Schulz y Stattegger no estimaron los intervalos de confianza para el espectro cruzado o “cross-spectrum”, esto debido a las dificultades que im-
plica calcularlos desde el punto de vista estadístico y debido a que la utilización de la espectro cruzado no es de uso práctico en el análisis de series
temporales [43].
8
Analítika,
Revista de análisis estadístico
, 4 (2014), Vol. 8(2): 7-23