Página 27 - ANAlitica8

Versión de HTML Básico

Estimación espectral de datos ambientales no equiespaciados vía el periodograma...
Analíti a
k
8
Revista de Análisis Estadístico
Journal of Statistical Analysis
ANEXO A
A Estimación del espectro vía RED-
FIT
REDFIT viene acompañado de un excelente manual
de nombre USAGE.PDF (véase /doc/ en redfit.zip,
http:
//www.ncdc.noaa.gov/paleo/softlib/redfit/redfit.
html
), con instrucciones para instalación y uso, pero en
lengua inglesa [41]. Por esta razón, se proporciona a con-
tinuación una breve descripción de cómo utilizarlo. El ar-
chivo de entrada lleva de nombre N1000.CFG (no es reco-
mendable cambiarle de nombre debido a que REDFIT no
funcionará). Su estructura básica es la siguiente:
&cfg
fnin = ’nombre del archivo de entrada’,
fnout = ’nombre del archivo de salida’,
nsim = ,
mctest = ,
ofac = ,
n50 = ,
iwin =
/
!iwin =
!
0: Rectangular
!
1: Welch
!
2: Hanning
!
3: Triangular
!
4: Blackman-Harris
Los primeros dos parámetros,
fnin
,
fnout
, contienen
los nombres de los archivos de entrada (que incluyen la
serie temporal que se va a estudiar, la cual debería estar
en texto plano, delimitados por espacios o por
tabs
y con-
tener a la vez un sólo tiempo y dato por línea. Para mayor
información véase sección 2.2 del manual USAGE.PDF de
REDFIT [41]) y de salida (acepta cualquier nombre), res-
pectivamente. Es importante que ambos archivos están
entre comillas simples ’ ’. Del siguiente par de parámetros,
nsim
y
mctest
, el primero se refiere al número de simu-
laciones de Monte-Carlo (se recomiendan al menos 1000
simulaciones); el segundo, se utiliza
T
para activar el test
de Monte-Carlo (use
F
, para desactivarlo), el cual estima
los niveles de significación estadística de los picos espec-
trales [41, 42]. El parámetro
ofac
controla el número de
frecuencias utilizadas en la estimación del periodograma
de Lomb-Scargle; por lo general, se usa un valor entre 2.0
y 4.0; sin embargo, tenga en cuenta que, a mayor valor,
mayor será el tiempo computacional en la estimación del
espectro; finalmente,
n50
indica el número de segmentos
WOSA y
iwin
determina el tipo de ventana (
taper
) [41].
Después de ejecutar REDFIT exitosamente (en caso con-
trario se genera un archivo de nombre
redfit.log
, que
muestra los errores y otras advertencias), se obtienen dos
tipos de salidas. La primera en pantalla contiene lo siguien-
te:
N =
t(1) =
t(N) =
<dt> =
Nout =
Required RAM =
***** tau ****\n
the dof
donde
N
es el número de elementos de la serie temporal
a estudio,
t(1)
y
t(N)
son el primer y último valor de los
tiempos de la serie,
<
dt
>
es la media aritmética de las
diferencias de los tiempos,
Required RAM
es la cantidad de
memoria RAM necesaria para estimar el espectro,
tau
es el
coeficiente de persistencia de la serie temporal bajo análi-
sis [22, 42], y finalmente,
the dof
(
the degree of freedom
) son
los grados de libertad del espectro estimado. Un espectro
crudo tiene 2 grados de libertad, pero uno suavizado tiene
un
dof
mayor que 2. Algunos autores sugieren que al sua-
vizar el espectro se obtengan mucho más que 2 grados de
libertad (por ejemplo, 6 u 8), con el objeto de eliminar posi-
bles falsos picos espectrales [23, 48]. Sin embargo, hay que
tener cuidado, porque un espectro demasiado suavizado
podría eliminar picos espectrales que pudieran representar
señales reales.
La segunda salida es un archivo en texto plano, cuyo nom-
bre viene dado por el parámetro
fnout
. Este fichero con-
tiene un encabezado de unas 50 líneas con comentarios (
#
indica comentario) referentes a los parámetros de confi-
guración, valores iniciales y el significado de las variables
(entre 10 y 14 columnas, lo cuál depende si se activa el test
de Monte-Carlo para determinar la significación estadísti-
ca de los picos espectrales). Entre estas variables, destacan
las frecuencias en las que se calculan el PLS (columna 1),
el espectro corregido (columna 3) y suavizado (en caso de
haber definido un
n50
mayor que uno o aplicado alguna
ventana de suavizado), el espectro teórico de un proceso
AR1 con un nivel de significación del 0.95 (columna 9) y el
nivel de significación de 0.95 usando Monte-Carlo (colum-
na 13) –en caso de que se haya activado
mctest = T
–.
Antes de utilizar REDFIT, es recomendable tener en cuenta
varias pautas. La primera se refiere al número de elementos
de la serie temporal que se va a estudiar,
N
; en principio,
no existe límite en el número de elementos; éste viene da-
do, más bien, por la memoria del ordenador utilizado. La
segunda pauta –y es muy importante tenerla en cuenta–
es que los tiempos de muestreo de la serie temporal que
se estudia deben de seguir una secuencia monótona estric-
tamente creciente (
i.e.
,
t
1
<
t
2
<
...
<
t
N
, donde
t
1
es el
Analítika,
Revista de análisis estadístico
, 4 (2014), Vol. 8(2): 7-23
21