Regresión lineal bajo diseños muestrales complejos: un enfoque aplicado
107
14
Analiti a, Revista de análisis estadístico, Vol. 14 (2), 2017
Tabla 1:
(continuaci´on)
A˜no Hito
1984 Se implementan las sugerencias de Godambe de 1977 tratando de
calibrar el dise˜no muestral de modo que
funcione
en ambas doctri-
nas (Sarndal, 1984).
1992 Se publica
Model Assited Survey Sampling
, aqu´ı la inferencia se
basa en el dise˜no pero la estrategia de muestreo se complementa con
un modelo para la estimaci´on del par´ametro de inter´es. (Sarndal,
1992).
Elaborada en base a (Gutierrez, 2009, p´ag. 415) y ampliada por los autores.
Una de las consecuencias inmediatas del no reconocimiento de las diferencias entre ambas
doctrinas, es que se puede renunciar al uso de los datos de una encuesta debido a la falta
de, por ejemplo, su dise˜no muestral espec´ıfico o su factor de expansi´on. Es decir, contar con
´estos elementos (dise˜no y factor de expansi´on) nos permite hacer IBDI e IBMO. Pero si no
se precisa de esta informaci´on, a´un se puede usar esa encuesta bajo el s´olido fundamento de
la IBMO. Adem´as, la confusi´on entre ambos paradigmas puede resultar en inferencias sin
validez alguna (Gregoire, 1998).
Se establece a continuaci´on generalidades notacionales de teor´ıa de muestreo cuando se
tiene una poblaci´on finita. Sea
U
=
{
u
1
, . . . , u
k
, . . . , u
N
}
una poblaci´on finita de
N
elementos
con etiquetas
k
= 1
. . . , N
.
Y
es la
variable de estudio
-cualitativa o cuantitativa- y
Y
k
denota
el valor del
k
-´esimo elemento de la poblaci´on
U
. Tambi´en se suele contar con un vector de
informaci´on auxiliar
X
k
de dimensi´on
p
×
1. As´ı, el objetivo es la estimaci´on de una funci´on
g
(
T
y
), donde los casos m´as usados son,
T
y
=
k
∈U
Y
k
para el total,
g
(
T
y
) =
T
y
/N
para la
media y
g
(
T
y
) =
T
y
/T
x
=
R
para la raz´on. Sea Ω el conjunto de todas las muestras posibles y
sea
p
(
·
) una funci´on tal que
p
(
s
) devuelve la probabilidad de seleccionar cualquier muestra
s
de la variable aleatoria
S
(la funci´on
p
(
·
), tambi´en conocida como
dise˜no muestral
, determina
la distribuci´on de probabilidad de
S
). Sea
I
k
una variable aleatoria de inclusi´on muestral
(
I
k
= 1 si se selecciona el
k
-´esimo elemento o
I
k
= 0 en caso contrario). La probabilidad de
que un elemento
k
sea incluido en la muestra bajo un dise˜no
p
(
·
) es:
π
k
=
P rob
(
I
k
= 1) =
S
∈
Ω
I
k
p
(
s
) =
S
∈
Ω
k
p
(
s
)
(1)
donde
S
∈
Ω
k
denota que la suma es sobre todas las muestras
s
que contienen un
k
dado. Finalmente,
ν
=
k
∈U
I
k
denota el n´umero de elementos distintos en una muestra de
tama˜no
n
4
.
4
Para m´as detalle y ejemplos v´ease (Sarndal, 1992, p´ags. 27-48) y (Gregoire, 1998).