Regresión lineal bajo diseños muestrales complejos: un enfoque aplicado
109
14
Analiti a, Revista de análisis estadístico, Vol. 14 (2), 2017
inferencia es
exclusivamente
de la poblaci´on en s´ı misma, ya sea que el par´ametro de inter´es
sea el total, la media, la raz´on o los coeficientes de una regresi´on. En resumen,
•
Se prescinde de la idea de que la poblaci´on ha sido aleatorizada, los
y
k
se consideran
fijos y asociados a un elemento de la poblaci´on finita
U
.
•
El dise˜no
p
(
·
) y un estimador espec´ıfico
T
generan una distribuci´on de estimaciones
llamada distribuci´on de referencia.
•
La distribuci´on de referencia induce las propiedades estad´ısticas de los esimadores.
•
La inferencia se hace sobre el
ahora
, sobre el estado actual de la poblaci´on
U
.
2.2 Inferencia basada en el modelo
As´ı como a una muestra se la puede considerar como una
subpoblaci´on
de
U
, tambi´en existe
el concepto de
superpoblaci´on
. En la IBMO la poblaci´on es considerada como una realizaci´on
de un proceso aleatorio, un modelo
ξ
o
superpoblaci´on
. Es decir, los valores
y
1
, . . . , y
N
son
realizaciones de las variables aleatorias
Y
1
, . . . , Y
N
(Gregoire, 1998) donde ´estas constituyen
la superpoblaci´on.
Sea ˆ
θ
s
un estimador de
θ
y
ξ
el modelo asumido. En esta configuraci´on la inferencia puede
ser con respecto a un par´ametro de la poblaci´on (
g
(
T
y
)) o de la superpoblaci´on (
θ
), tal que
E
ξ
[( ˆ
θ
s
−
θ
)
2
|
s
]
(5)
sea lo m´as peque˜no posible. Es decir, se buscar minimizar el error cuadr´atico medio dado la
muestra
s
.
Observaci´on
1
.
S¨arndall propone un criterio
intermedio
a (5) de la forma
E
ξ
E
p
(
s
)
[( ˆ
θ
s
−
θ
)
2
].
Este criterio tomar´ıa en cuenta tanto el dise˜no
p
(
s
) como el modelo asumido
ξ
de modo que la
inferencia sea circunscrita exclusivamente a la poblaci´on finita
U
(Sarndal, 1992, p´ag.516). Sin
embargo, (Gregoire, 1998, obs.4) aclara que esta distinci´on se desvanece, pues uno esperar´ıa
que asumiendo un modelo
ξ
apropiado y el tama˜no de la muestra es suficientemente grande,
la media y la varianza ser´ıan cercanas al de la poblaci´on o la superpoblaci´on seg´un sea el
caso.
Note que en (5) la selecci´on de
s
es crucial. El dise˜no muestral no juega ning´un papel en
la inferencia cuando la distribuci´on de referencia es establecida por el modelo asumido. Sin
embargo, si el modelo falla es preferible el criterio de la observaci´on 1.
Ejemplo
1
.
Considere el modelo de regresi´on a trav´es del origen
5
Y
k
=
βX
k
+
σ
k
X
k
,
k
∼ N
(0
,
1)
, cov
(
k
,
k
) = 0
5
Ejemplo tomado de (Gregoire, 1998)