Estudio de la desigualdad de ingresos en el Ecuador considerando esfuerzos. . .
Analíti a
k
1
Revista de Análisis Estadístico
Journal of Statistical Analysis
sonas, así como uno de los indicadores para medir la desi-
gualdad de los ingresos.
2.1 Modelos lineales
Un modelo lineal múltiple, en general, relaciona la
variable dependiente
Y
con
K
variables explicativas
X
k
(k=0,...,K) o cualquier transformación de éstas. Algebraica-
mente puede representarse de la siguiente manera:
Y
=
β
0
+
K
∑
k
=
1
β
k
X
k
+
ǫ
,
(1)
donde
ǫ
es una variable aleatoria normalmente distribuida
que sigue una ley normal
N
(
0,
σ
2
)
. Además, se asume, es-
ta variable recoge todos aquellos factores de la realidad no
controlables u observables.
Un modelo de
Regresión Lineal Múltiple
con K variables
predictoras y basado en
n
observaciones es de la forma:
Y
i
=
β
0
+
β
1
X
i
1
+
β
2
X
i
2
+
....
+
β
k
X
ik
+
ǫ
i
(2)
para
i
=
1, 2,
· · ·
,
n
.
Generalmente para la estimación de los paramétros
β
k
se utiliza la técnica de Mínimos de Cuadrados Ordinarios
[11] y los estimadores de máxima verosimilitud.
2.2 Definiciones
D
EFINICIÓN
1
(Correlación)
.
Es la medida de la intensidad de
la relación lineal entre dos variables. El coeficiente de correlación,
r, entre dos variables aleatorias X e Y se calcula de la siguiente
manera,
r
=
σ
XY
σ
X
·
σ
Y
,
donde
σ
XY
es la covarianza de
(
X
,
Y
)
y
σ
X
y
σ
Y
las desviaciones
típicas.
Observación:
El coeficiente de correlación puede tomar
valores desde menos uno hasta uno, indicando que mien-
tras más cercano a uno sea el valor del coeficiente de corre-
lación, en cualquier dirección, más fuerte será la relación
lineal entre las dos variables. Mientras más cercano a cero
sea el coeficiente de correlación indicará que más débil es
la relación lineal entre ambas variables. Si es igual a cero se
concluirá que no existe relación lineal alguna entre ambas
variables.
D
EFINICIÓN
2
(Endogeneidad)
.
Es la correlación entre las va-
riables explicativas y el término de error en un modelo lineal ge-
neral. Para determinar si existe endogeneidad en el modelo, se
considera, E
(
ε
i
|
x
i
) =
0
, para todo i
=
1, . . . ,
n. Entonces la
variable x se denomina exógena; pero si
ε
y x están correlaciona-
das, entonces x se denomina variable endógena.
Observaciones:
i.
Cuando el modelo lineal general presenta endogenei-
dad, el estimador de mínimos cuadrados ordinarios es
inconsistente [5]. Para evitar este tipo de problemas se
asume que los regresores son exógenos, es decir, son
independientes.
ii.
Los economistas usan modelos para entender qué es-
tá sucediendo en la economía. Dentro de los modelos,
se destacan dos elementos importantes: las variables
endógenas, que son aquellas que intentan explicar el
modelo y, las variables exógenas que el modelo toma
como dadas.
D
EFINICIÓN
3
(Coeficiente de Determinación)
.
El coeficien-
te de determinación, R
2
es el cuadrado del coeficiente de corre-
lación r, donde
0
≤
R
2
≤
1
y, puede interpretarse como el
porcentaje de la variación total que está siendo explicada por la
regresión.
Observaciones:
i.
Una regresión será
buena
si la variabilidad explicada
por la regresión es relativamente alta con respecto a la
variablidad total de la variable dependiente, es decir,
si
SEC
≈
STC
. En otras palabras, que
R
2
→
1.
ii.
El coeficiente de determinación es un buen indicador
de la
calidad
de la regresión, pero no es determinante ni
suficiente para decidir sobre la adecuación del mode-
lo, por eso es necesario tomar en cuenta el análisis de
la varianza, donde a través del estadístico de Fisher, se
puede decidir si existe relación lineal significativa en-
tre la variable dependiente y el conjunto de variables
independientes tomadas juntas [11].
2.2.1 Prueba de hipótesis
Una vez determinada la calidad del modelo, es decir,
la relación existente entre la variable dependiente y las va-
riables independientes, es importante también analizar la
calidad de cada uno de los estimadores de MCO. Para esto
es necesario probar la hipótesis:
H
0
:
β
i
=
0
H
1
:
β
i
6
=
0,
donde
i
es el número de estimadores de MCO.
Generalmente se considera un nivel de confianza del
95 % (nivel de significancia del 5 %) para validar los esti-
madores, y por lo tanto se rechazará la hipótesis nula
(
H
0
)
cuando la significancia sea menor a 0,05.
2.3 Regresión logística
Los modelos de regresión logística son los más utili-
zados cuando la variable independiente,
Y
, es cualitativa,
pues adoptan las herramientas de la regresión convencio-
nal, para relacionar esta variable con variables explicativas
Analítika,
Revista de análisis estadístico
, 1 (2011), Vol. 1(1): 59-90
61