Yannira Chávez y Paúl Medina
Analíti a
k
1
Revista de Análisis Estadístico
Journal of Statistical Analysis
D
EFINICIÓN
7
(La R cuadrado de Nagelkerke)
.
Es una ver-
sión corregida de la R cuadrado de Cox y Snell. La R cuadrado de
Cox y Snell tiene un valor máximo inferior a 1, incluso para un
modelo “perfecto”. La R cuadrado de Nagelkerke corrige la escala
del estadístico para cubrir el rango completo de 0 a 1.
Después de tener claro los conceptos, se procede a ex-
plicar los resultados presentados en la tabla 12, Paso, Blo-
que y Modelo.
•
La primera fila (PASO) es la correspondiente al cambio
de verosimilitud (de -2LL, véase la definición 5) entre pa-
sos sucesivos en la construcción del modelo.
•
La segunda fila (BLOQUE) es el cambio (-2LL) entre blo-
ques de entrada sucesivos durante la construcción del
modelo. En este caso, se introdujeron las variables en un
solo bloque, el estadístico Chi cuadrado del Bloque es el
mismo que el estadístico Chi cuadrado del Modelo. Por
lo que se realizó el modelo incluyendo las variables en
forma conjunta, después de haber evaluado las pruebas
de forma individual.
•
La tercera fila (MODELO) es la diferencia entre el valor
de (-2LL) para el modelo, sólo con la constante y el valor
de (-2LL) para el modelo actual [1].
La significación estadística (0,00) nos indica que el mo-
delo con las variables introducidas mejora el ajuste de for-
ma significativa y se rechaza la hipótesis nula
H
0
.
Finalmente, se presenta el resumen del modelo.
Paso -2 log de la
verosimilitud
R cuadrado de
Cox y Snell
R cuadrado de
Nagelkerke
1
53954,665
,248
,332
Tabla 13.
Resumen del Modelo. Fuente: elaboración propia a partir de la encuesta ENEMDU.
El
R cuadrado de Cox y Snell
presentado en la tabla
13 tiene un valor de 0,248 que indica que el 24,80 % de la
variación de la variable dependiente es explicada por las
variables incluidas en el modelo. Considerándose que es
un buen ajuste en la estimación del modelo, pues la prime-
ra prueba de hipótesis que se realiza acepta las variables
incluidas y la consistencia del modelo [1, 5].
3.2.6 Validación del Modelo 1
La ecuación de regresión logística obtenida es:
Pr
(
Y
=
y
i
) =
exp
(
η
i
)
1
+
exp
(
η
i
)
,
i
=
1, 2,
· · ·
,
n
,
(6)
donde
Y
=
1 contrato temporal
0 contrato indefinido
η
i
=
2,226
+
0,170
x
21
+
0,944
x
31
+
0,476
x
32
+
0,116
x
33
−
0,247
x
41
+
0,202
x
42
−
0,129
x
43
−
0,009
x
44
−
0,018
x
5
−
0,851
x
61
−
0,113
x
62
−
1,058
x
63
−
0,005
x
7
−
0,443
x
81
+
0,352
x
82
−
1,524
x
91
−
0,929
x
101
.
Las variables consideradas son:
•
x
21
: Hombre
•
x
31
: Educación Básica
•
x
32
: Educación Media
•
x
33
: Superior Universitaria
•
x
41
: Casado
•
x
42
: Separado
•
x
43
: Divorciado
•
x
44
: Unión Libre
•
x
5
: Edad
•
x
61
: Empleado Gobierno
•
x
62
: Empleado Privado
•
x
63
: Empleado Tercerizado
•
x
7
: Número de trabajadores en el establecimiento
•
x
81
: Sierra
•
x
82
: Costa
•
x
91
: Antigüedad mayor a un año
•
x
101
: Jornada laboral completa
Una de las formas de evaluar el ajuste del modelo es
mediante una “valoración de prueba diagnosticada”. Esto
es comprobar cómo clasifica el modelo obtenido a nuevos
individuos de la muestra, en comparación con la realidad
observada. Con el objetivo de evidenciar la clasificación
que realiza el modelo con las nueve variables predictoras,
se presenta la tabla de clasificación (véase tabla 14).
En la tabla 14 podemos apreciar cómo el modelo obte-
nido clasifica correctamente a 15.727 (de los 23.204) trabaja-
dores temporales (
Y
=
1), por lo que su sensibilidad es de
67.80 %. Por otra parte, el modelo clasifica correctamente a
14
Analítika,
Revista de análisis estadístico
, 1 (2011), Vol. 1(1): 7-28