Página 101 - ANAlitika9

Versión de HTML Básico

Analíti a
k
9
Revista de Análisis Estadístico
Journal of Statistical Analysis
Analítika, Revista de análisis estadístico, (2015), Vol. 9
Hacia un Algoritmo Optimo de Emparejamiento de Nombres
97
Hacia un Algoritmo ´Optimo de Emparejamiento de
Nombres
1
Towards an Optimum Name Matching Algorithm
Juan Carlos Delgado Loyola
2
Direcci´on de Registros Administrativos. Instituto Nacional de Estad´ıstica y Censos
Quito - Ecuador
Resumen
3
La gran variedad de algoritmos de emparejamiento de nombres no son suficientes por
si mismos para proveer de una juntura ´optima entre bases de datos administrativas perte-
necientes a los mismos ciudadanos. De acuerdo con otras comparaciones experimentales de
t´ecnicas de emparejamiento, las variantes en la composici´on de nombres de personas tienen
un rol importante en el proceso de emparejamiento, as´ı que se ha hecho primero un an´alisis
previo de lo mismo. El presente estudio realiza una evaluaci´on de un algoritmo de empareja-
miento con una muestra representativa de nombres de personas tomada de la poblaci´on del
Ecuador en el a˜no 2010. Esta muestra se empareja con una similar que contiene nombres de
ciudadanos de la base de datos del Registro Civil; y se asume que estuvieron presentes du-
rante el d´ıa del censo. Se incluye un modelo de procesos para el nuevo algoritmo que combina
t´ecnicas fon´eticas y de distancia de edici´on. Finalmente, se obtiene evidencia estad´ıstica a
trav´es de la diferencia significativa en el factor de exactitud para valores antes y despu´es de
la ejecuci´on del algoritmo.
Palabras Clave: emparejamiento de nombres,t´ecnicas fon´eticas, distancia de edici´on.
JCL: 1: Fon´etica/Fonolog´ıa; 2: Morfolog´ıa
4
1
Primero quiero agradecer a todas las personas que asistieron a Di´alogo Estad´ıstico en INEC y a todos
aquellos que tuvieron la oportunidad de conocer en detalle este trabajo, y alentaron a su publicaci´on, espe-
cialmente a Boris Espinoza, Cesar Vicu˜na, Stalyn Flores, Yandr´e Jaime, Lorena Moreno y Karla Pasquel. En
segundo lugar me es grato reconocer a Juan Fernando Galarraga, como colaborador docente en mis estudios
relacionados con estas investigaciones y a su aporte profesional en la revisi´on de este trabajo.
2
juancarlos delgado@inec.gob.ec
3
El presente estudio utiliza datos individuales con fines investigativos y estad´ısticos, por lo tanto no
vulnera el principio de confidencialidad y reserva de la Informaci´on establecido en el art´ıculo 21 de la Ley de
Estad´ıstica, el art´ıculo 6 de la Ley Org´anica de Transparencia y Acceso a la Informaci´on P´ublica y dem´as
normas conexas.
4
Journal Computacional Linguistic (JCL): Niveles 1: Fon´etica/Fonolog´ıa; 2: Morfolog´ıa