Resumen del trabajo fin de master

Título: Distancia de Levenshtein como clasificador de textos

Universidad que ofrece el proyecto: Universidade de Santiago de Compostela

Director/a:

Ameijeiras Alonso, Jose;

Ginzo Villamayor, María José

Alumno/a:

Domínguez Prieto, Alexandre

Resumen:

Las empresas que trabajan con bases de datos grandes pueden tener duplicados en sus bases de datos. Detectar estos duplicados es una tarea que requiere tiempo, especialmente si los datos son palabras en texto plano. El objetivo de este trabajo es desarrollar un algoritmo que permita detectar duplicados en nuestra base de datos. Este algoritmo, basado en la distancia de Levenshtein, se implementará para clasificar nombres de localizaciones postales y nombres de clientes.

Más información