Resumen del trabajo fin de master



Título: Distancia de Levenshtein como clasificador de textos
Universidad que ofrece el proyecto: Universidade de Santiago de Compostela
Director/a:
Ameijeiras Alonso, Jose;  Ginzo Villamayor, María José
Alumno/a:
Domínguez Prieto, Alexandre
Resumen:
Las empresas que trabajan con bases de datos grandes pueden tener duplicados en sus bases de datos. Detectar estos duplicados es una tarea que requiere tiempo, especialmente si los datos son palabras en texto plano. El objetivo de este trabajo es desarrollar un algoritmo que permita detectar duplicados en nuestra base de datos. Este algoritmo, basado en la distancia de Levenshtein, se implementará para clasificar nombres de localizaciones postales y nombres de clientes.
Más información