Resumen del trabajo fin de master
Título:
Distancia de Levenshtein como clasificador de textos |
Universidad que ofrece el proyecto:
Universidade de Santiago de Compostela |
Director/a:
|
Ameijeiras Alonso, Jose; |
Ginzo Villamayor, María José |
|
Alumno/a:
|
Domínguez Prieto, Alexandre |
|
Resumen:
Las empresas que trabajan con bases de datos grandes pueden tener duplicados en sus bases de datos. Detectar estos duplicados es una tarea que requiere tiempo, especialmente si los datos son palabras en texto plano.
El objetivo de este trabajo es desarrollar un algoritmo que permita detectar duplicados en nuestra base de datos. Este algoritmo, basado en la distancia de Levenshtein, se implementará para clasificar nombres de localizaciones postales y nombres de clientes.
|
|