Resumen del trabajo fin de master



Título: Desarrollo e implantación de un sistema de ML enteramente basado en tecnologías SQL de la nube
Universidad que ofrece el proyecto: Universidade de Santiago de Compostela
Director/a:
Crujeiras Casais, Rosa María
Alumno/a:
Camino Enríquez, Alba
Resumen:
Cada vez es más habitual que servicios de data warehousing en la nube incorporen capacidades de ML con el objetivo de permitir la creación y/o explotación de modelos algorítmicos mediante interfaces de fácil uso y conocidas por el analista de datos —i.e., SQL—, al mismo tiempo que se logre realizar todo el proceso allí donde estén los datos y, gracias a ello, conseguir grandes capacidades de procesamiento dada la alta escalabilidad de estas arquitecturas. En base a eso, este TFM propone la evaluación de todos estos aspectos en lo relativo a BigQuery ML, el componente con capacidades de ciencia de datos que Google Cloud ha habilitado en su producto de data warehousing en la nube. Así pues, el foco de este trabajo estará en dar cobertura al ciclo de vida completo de la ciencia de datos (análisis exploratorio, feature engineering, experimentación algorítmica, evaluación, fine tuning, operativización, explotación y monitorización) usando como componente central BigQuery ML, y enriqueciendo todo ello con un enfoque MLOps para garantizar la ágil iteración sobre la solución. Este trabajo se realizará sobre un caso de uso vehicular, con el fin último de demostrar la viabilidad de este tipo de enfoques a la hora de aportar valor a negocio desde una perspectiva de analítica avanzada en un corto tiempo, y utilizando tecnologías que posiblemente ya estén aplicando las compañías en relación a su estrategia de datos global. Beneficio esperado: Establecer el grado de madurez de las tecnologías de data warehousing en la nube con respecto a sus capacidades de ML, validando la viabilidad de su aplicación para el desarrollo e implantación end-to-end de soluciones de ciencia de datos.
Más información