Resumen:
Cada vez es más habitual que servicios de data
warehousing en la nube incorporen capacidades de ML con
el objetivo de permitir la creación y/o explotación de modelos
algorítmicos mediante interfaces de fácil uso y conocidas por
el analista de datos —i.e., SQL—, al mismo tiempo que se
logre realizar todo el proceso allí donde estén los datos y,
gracias a ello, conseguir grandes capacidades de
procesamiento dada la alta escalabilidad de estas
arquitecturas. En base a eso, este TFM propone la
evaluación de todos estos aspectos en lo relativo a BigQuery
ML, el componente con capacidades de ciencia de datos que
Google Cloud ha habilitado en su producto de data
warehousing en la nube. Así pues, el foco de este trabajo
estará en dar cobertura al ciclo de vida completo de la ciencia
de datos (análisis exploratorio, feature engineering,
experimentación algorítmica, evaluación, fine tuning,
operativización, explotación y monitorización) usando como
componente central BigQuery ML, y enriqueciendo todo ello
con un enfoque MLOps para garantizar la ágil iteración sobre
la solución. Este trabajo se realizará sobre un caso de uso
vehicular, con el fin último de demostrar la viabilidad de este
tipo de enfoques a la hora de aportar valor a negocio desde
una perspectiva de analítica avanzada en un corto tiempo, y
utilizando tecnologías que posiblemente ya estén aplicando
las compañías en relación a su estrategia de datos global.
Beneficio esperado: Establecer el grado de madurez de las
tecnologías de data warehousing en la nube con respecto a sus capacidades de ML, validando la viabilidad de su
aplicación para el desarrollo e implantación end-to-end de
soluciones de ciencia de datos.
|