Se ha planificado el proyecto de forma incremental en una serie de seis milestones correspondientes a un Pipeline de Ciencia de Datos.
Cada milestone representa un PMV (Producto Mínimamente Viable).
- Mínimo: Identificación de los periodos y días faltantes en los datos, análisis de la distribución de los datos y de la correlación entre las variables.
- Entregable: Histogramas de variables, de valores nulos, Diagramas de cajas, Matrices de correlación.
- Mínimo: Implementación de un pipeline de preprocesamiento de datos funcional.
- Entregable: Código fuente del pipeline en Notebook de Jupyter.
- Mínimo: Uso de un modelo Transformer con Atención para la generación de datos sintéticos.
- Entregable: Código fuente del modelo, Documentación del modelo.
- Mínimo: Evaluación de la calidad de los datos generados.
- Entregable: Estudio matemático de las métricas de calidad de los datos generados.
- Mínimo: Álgebra Lineal, Fundamentos de Probabilidad y Estadística, Fundamentos del Aprendizaje Automático.
- Entregable: Documentos TeX.
- Mínimo: Llegar a las 75 páginas de contenido de memoria.
- Entregable: Documento PDF
- Mínimo: No sobrepasar los 20 minutos de exposición.
- Entregable: Documento PDF Beamer de Presentación LaTeX.