-
Notifications
You must be signed in to change notification settings - Fork 1
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
Showing
2 changed files
with
83 additions
and
1 deletion.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,82 @@ | ||
--- | ||
title: "Semana 18 - Lectura de papers" | ||
categories: | ||
- Registro Semanal | ||
tags: | ||
- ROS2 | ||
- Aprendizaje Automático | ||
--- | ||
|
||
## Índice | ||
|
||
- [Índice](#índice) | ||
- [Formas de controlar el dron](#formas-de-controlar-el-dron) | ||
- [Time-Optimal Flight with Safety Constraints and Data-driven Dynamics](#time-optimal-flight-with-safety-constraints-and-data-driven-dynamics) | ||
- [Ideas para añadir en el desarrollo](#ideas-para-añadir-en-el-desarrollo) | ||
- [Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight](#bootstrapping-reinforcement-learning-with-imitation-for-vision-based-agile-flight) | ||
- [Imitation Learning-Based Online Time-Optimal Control with Multiple-Waypoint Constraints for Quadrotors](#imitation-learning-based-online-time-optimal-control-with-multiple-waypoint-constraints-for-quadrotors) | ||
- [Autonomous Drone Racing: Time-Optimal Spatial Iterative Learning Control within a Virtual Tube](#autonomous-drone-racing-time-optimal-spatial-iterative-learning-control-within-a-virtual-tube) | ||
- [Robust Navigation for Racing Drones based on Imitation Learning and Modularization](#robust-navigation-for-racing-drones-based-on-imitation-learning-and-modularization) | ||
- [CCIL: Continuity-Based Data Augmentation for Corrective Imitation Learning](#ccil-continuity-based-data-augmentation-for-corrective-imitation-learning) | ||
|
||
--- | ||
|
||
## Formas de controlar el dron | ||
|
||
* En primer lugar, siguiendo la instalación, encontramos que utilizando el SDK el dron se conecta correctamente. | ||
* Posteriormente, se exploraron 2 opciones para controlar el dron: aerostack y djitellopy. | ||
|
||
--- | ||
|
||
## Time-Optimal Flight with Safety Constraints and Data-driven Dynamics | ||
|
||
El paper explica cómo los circuitos de carreras de drones son uno de los entornos más útiles para comprobar la agilidad de los mismos. Además, se explican algoritmos utilizados para este tipo de problema. En este caso, se menciona MPCC (Model Predictive Contourning Control) como un algoritmo importante. Se destaca que al ser un sistema de predicción dinámica, esto implica que se debe ajustar y adaptar a elementos impredecibles para optimizar su rendimiento. También se presenta la dinámica del dron, lo cual puede ser interesante para la redacción del TFG. | ||
|
||
- [Enlace](https://arxiv.org/pdf/2403.17551.pdf) | ||
|
||
--- | ||
|
||
## Ideas para añadir en el desarrollo | ||
|
||
* Se propone aumentar la velocidad lineal al piloto experto y al piloto neuronal para determinar si uno reacciona mejor que el otro en realidad. | ||
|
||
--- | ||
|
||
## Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight | ||
|
||
En este paper se combina la efectividad del aprendizaje por refuerzo e imitation learning. Se explica la importancia de que las máquinas sean capaces de reaccionar a estímulos visuales. | ||
|
||
- [Enlace](https://arxiv.org/pdf/2403.12203.pdf) | ||
|
||
--- | ||
|
||
## Imitation Learning-Based Online Time-Optimal Control with Multiple-Waypoint Constraints for Quadrotors | ||
|
||
Este proyecto es diferente ya que se tienen waypoints desde el principio y se va calculando el error y redirigiendo el vuelo con la red neuronal. Se tiene en cuenta la latencia en el mundo real. | ||
|
||
- [Enlace](https://arxiv.org/pdf/2402.11570.pdf) | ||
|
||
--- | ||
|
||
## Autonomous Drone Racing: Time-Optimal Spatial Iterative Learning Control within a Virtual Tube | ||
|
||
En este caso, se describe cómo se genera un piloto experto capaz de atravesar ventanas utilizando un tubo virtual que describe una zona segura para el dron. | ||
|
||
- [Enlace](https://arxiv.org/pdf/2306.15992.pdf) | ||
|
||
--- | ||
|
||
## Robust Navigation for Racing Drones based on Imitation Learning and Modularization | ||
|
||
Se presenta un estudio bastante similar al trabajo realizado actualmente donde se pueden observar resultados similares a los obtenidos. | ||
|
||
- [Enlace](https://arxiv.org/pdf/2105.12923.pdf) | ||
|
||
--- | ||
|
||
## CCIL: Continuity-Based Data Augmentation for Corrective Imitation Learning | ||
Cuando las políticas robóticas encuentran estados no cubiertos en el conjunto de datos de expertos debido al ruido del sensor, entornos estocásticos, perturbaciones externas o cambio covariable causado por errores acumulativos, pueden actuar de manera impredecible y peligrosa. Para la implementación generalizada del aprendizaje por imitación en aplicaciones robóticas del mundo real, necesitamos una solución que garantice la robustez de estas políticas incluso cuando se encuentren con estados desconocidos. CCIL, aprovechando la continuidad local en la dinámica para generar etiquetas correctivas para el aprendizaje por imitación y validarlas empíricamente en una variedad de dominios robóticos en simulación. De manera sencilla estas etiquetas consisten en a partir del modelo cinemático de nuestro sistema generar etiquetas donde se pueda corregir este error. | ||
|
||
|
||
|
||
- [Enlace](https://arxiv.org/pdf/2310.12972.pdf) |