Skip to content

Commit

Permalink
Post 19
Browse files Browse the repository at this point in the history
  • Loading branch information
Adrimapo committed Apr 1, 2024
1 parent 0b23121 commit b3ffaa7
Show file tree
Hide file tree
Showing 2 changed files with 83 additions and 1 deletion.
2 changes: 1 addition & 1 deletion docs/_posts/2024-03-20-Semana-18.md
Original file line number Diff line number Diff line change
Expand Up @@ -71,7 +71,7 @@ Para la velocidad lineal se empleó un filtro de paso bajo para suavizar la reac
<figcaption>Comparación de velocidades lineales</figcaption>
</figure>

Como podemos apreciar, la media añade un pequeño offset y reduce el tiempo de reacción, pero en ejecución, sus resultados son bastante notables y merece la pena. No obstante, se realizaron cálculos de cuánto tiempo medio podemos tratar de hacer un cambio brusco de una velocidad a otra.
Como podemos apreciar, la media añade un pequeño offset y reduce el tiempo de reacción, pero en ejecución, sus resultados son bastante notables y merece la pena. No obstante, se realizaron cálculos de cuánto tiempo medio podemos tratar de hacer un cambio brusco de una velocidad a otra.w

Sabiendo que tenemos una frecuencia de 233.17 Hz, esto implica que ejecutamos una iteración cada 4 ms. Suponiendo que nuestro buffer de medidas sea de 150 medidas, un cambio total de velocidad se producirá en 643 milisegundos. Lo que es un tiempo bastante aceptable para que el dron no frene en seco y la cámara ascienda hacia arriba.

Expand Down
82 changes: 82 additions & 0 deletions docs/_posts/2024-03-20-Semana-19.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,82 @@
---
title: "Semana 18 - Lectura de papers"
categories:
- Registro Semanal
tags:
- ROS2
- Aprendizaje Automático
---

## Índice

- [Índice](#índice)
- [Formas de controlar el dron](#formas-de-controlar-el-dron)
- [Time-Optimal Flight with Safety Constraints and Data-driven Dynamics](#time-optimal-flight-with-safety-constraints-and-data-driven-dynamics)
- [Ideas para añadir en el desarrollo](#ideas-para-añadir-en-el-desarrollo)
- [Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight](#bootstrapping-reinforcement-learning-with-imitation-for-vision-based-agile-flight)
- [Imitation Learning-Based Online Time-Optimal Control with Multiple-Waypoint Constraints for Quadrotors](#imitation-learning-based-online-time-optimal-control-with-multiple-waypoint-constraints-for-quadrotors)
- [Autonomous Drone Racing: Time-Optimal Spatial Iterative Learning Control within a Virtual Tube](#autonomous-drone-racing-time-optimal-spatial-iterative-learning-control-within-a-virtual-tube)
- [Robust Navigation for Racing Drones based on Imitation Learning and Modularization](#robust-navigation-for-racing-drones-based-on-imitation-learning-and-modularization)
- [CCIL: Continuity-Based Data Augmentation for Corrective Imitation Learning](#ccil-continuity-based-data-augmentation-for-corrective-imitation-learning)

---

## Formas de controlar el dron

* En primer lugar, siguiendo la instalación, encontramos que utilizando el SDK el dron se conecta correctamente.
* Posteriormente, se exploraron 2 opciones para controlar el dron: aerostack y djitellopy.

---

## Time-Optimal Flight with Safety Constraints and Data-driven Dynamics

El paper explica cómo los circuitos de carreras de drones son uno de los entornos más útiles para comprobar la agilidad de los mismos. Además, se explican algoritmos utilizados para este tipo de problema. En este caso, se menciona MPCC (Model Predictive Contourning Control) como un algoritmo importante. Se destaca que al ser un sistema de predicción dinámica, esto implica que se debe ajustar y adaptar a elementos impredecibles para optimizar su rendimiento. También se presenta la dinámica del dron, lo cual puede ser interesante para la redacción del TFG.

- [Enlace](https://arxiv.org/pdf/2403.17551.pdf)

---

## Ideas para añadir en el desarrollo

* Se propone aumentar la velocidad lineal al piloto experto y al piloto neuronal para determinar si uno reacciona mejor que el otro en realidad.

---

## Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight

En este paper se combina la efectividad del aprendizaje por refuerzo e imitation learning. Se explica la importancia de que las máquinas sean capaces de reaccionar a estímulos visuales.

- [Enlace](https://arxiv.org/pdf/2403.12203.pdf)

---

## Imitation Learning-Based Online Time-Optimal Control with Multiple-Waypoint Constraints for Quadrotors

Este proyecto es diferente ya que se tienen waypoints desde el principio y se va calculando el error y redirigiendo el vuelo con la red neuronal. Se tiene en cuenta la latencia en el mundo real.

- [Enlace](https://arxiv.org/pdf/2402.11570.pdf)

---

## Autonomous Drone Racing: Time-Optimal Spatial Iterative Learning Control within a Virtual Tube

En este caso, se describe cómo se genera un piloto experto capaz de atravesar ventanas utilizando un tubo virtual que describe una zona segura para el dron.

- [Enlace](https://arxiv.org/pdf/2306.15992.pdf)

---

## Robust Navigation for Racing Drones based on Imitation Learning and Modularization

Se presenta un estudio bastante similar al trabajo realizado actualmente donde se pueden observar resultados similares a los obtenidos.

- [Enlace](https://arxiv.org/pdf/2105.12923.pdf)

---

## CCIL: Continuity-Based Data Augmentation for Corrective Imitation Learning
Cuando las políticas robóticas encuentran estados no cubiertos en el conjunto de datos de expertos debido al ruido del sensor, entornos estocásticos, perturbaciones externas o cambio covariable causado por errores acumulativos, pueden actuar de manera impredecible y peligrosa. Para la implementación generalizada del aprendizaje por imitación en aplicaciones robóticas del mundo real, necesitamos una solución que garantice la robustez de estas políticas incluso cuando se encuentren con estados desconocidos. CCIL, aprovechando la continuidad local en la dinámica para generar etiquetas correctivas para el aprendizaje por imitación y validarlas empíricamente en una variedad de dominios robóticos en simulación. De manera sencilla estas etiquetas consisten en a partir del modelo cinemático de nuestro sistema generar etiquetas donde se pueda corregir este error.



- [Enlace](https://arxiv.org/pdf/2310.12972.pdf)

0 comments on commit b3ffaa7

Please sign in to comment.