Em Aprendizado por Reforço, foram criados diversos frameworks e bibliotecas com o intuito de simplificar a implementação de algoritmos e ambientes. Desta forma, aprender a utilizá-los acaba sendo uma ótima introdução prática à área.
A seguir, estão apresentados guias e tutoriais de algumas dessas bibliotecas:
O Gym é um conjunto de ferramentas que ajudam no desenvolvimento e na comparação de algoritmos de aprendizado por reforço. A biblioteca é basicamente um conjunto de environments, ou ambientes de teste que o usuário pode utilizar pra testar seus algoritmos. Vale notar que esses ambientes têm uma interface compartilhada, desta forma torna-se possível escrever algoritmos gerais.
A Stable Baselines é uma biblioteca de Aprendizado por Reforço que implementa diversos algoritmos de agentes de RL, além de várias funcionalidades úteis para o treinamento de um agente. Suas implementações são bem simples e intuitivas, mas sem deixarem de ser otimizadas e poderosas, buscando facilitar o desenvolvimento de projetos de Aprendizado por Reforço de alta qualidade.