Denoising Diffusion Policy Optimization (https://arxiv.org/abs/2305.13301) 저자가 코드를 Jax + TPU로 만들었더니 아무도 안 쓴다는 이유로 파이토치 버전 코드를 공개했네요. https://github.com/kvablack/ddpo-pytorch
Denoising Diffusion Policy Optimization (https://arxiv.org/abs/2305.13301) 저자가 코드를 Jax + TPU로 만들었더니 아무도 안 쓴다는 이유로 파이토치 버전 코드를 공개했네요. https://github.com/kvablack/ddpo-pytorch