Helsinki-NLP · TimotheeMickus · Sep 25, 2023 · Sep 22, 2023 · Sep 22, 2023 · Sep 25, 2023
diff --git a/onmt/trainer.py b/onmt/trainer.py
@@ -447,6 +447,11 @@ def validate(self, valid_iter, moving_average=None, task=None):
         # Set model back to training mode.
         valid_model.train()
 
+        # the forward hook `has_grad` was triggered, so we manually unset the flags to not fool the optim
+        for p in self.model.parameters():
+            if hasattr(p, 'has_grad'):
+                p.has_grad = False
+
         return stats
 
     def _gradient_accumulation_over_lang_pairs(