improve unit tests for BART

svirpioj · svirpioj · commit ca3e2adfb0c2 · 2024-10-02T16:45:35.000+03:00
diff --git a/tests/test_swag_bart.py b/tests/test_swag_bart.py
@@ -1,10 +1,11 @@
 import logging
+import os
 import unittest
 import tempfile
 
 import torch
 
-from transformers import AutoTokenizer, BartForConditionalGeneration
+from transformers import AutoTokenizer, BartForConditionalGeneration, GenerationConfig
 
 from swag_transformers.swag_bart import SwagBartConfig, SwagBartModel, SwagBartPreTrainedModel, \
     SwagBartForConditionalGeneration
@@ -33,45 +34,67 @@ def test_untrained(self):
         logging.debug(out)
         self.assertEqual(out.last_hidden_state.shape, (1, 2, hidden_size))
 
-    def test_pretrained_bart_generative(self):
+    def pretrained_bart_generative(self, no_cov_mat):
         device = "cuda" if torch.cuda.is_available() else "cpu"
         model = BartForConditionalGeneration.from_pretrained(self.pretrained_model_name)
         model.to(device)
         self.assertEqual(model.device.type, device)
-        swag_model = SwagBartForConditionalGeneration.from_base(model)
+        swag_model = SwagBartForConditionalGeneration.from_base(model, no_cov_mat=no_cov_mat)
         swag_model.to(device)
         self.assertEqual(swag_model.device.type, device)
-        tokenizer = AutoTokenizer.from_pretrained(self.pretrained_model_name)
+        tokenizer = AutoTokenizer.from_pretrained(self.pretrained_model_name, clean_up_tokenization_spaces=False)
+
+        gen_config = GenerationConfig.from_model_config(model.config)
+        logging.warning(gen_config)
+        gen_config.max_new_tokens = 10
+        logging.warning(gen_config)
 
         swag_model.swag.collect_model(model)
         swag_model.sample_parameters()
+        # has to be updated manually when using collect_model directly
+        swag_model.config.cov_mat_rank = swag_model.swag.cov_mat_rank
 
         # Test forward
-        base_out = model.forward(input_ids=torch.tensor([[3, 14]]), decoder_input_ids=torch.tensor([[1, 2, 4]]))
-        out = swag_model.forward(input_ids=torch.tensor([[3, 14]]), decoder_input_ids=torch.tensor([[1, 2, 4]]))
-        self.assertTrue(torch.allclose(base_out.logits, out.logits))
+        base_fwd_out = model.forward(input_ids=torch.tensor([[3, 14]]), decoder_input_ids=torch.tensor([[1, 2, 4]]))
+        swag_fwd_out = swag_model.forward(input_ids=torch.tensor([[3, 14]]), decoder_input_ids=torch.tensor([[1, 2, 4]]))
+        self.assertTrue(torch.allclose(base_fwd_out.logits, swag_fwd_out.logits))
 
         # Test generate
         example = "I have no BART and I must generate"
+        torch.manual_seed(123)
         batch = tokenizer(example, return_tensors="pt")
-        base_generated_ids = model.generate(batch["input_ids"])
+        base_generated_ids = model.generate(batch["input_ids"], generation_config=gen_config)
+        # max_length=20, num_beams=1, do_sample=False, early_stopping=False
         base_out = tokenizer.batch_decode(base_generated_ids, skip_special_tokens=True)
-        generated_ids = swag_model.generate(batch["input_ids"])
+        logging.warning(base_out)
+
+        generated_ids = swag_model.generate(batch["input_ids"], generation_config=gen_config)
         out = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
-        logging.info(base_out)
-        logging.info(out)
+        logging.warning(out)
         self.assertEqual(base_out, out)
 
         # Test saving & loading
         with tempfile.TemporaryDirectory() as tempdir:
             swag_model.save_pretrained(tempdir)
+            logging.warning(os.listdir(tempdir))
+            with open(os.path.join(tempdir, 'config.json'), 'r') as fobj:
+                logging.warning(fobj.read())
             stored_model = SwagBartForConditionalGeneration.from_pretrained(tempdir).to(device)
 
-        generated_ids = stored_model.generate(batch["input_ids"])
+        stored_fwd_out = stored_model.forward(
+            input_ids=torch.tensor([[3, 14]]), decoder_input_ids=torch.tensor([[1, 2, 4]]))
+        self.assertTrue(torch.allclose(swag_fwd_out.logits, stored_fwd_out.logits))
+
+        generated_ids = stored_model.generate(batch["input_ids"], generation_config=gen_config)
         out = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
-        logging.info(out)
         self.assertEqual(base_out, out)
 
+    def test_pretrained_bart_generative_no_cov(self):
+        self.pretrained_bart_generative(no_cov_mat=True)
+
+    def test_pretrained_bart_generative_with_cov(self):
+        self.pretrained_bart_generative(no_cov_mat=False)
+
 
 if __name__ == "__main__":
     logging.basicConfig(level=logging.INFO)