video2text fix

EvolvingLMMs-Lab · Luodian · Dec 3, 2024 · Nov 30, 2024 · Nov 30, 2024 · Dec 1, 2024
commit 715df25ce4463381f4881a728f0bb6f583fbedd2
diff --git a/lmms_eval/tasks/mix_evals/video2text/mix_evals_video2text_freeform.yaml b/lmms_eval/tasks/mix_evals/video2text/mix_evals_video2text_freeform.yaml
@@ -1,10 +1,10 @@
-dataset_name: "video2text_closeended_free-form"
 task: "mix_evals_video2text_freeform"
-test_split: test
+dataset_name: "video2text"
+test_split: free_form
 output_type: generate_until
 doc_to_visual: !function utils.mix_evals_video2text_doc_to_visual
 doc_to_text: !function utils.mix_evals_video2text_doc_to_text
-doc_to_target: "{{target}}"
+doc_to_target: "{{reference_answer}}"
 process_results: !function utils.mix_evals_video2text_process_results_freeform
 metric_list:
   - metric: gpt_eval

diff --git a/lmms_eval/tasks/mix_evals/video2text/mix_evals_video2text_mc.yaml b/lmms_eval/tasks/mix_evals/video2text/mix_evals_video2text_mc.yaml
@@ -1,11 +1,11 @@
 include: _default_template_yaml
-dataset_name: "video2text_closeended_multiple-choice"
 task: "mix_evals_video2text_mc"
-test_split: test
+dataset_name: "video2text"
+test_split: multiple_choice
 output_type: generate_until
 doc_to_visual: !function utils.mix_evals_video2text_doc_to_visual
 doc_to_text: !function utils.mix_evals_video2text_doc_to_text
-doc_to_target: "{{target}}"
+doc_to_target: "{{reference_answer}}"
 
 generation_kwargs:
   max_new_tokens: 5

diff --git a/lmms_eval/tasks/mix_evals/video2text/utils.py b/lmms_eval/tasks/mix_evals/video2text/utils.py
@@ -232,13 +232,13 @@ def mix_evals_video2text_process_results_open_convs(doc, result):
 
 def mix_evals_video2text_process_results_freeform(doc, result):
     pred = result[0]
-    ground_truth_str = ", ".join([f'"{gt}"' for gt in doc["target"]])
+    ground_truth_str = ", ".join([f'"{gt}"' for gt in doc["reference_answer"]])
     ground_truth_str = f"[{ground_truth_str}]"
     content = eval_prompt.format(model_response=pred, ground_truth=ground_truth_str)
     eval_answer, model_name = get_eval(model_response=pred, ground_truth=ground_truth_str, max_tokens=1024)
     return {
-        "submission": {"pred": pred, "question_idx": doc["question_index"], "target": doc["target"], "eval_answer": eval_answer, "gpt_prompt": content},
-        "gpt_eval": {"pred": pred, "question_idx": doc["question_index"], "target": doc["target"], "eval_answer": eval_answer, "gpt_prompt": content},
+        "submission": {"pred": pred, "question_idx": doc["id"], "target": doc["reference_answer"], "eval_answer": eval_answer, "gpt_prompt": content},
+        "gpt_eval": {"pred": pred, "question_idx": doc["id"], "target": doc["reference_answer"], "eval_answer": eval_answer, "gpt_prompt": content},
     }