Added a set of eval tasks #34

sijial430 · 2025-03-12T19:00:33Z

revised the eval scripts and repo dependencies, and reorganized into evals/.
currently supporting:

This reverts commit c50fa16.

This reverts commit 143d3ed.

sijial430 added 5 commits March 12, 2025 14:19

added a set of eval tasks

a05bc5e

added variants of rejection sampling

c50fa16

added label.py back

46fa0aa

Revert "added variants of rejection sampling"

54b640e

This reverts commit c50fa16.

removed unnecessary files

8252911

sijial430 marked this pull request as draft March 12, 2025 19:42

sijial430 marked this pull request as ready for review March 12, 2025 19:43

sijial430 added 8 commits March 12, 2025 18:51

added script to summarize all eval metrics for readability

527ef2f

added safe-rlhf

143d3ed

Revert "added safe-rlhf"

7a3179b

This reverts commit 143d3ed.

added wildbench

7e2a0e3

updated label.py and dataloader.py

ca85d85

added evals code for hh, safe-rlhf, wildbench

a46241d

removed label.py

87c7cad

minor fix to dataloader to merge multiple generations

a5c200a

Provide feedback