feat: added evaluation script #14

Markus28 · 2024-01-15T10:06:13Z

No description provided.

Add WikiCLIR Retrieval Task

Add the GerDaLIR dataset

Add German STSBenchmark task

Add German XMarket dataset

Co-authored-by: Saba Sturua <[email protected]>

add paws x dataset

Add ir_datasets as dependency

Fix: Adding MTEB_SINGLE_GPU environment variable

Add GermanDPR dataset

feat: add miracl reranking task for german

Fixes mismatch between description and HuggingFace dataset

violenil · 2024-01-15T14:52:57Z

scripts/run_mteb_german.py

+    TASK_LIST = ["MIRACL", "GermanDPR", "PawsX", "GermanSTSBenchmark", "XMarket", "GerDaLIR", "WikiCLIR"]
+    MODELS = ['intfloat/multilingual-e5-base', 'intfloat/multilingual-e5-large', 'T-Systems-onsite/cross-en-de-roberta-sentence-transformer', 'sentence-transformers/distiluse-base-multilingual-cased-v2']
+    for model_name in MODELS:
+        model = SentenceTransformer(model_name, device='cuda')


This automatically limits the max_seq_length to 512. If this is desired, then I think the MTEB scores we publish should also result from the same max_seq_length of 512 and not 8k.

The sentence-transformers/distiluse-base-multilingual-cased-v2 model actually uses a sequence length of 128. I'm not sure how large the positional embeddings even are for these models.

guenthermi and others added 30 commits October 31, 2023 11:40

add gerdalir dataset

77c1586

fix: gerdalir dataset

bd5e945

fix: lang from en to de

3eb5c71

feat: add wikiclir en-de task

2d00b58

chore: add ir datasets to requirements

830cd60

refactor: limit queries to 10k

6730483

refactor: update description of task with limit

11866e6

Merge pull request #2 from jina-ai/feat-wikiclir-de

cd955ec

Add WikiCLIR Retrieval Task

solve merge conflict

151668c

revert style changes

2b9c20f

Merge pull request #1 from jina-ai/add-gerdalir-dataset

262ab27

Add the GerDaLIR dataset

add XMarket dataset

1a9278f

add xmarket to init file

1f0c797

feat: add german stsbenchmarksts task

5818581

feat: add revision id

dacf64a

feat: update revision id

5049d05

refactor: update revision id after changes in scores

14448de

Merge pull request #4 from jina-ai/feat-add-sts-de

7e05fc0

Add German STSBenchmark task

add paws x dataset

628fbb1

Merge pull request #3 from jina-ai/add-xmarket-de

b360db4

Add German XMarket dataset

add GermanDPR dataset

cbd8d95

fix loading

7316147

solve merge conflict

b8e5afc

Update mteb/tasks/Retrieval/GermanDPRRetrieval.py

30a9611

Co-authored-by: Saba Sturua <[email protected]>

Merge pull request #5 from jina-ai/add-paws-x-dataset

3de1bb1

add paws x dataset

feat: add miracl reranking task for german

9e2ac3e

refactor: cleanup task

60a61ac

Add ir_datasets as dependency

55155d6

Merge pull request #8 from jina-ai/add_ir_dependency

969e202

Add ir_datasets as dependency

Fix: Adding MTEB_SINGLE_GPU environment variable

c6733bb

Markus28 and others added 11 commits November 9, 2023 17:52

Merge pull request #9 from jina-ai/fix_multi_gpu

a6c9cb7

Fix: Adding MTEB_SINGLE_GPU environment variable

fix: Use MTEB_SINGLE_GPU environment variable also in BeIRTask.py (#10)

cf2c380

Merge pull request #6 from jina-ai/add-german-dpr

9aea329

Add GermanDPR dataset

Merge pull request #7 from jina-ai/feat-add-miracl-reranking

19f77dd

feat: add miracl reranking task for german

prevent duplicate pos docs

2822839

fix: use test split in MIRACL (#13)

76b7b45

Fixes mismatch between description and HuggingFace dataset

feat: added evaluation script

0a4a7e5

feat: renamed script, updated README

545746d

feat: fixed phrasing in README

5b9f053

feat: fixed phrasing in README

3b9ff9d

feat: added back WikiCLIR

64f03b5

violenil reviewed Jan 15, 2024

View reviewed changes

guenthermi force-pushed the main branch from 76b7b45 to d92ba05 Compare January 24, 2024 09:51

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: added evaluation script #14

feat: added evaluation script #14

Markus28 commented Jan 15, 2024

violenil Jan 15, 2024

Markus28 Jan 15, 2024

feat: added evaluation script #14

Are you sure you want to change the base?

feat: added evaluation script #14

Conversation

Markus28 commented Jan 15, 2024

violenil Jan 15, 2024

Choose a reason for hiding this comment

Markus28 Jan 15, 2024

Choose a reason for hiding this comment