fix: Add Russian models #21

Samoed · 2024-07-28T22:00:45Z

I've created russian benchmark boards and added results from embeddings-benchmark/results#11

# Conflicts: # all_data_tasks/0/default.jsonl # all_data_tasks/1/default.jsonl # all_data_tasks/2/default.jsonl # all_data_tasks/3/default.jsonl # all_data_tasks/4/default.jsonl # all_data_tasks/5/default.jsonl # refresh.py

Muennighoff

Really cool work! 🚀 Somehow your leaderboard removes a lot of models for me - Also the changes in the cached results indicate that lots of models get removed. Can you investigate what's happening & fix it?

KennethEnevoldsen

Sorry was a bit fast with the review there - we did a PR yesterday which revealed that a lot of leaderboards weren't updated so it is possible that it could have been that one (or one of the ones before that - hard to know when they weren't updated)

KennethEnevoldsen · 2024-07-29T07:08:12Z

refresh.py

@@ -538,13 +553,14 @@ def get_mteb_average(task_dict: dict) -> tuple[Any, dict]:
    DATA_OVERALL.insert(
        1,
        f"Average ({len(all_tasks)} datasets)",
-        DATA_OVERALL[all_tasks].mean(axis=1, skipna=False),
+        DATA_OVERALL[find_tasks(DATA_OVERALL.columns, all_tasks)].mean(axis=1, skipna=False),


was there something wrong beforehand?

I figured that previously tasks were presented with lang subset in config.yaml. So, I think I should change this too

KennethEnevoldsen · 2024-07-29T07:09:06Z

refresh.py

@@ -508,7 +509,7 @@ def get_mteb_data(
            df.drop(columns=["PawsX (fr)"], inplace=True)

        # Filter invalid columns
-        cols = [col for col in cols if col in base_columns + datasets]
+        cols = [col for col in cols if col in base_columns + datasets or any([col.split()[0] == d for d in datasets])]


I am not entirely sure what happens here?

Similar problem to find_tasks

But I believe that what is in the name of the task in the huggingface split (not language) and I believe it shoudl be there for all datasets unless it is the default subset.

I'll try to make without find_task a bit later

might also be that I am missing something

KennethEnevoldsen · 2024-07-29T07:09:27Z

refresh.py

@@ -136,8 +137,8 @@ def add_lang(examples):
    return examples


-def norm(names: str) -> set:
-    return set([name.split(" ")[0] for name in names])
+def norm(names: list[str]) -> list[str]:


why can't it be a set?

KennethEnevoldsen · 2024-07-29T07:09:32Z

refresh.py

@@ -659,8 +675,7 @@ def write_out_results(item: dict, item_name: str) -> None:
        print(f"Saving {main_folder} to {main_folder}/default.jsonl")
        os.makedirs(main_folder, exist_ok=True)

-        item.reset_index(inplace=True)
-        item.to_json(f"{main_folder}/default.jsonl", orient="records", lines=True)
+        item.reset_index(drop=True).to_json(f"{main_folder}/default.jsonl", orient="records", lines=True)


This is probably the cause for removing a lot of examples. drop=True will remove items due to them having the same index (e.g. if you concat two data frames where both start their index at 1).

Maybe. I was trying to remove, Index_0 from result tables. I'll try to make this in to_json

According to the docs it shouldn't add the index to the json when orient=record. So it might be that the column was accidentally added?

When done reset_index it becomes additional column Unnamed: 0 and exoprted to_json, so maybe we shouldn't reset_index before exoprt

Ahh right. I believes it gives an error otherwise (but if not just remove it). Otherwise drop the column before writing it

# Conflicts: # all_data_tasks/0/default.jsonl # all_data_tasks/1/default.jsonl # all_data_tasks/10/default.jsonl # all_data_tasks/11/default.jsonl # all_data_tasks/12/default.jsonl # all_data_tasks/13/default.jsonl # all_data_tasks/14/default.jsonl # all_data_tasks/15/default.jsonl # all_data_tasks/16/default.jsonl # all_data_tasks/17/default.jsonl # all_data_tasks/18/default.jsonl # all_data_tasks/19/default.jsonl # all_data_tasks/2/default.jsonl # all_data_tasks/20/default.jsonl # all_data_tasks/21/default.jsonl # all_data_tasks/22/default.jsonl # all_data_tasks/23/default.jsonl # all_data_tasks/25/default.jsonl # all_data_tasks/27/default.jsonl # all_data_tasks/28/default.jsonl # all_data_tasks/29/default.jsonl # all_data_tasks/3/default.jsonl # all_data_tasks/30/default.jsonl # all_data_tasks/31/default.jsonl # all_data_tasks/32/default.jsonl # all_data_tasks/33/default.jsonl # all_data_tasks/34/default.jsonl # all_data_tasks/35/default.jsonl # all_data_tasks/36/default.jsonl # all_data_tasks/4/default.jsonl # all_data_tasks/5/default.jsonl # all_data_tasks/6/default.jsonl # all_data_tasks/7/default.jsonl # all_data_tasks/8/default.jsonl # all_data_tasks/9/default.jsonl # boards_data/bright/data_tasks/Retrieval/default.jsonl # boards_data/da/data_tasks/BitextMining/default.jsonl # boards_data/da/data_tasks/Classification/default.jsonl # boards_data/de/data_tasks/Clustering/default.jsonl # boards_data/en-x/data_tasks/BitextMining/default.jsonl # boards_data/en/data_overall/default.jsonl # boards_data/en/data_tasks/Classification/default.jsonl # boards_data/en/data_tasks/Clustering/default.jsonl # boards_data/en/data_tasks/PairClassification/default.jsonl # boards_data/en/data_tasks/Reranking/default.jsonl # boards_data/en/data_tasks/Retrieval/default.jsonl # boards_data/en/data_tasks/STS/default.jsonl # boards_data/en/data_tasks/Summarization/default.jsonl # boards_data/fr/data_overall/default.jsonl # boards_data/fr/data_tasks/Classification/default.jsonl # boards_data/fr/data_tasks/Clustering/default.jsonl # boards_data/fr/data_tasks/PairClassification/default.jsonl # boards_data/fr/data_tasks/Reranking/default.jsonl # boards_data/fr/data_tasks/Retrieval/default.jsonl # boards_data/fr/data_tasks/STS/default.jsonl # boards_data/fr/data_tasks/Summarization/default.jsonl # boards_data/instructions/data_tasks/InstructionRetrieval/default.jsonl # boards_data/law/data_tasks/Retrieval/default.jsonl # boards_data/longembed/data_tasks/Retrieval/default.jsonl # boards_data/no/data_tasks/Classification/default.jsonl # boards_data/other-cls/data_tasks/Classification/default.jsonl # boards_data/other-sts/data_tasks/STS/default.jsonl # boards_data/pl/data_overall/default.jsonl # boards_data/pl/data_tasks/Classification/default.jsonl # boards_data/pl/data_tasks/Clustering/default.jsonl # boards_data/pl/data_tasks/PairClassification/default.jsonl # boards_data/pl/data_tasks/Retrieval/default.jsonl # boards_data/pl/data_tasks/STS/default.jsonl # boards_data/rar-b/data_tasks/Retrieval/default.jsonl # boards_data/se/data_tasks/Classification/default.jsonl # boards_data/zh/data_overall/default.jsonl # boards_data/zh/data_tasks/Classification/default.jsonl # boards_data/zh/data_tasks/Clustering/default.jsonl # boards_data/zh/data_tasks/PairClassification/default.jsonl # boards_data/zh/data_tasks/Reranking/default.jsonl # boards_data/zh/data_tasks/Retrieval/default.jsonl # boards_data/zh/data_tasks/STS/default.jsonl # model_meta.yaml # refresh.py

# Conflicts: # all_data_tasks/0/default.jsonl # all_data_tasks/1/default.jsonl # all_data_tasks/10/default.jsonl # all_data_tasks/11/default.jsonl # all_data_tasks/12/default.jsonl # all_data_tasks/13/default.jsonl # all_data_tasks/16/default.jsonl # all_data_tasks/17/default.jsonl # all_data_tasks/18/default.jsonl # all_data_tasks/19/default.jsonl # all_data_tasks/2/default.jsonl # all_data_tasks/20/default.jsonl # all_data_tasks/21/default.jsonl # all_data_tasks/22/default.jsonl # all_data_tasks/28/default.jsonl # all_data_tasks/29/default.jsonl # all_data_tasks/3/default.jsonl # all_data_tasks/30/default.jsonl # all_data_tasks/31/default.jsonl # all_data_tasks/32/default.jsonl # all_data_tasks/34/default.jsonl # all_data_tasks/35/default.jsonl # all_data_tasks/4/default.jsonl # all_data_tasks/5/default.jsonl # all_data_tasks/6/default.jsonl # all_data_tasks/8/default.jsonl # all_data_tasks/9/default.jsonl # boards_data/en/data_overall/default.jsonl # boards_data/en/data_tasks/Classification/default.jsonl # boards_data/en/data_tasks/Clustering/default.jsonl # boards_data/en/data_tasks/PairClassification/default.jsonl # boards_data/en/data_tasks/Reranking/default.jsonl # boards_data/en/data_tasks/Retrieval/default.jsonl # boards_data/en/data_tasks/STS/default.jsonl # boards_data/en/data_tasks/Summarization/default.jsonl # boards_data/fr/data_overall/default.jsonl # boards_data/fr/data_tasks/Classification/default.jsonl # boards_data/fr/data_tasks/Clustering/default.jsonl # boards_data/fr/data_tasks/PairClassification/default.jsonl # boards_data/fr/data_tasks/Reranking/default.jsonl # boards_data/fr/data_tasks/Retrieval/default.jsonl # boards_data/fr/data_tasks/STS/default.jsonl # boards_data/fr/data_tasks/Summarization/default.jsonl # boards_data/other-cls/data_tasks/Classification/default.jsonl # boards_data/other-sts/data_tasks/STS/default.jsonl # boards_data/pl/data_overall/default.jsonl # boards_data/pl/data_tasks/Classification/default.jsonl # boards_data/pl/data_tasks/Clustering/default.jsonl # boards_data/pl/data_tasks/PairClassification/default.jsonl # boards_data/pl/data_tasks/Retrieval/default.jsonl # boards_data/pl/data_tasks/STS/default.jsonl # boards_data/zh/data_overall/default.jsonl # boards_data/zh/data_tasks/Classification/default.jsonl # boards_data/zh/data_tasks/Clustering/default.jsonl # boards_data/zh/data_tasks/PairClassification/default.jsonl # boards_data/zh/data_tasks/Reranking/default.jsonl # boards_data/zh/data_tasks/Retrieval/default.jsonl # boards_data/zh/data_tasks/STS/default.jsonl # model_meta.yaml

# Conflicts: # EXTERNAL_MODEL_RESULTS.json # all_data_tasks/0/default.jsonl # all_data_tasks/1/default.jsonl # all_data_tasks/10/default.jsonl # all_data_tasks/11/default.jsonl # all_data_tasks/12/default.jsonl # all_data_tasks/13/default.jsonl # all_data_tasks/14/default.jsonl # all_data_tasks/15/default.jsonl # all_data_tasks/16/default.jsonl # all_data_tasks/17/default.jsonl # all_data_tasks/18/default.jsonl # all_data_tasks/19/default.jsonl # all_data_tasks/2/default.jsonl # all_data_tasks/20/default.jsonl # all_data_tasks/21/default.jsonl # all_data_tasks/22/default.jsonl # all_data_tasks/23/default.jsonl # all_data_tasks/25/default.jsonl # all_data_tasks/26/default.jsonl # all_data_tasks/28/default.jsonl # all_data_tasks/29/default.jsonl # all_data_tasks/3/default.jsonl # all_data_tasks/30/default.jsonl # all_data_tasks/31/default.jsonl # all_data_tasks/32/default.jsonl # all_data_tasks/33/default.jsonl # all_data_tasks/35/default.jsonl # all_data_tasks/36/default.jsonl # all_data_tasks/4/default.jsonl # all_data_tasks/5/default.jsonl # all_data_tasks/6/default.jsonl # all_data_tasks/8/default.jsonl # all_data_tasks/9/default.jsonl # boards_data/da/data_tasks/BitextMining/default.jsonl # boards_data/da/data_tasks/Classification/default.jsonl # boards_data/en/data_overall/default.jsonl # boards_data/en/data_tasks/Classification/default.jsonl # boards_data/en/data_tasks/Clustering/default.jsonl # boards_data/en/data_tasks/PairClassification/default.jsonl # boards_data/en/data_tasks/Reranking/default.jsonl # boards_data/en/data_tasks/Retrieval/default.jsonl # boards_data/en/data_tasks/STS/default.jsonl # boards_data/en/data_tasks/Summarization/default.jsonl # boards_data/fr/data_overall/default.jsonl # boards_data/fr/data_tasks/Classification/default.jsonl # boards_data/fr/data_tasks/Clustering/default.jsonl # boards_data/fr/data_tasks/PairClassification/default.jsonl # boards_data/fr/data_tasks/Reranking/default.jsonl # boards_data/fr/data_tasks/Retrieval/default.jsonl # boards_data/fr/data_tasks/STS/default.jsonl # boards_data/fr/data_tasks/Summarization/default.jsonl # boards_data/law/data_tasks/Retrieval/default.jsonl # boards_data/longembed/data_tasks/Retrieval/default.jsonl # boards_data/no/data_tasks/Classification/default.jsonl # boards_data/other-sts/data_tasks/STS/default.jsonl # boards_data/pl/data_overall/default.jsonl # boards_data/pl/data_tasks/Classification/default.jsonl # boards_data/pl/data_tasks/Clustering/default.jsonl # boards_data/pl/data_tasks/PairClassification/default.jsonl # boards_data/pl/data_tasks/Retrieval/default.jsonl # boards_data/pl/data_tasks/STS/default.jsonl # boards_data/rar-b/data_tasks/Retrieval/default.jsonl # boards_data/se/data_tasks/Classification/default.jsonl # boards_data/zh/data_overall/default.jsonl # boards_data/zh/data_tasks/Classification/default.jsonl # boards_data/zh/data_tasks/Clustering/default.jsonl # boards_data/zh/data_tasks/PairClassification/default.jsonl # boards_data/zh/data_tasks/Reranking/default.jsonl # boards_data/zh/data_tasks/Retrieval/default.jsonl # boards_data/zh/data_tasks/STS/default.jsonl

# Conflicts: # EXTERNAL_MODEL_RESULTS.json # all_data_tasks/0/default.jsonl # all_data_tasks/1/default.jsonl # all_data_tasks/10/default.jsonl # all_data_tasks/11/default.jsonl # all_data_tasks/12/default.jsonl # all_data_tasks/13/default.jsonl # all_data_tasks/15/default.jsonl # all_data_tasks/16/default.jsonl # all_data_tasks/17/default.jsonl # all_data_tasks/18/default.jsonl # all_data_tasks/19/default.jsonl # all_data_tasks/2/default.jsonl # all_data_tasks/20/default.jsonl # all_data_tasks/21/default.jsonl # all_data_tasks/22/default.jsonl # all_data_tasks/23/default.jsonl # all_data_tasks/28/default.jsonl # all_data_tasks/29/default.jsonl # all_data_tasks/3/default.jsonl # all_data_tasks/30/default.jsonl # all_data_tasks/31/default.jsonl # all_data_tasks/32/default.jsonl # all_data_tasks/33/default.jsonl # all_data_tasks/34/default.jsonl # all_data_tasks/35/default.jsonl # all_data_tasks/36/default.jsonl # all_data_tasks/4/default.jsonl # all_data_tasks/5/default.jsonl # all_data_tasks/6/default.jsonl # all_data_tasks/8/default.jsonl # all_data_tasks/9/default.jsonl # boards_data/da/data_tasks/Classification/default.jsonl # boards_data/en/data_overall/default.jsonl # boards_data/en/data_tasks/Classification/default.jsonl # boards_data/en/data_tasks/Clustering/default.jsonl # boards_data/en/data_tasks/PairClassification/default.jsonl # boards_data/en/data_tasks/Reranking/default.jsonl # boards_data/en/data_tasks/Retrieval/default.jsonl # boards_data/en/data_tasks/STS/default.jsonl # boards_data/en/data_tasks/Summarization/default.jsonl # boards_data/fr/data_overall/default.jsonl # boards_data/fr/data_tasks/Classification/default.jsonl # boards_data/fr/data_tasks/Clustering/default.jsonl # boards_data/fr/data_tasks/PairClassification/default.jsonl # boards_data/fr/data_tasks/Reranking/default.jsonl # boards_data/fr/data_tasks/Retrieval/default.jsonl # boards_data/fr/data_tasks/STS/default.jsonl # boards_data/fr/data_tasks/Summarization/default.jsonl # boards_data/no/data_tasks/Classification/default.jsonl # boards_data/other-cls/data_tasks/Classification/default.jsonl # boards_data/other-sts/data_tasks/STS/default.jsonl # boards_data/pl/data_overall/default.jsonl # boards_data/pl/data_tasks/Classification/default.jsonl # boards_data/pl/data_tasks/Clustering/default.jsonl # boards_data/pl/data_tasks/PairClassification/default.jsonl # boards_data/pl/data_tasks/Retrieval/default.jsonl # boards_data/pl/data_tasks/STS/default.jsonl # boards_data/rar-b/data_tasks/Retrieval/default.jsonl # boards_data/se/data_tasks/Classification/default.jsonl # boards_data/zh/data_overall/default.jsonl # boards_data/zh/data_tasks/Classification/default.jsonl # boards_data/zh/data_tasks/Clustering/default.jsonl # boards_data/zh/data_tasks/PairClassification/default.jsonl # boards_data/zh/data_tasks/Reranking/default.jsonl # boards_data/zh/data_tasks/Retrieval/default.jsonl # boards_data/zh/data_tasks/STS/default.jsonl

Samoed · 2024-08-06T08:23:07Z

@KennethEnevoldsen @Muennighoff Can you take a look at PR, please?

KennethEnevoldsen

Only minor changes otherwise I believe it looks reasonable.

KennethEnevoldsen · 2024-08-06T09:56:43Z

all_data_tasks/0/default.jsonl

There should be no need to change these files (it is done during the CI). Would avoid pushing them

I'll merge them after leaderboard update. I was checking how everything was working

KennethEnevoldsen · 2024-08-06T13:58:13Z

@Muennighoff will you have the time to review this as well to ensure that we don't break the leaderboard?

Samoed added 2 commits July 28, 2024 23:58

add russian leaderboard

804b114

Merge branch 'refs/heads/main' into add_rusian_models

ed38465

# Conflicts: # all_data_tasks/0/default.jsonl # all_data_tasks/1/default.jsonl # all_data_tasks/2/default.jsonl # all_data_tasks/3/default.jsonl # all_data_tasks/4/default.jsonl # all_data_tasks/5/default.jsonl # refresh.py

This was referenced Jul 28, 2024

HF Space avidale/encodechka#10

Closed

Removed debug code in refresh.py intended to only update one board #20

Merged

Samoed and others added 5 commits July 29, 2024 02:58

fix french datasets

006466a

change to hf config

162510c

update all data

b23830c

fix bge-m3 model size

27a30e1

Update conf

735975d

Muennighoff requested changes Jul 29, 2024

View reviewed changes

KennethEnevoldsen approved these changes Jul 29, 2024

View reviewed changes

KennethEnevoldsen requested changes Jul 29, 2024

View reviewed changes

Samoed requested review from Muennighoff and KennethEnevoldsen July 29, 2024 18:33

Samoed added 5 commits July 29, 2024 22:02

fix model config names

e6b79bf

upd

e5d84b5

KennethEnevoldsen changed the title ~~Add rusian models~~ fix: Add Russian models Aug 6, 2024

KennethEnevoldsen approved these changes Aug 6, 2024

View reviewed changes

Refresh

fd4f5be

Muennighoff approved these changes Aug 6, 2024

View reviewed changes

Muennighoff merged commit 2461f1b into embeddings-benchmark:main Aug 6, 2024
1 check passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fix: Add Russian models #21

fix: Add Russian models #21

Samoed commented Jul 28, 2024 •

edited

Loading

Muennighoff left a comment

KennethEnevoldsen left a comment •

edited

Loading

KennethEnevoldsen Jul 29, 2024

Samoed Jul 29, 2024 •

edited

Loading

KennethEnevoldsen Jul 29, 2024

Samoed Jul 29, 2024 •

edited

Loading

KennethEnevoldsen Jul 29, 2024

Samoed Jul 29, 2024

KennethEnevoldsen Jul 29, 2024

KennethEnevoldsen Jul 29, 2024

KennethEnevoldsen Jul 29, 2024

Samoed Jul 29, 2024 •

edited

Loading

KennethEnevoldsen Jul 29, 2024

Samoed Jul 29, 2024

KennethEnevoldsen Jul 29, 2024

Samoed commented Aug 6, 2024

KennethEnevoldsen left a comment

KennethEnevoldsen Aug 6, 2024

Samoed Aug 6, 2024

KennethEnevoldsen commented Aug 6, 2024

fix: Add Russian models #21

fix: Add Russian models #21

Conversation

Samoed commented Jul 28, 2024 • edited Loading

Muennighoff left a comment

Choose a reason for hiding this comment

KennethEnevoldsen left a comment • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Samoed Jul 29, 2024 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Samoed Jul 29, 2024 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Samoed Jul 29, 2024 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Samoed commented Aug 6, 2024

KennethEnevoldsen left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

KennethEnevoldsen commented Aug 6, 2024

Samoed commented Jul 28, 2024 •

edited

Loading

KennethEnevoldsen left a comment •

edited

Loading

Samoed Jul 29, 2024 •

edited

Loading

Samoed Jul 29, 2024 •

edited

Loading

Samoed Jul 29, 2024 •

edited

Loading