- opis :
BEIR to heterogeniczny test porównawczy zawierający różnorodne zadania IR. Zapewnia również wspólne i łatwe ramy do oceny modeli wyszukiwania opartych na NLP w ramach testu porównawczego.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/beir-cellar/beir
Kod źródłowy :
tfds.datasets.beir.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Struktura funkcji :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
'passage_id': Text(shape=(), dtype=string),
'passage_metadata': Text(shape=(), dtype=string),
'query': Text(shape=(), dtype=string),
'query_id': Text(shape=(), dtype=string),
'query_metadata': Text(shape=(), dtype=string),
'score': float32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
przejście | Tekst | strunowy | ||
identyfikator_przejścia | Tekst | strunowy | ||
przejście_metadane | Tekst | strunowy | ||
zapytanie | Tekst | strunowy | ||
identyfikator_zapytania | Tekst | strunowy | ||
metadane_zapytania | Tekst | strunowy | ||
wynik | Napinacz | pływak32 |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{
thakur2021beir,
title={ {BEIR}: A Heterogeneous Benchmark for Zero-shot Evaluation of Information Retrieval Models},
author={Nandan Thakur and Nils Reimers and Andreas R{"u}ckl{'e} and Abhishek Srivastava and Iryna Gurevych},
booktitle={Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 2)},
year={2021},
url={https://openreview.net/forum?id=wCu6T5xFjeJ}
}
beir/msmarco (domyślna konfiguracja)
Rozmiar pliku do pobrania :
1.01 GiB
Rozmiar zestawu danych :
4.53 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 8841823 |
'query' | 509 962 |
'test' | 9139 |
'train' | 516472 |
'validation' | 7433 |
- Przykłady ( tfds.as_dataframe ):
beir/trec_covid
Rozmiar pliku do pobrania :
70.45 MiB
Rozmiar zestawu danych :
292.04 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 171332 |
'query' | 50 |
'test' | 35480 |
- Przykłady ( tfds.as_dataframe ):
beir/nfcorpus
Rozmiar pliku do pobrania :
2.34 MiB
Rozmiar zestawu danych :
24.94 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 3633 |
'query' | 3237 |
'test' | 3128 |
'train' | 3588 |
'validation' | 3119 |
- Przykłady ( tfds.as_dataframe ):
beir/nq
Rozmiar pliku do pobrania :
475.22 MiB
Rozmiar zestawu danych :
1.66 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 2 681 468 |
'query' | 3452 |
'test' | 4201 |
- Przykłady ( tfds.as_dataframe ):
beir/hotpotqa
Rozmiar pliku do pobrania :
623.73 MiB
Rozmiar zestawu danych :
2.64 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 5 233 329 |
'query' | 97 852 |
'test' | 13783 |
'train' | 101307 |
'validation' | 10335 |
- Przykłady ( tfds.as_dataframe ):
beir/fiqa
Rozmiar pliku do pobrania :
17.12 MiB
Rozmiar zestawu danych :
73.39 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 57638 |
'query' | 6648 |
'test' | 1706 |
'train' | 14166 |
'validation' | 1238 |
- Przykłady ( tfds.as_dataframe ):
piwo/arguana
Rozmiar pliku do pobrania :
3.60 MiB
Rozmiar zestawu danych :
15.08 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 8674 |
'query' | 1406 |
'test' | 1401 |
- Przykłady ( tfds.as_dataframe ):
beir/webis_touche2020
Rozmiar pliku do pobrania :
216.61 MiB
Rozmiar zbioru danych :
747.57 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 382545 |
'query' | 49 |
'test' | 2099 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.android
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
883.49 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 22 998 |
'query' | 699 |
'test' | 1696 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.angielski
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
3.78 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 40221 |
'query' | 1570 |
'test' | 3765 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.gaming
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
2.64 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 45301 |
'query' | 1595 |
'test' | 2263 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.gis
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
1.47 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 37637 |
'query' | 885 |
'test' | 1114 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.mathematica
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
1.58 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 16705 |
'query' | 804 |
'test' | 1358 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.physics
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
2.02 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 38316 |
'query' | 1039 |
'test' | 1933 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.programmers
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
2.14 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 32176 |
'query' | 876 |
'test' | 1675 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.stats
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zbioru danych :
941.07 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 42269 |
'query' | 652 |
'test' | 913 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.tex
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
21.75 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 68184 |
'query' | 2906 |
'test' | 5154 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.unix
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
2.04 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 47382 |
'query' | 1072 |
'test' | 1693 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.webmasterzy
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
650.08 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 17405 |
'query' | 506 |
'test' | 1395 |
- Przykłady ( tfds.as_dataframe ):
beir/cqadupstack.wordpress
Rozmiar pliku do pobrania :
4.98 GiB
Rozmiar zestawu danych :
726.15 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 48605 |
'query' | 541 |
'test' | 744 |
- Przykłady ( tfds.as_dataframe ):
beir/quora
Rozmiar pliku do pobrania :
15.12 MiB
Rozmiar zestawu danych :
121.33 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 522 931 |
'query' | 15 000 |
'test' | 15675 |
'validation' | 7626 |
- Przykłady ( tfds.as_dataframe ):
beir/dbpedia_entity
Rozmiar pliku do pobrania :
609.67 MiB
Rozmiar zestawu danych :
2.47 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 4 635 922 |
'query' | 467 |
'test' | 40724 |
'validation' | 5658 |
- Przykłady ( tfds.as_dataframe ):
beir/scidocs
Rozmiar pliku do pobrania :
135.87 MiB
Rozmiar zbioru danych :
573.04 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 25657 |
'query' | 1000 |
'test' | 25657 |
- Przykłady ( tfds.as_dataframe ):
beir/gorączka
Rozmiar pliku do pobrania :
1.15 GiB
Rozmiar zestawu danych :
3.70 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 5 416 568 |
'query' | 123142 |
'test' | 1499 |
'train' | 12547 |
'validation' | 1460 |
- Przykłady ( tfds.as_dataframe ):
beir/climate_fever
Rozmiar pliku do pobrania :
1.14 GiB
Rozmiar zestawu danych :
3.64 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 5 416 593 |
'query' | 1535 |
'test' | 1344 |
- Przykłady ( tfds.as_dataframe ):
beir/scifact
Rozmiar pliku do pobrania :
2.69 MiB
Rozmiar zestawu danych :
10.16 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'passage' | 5183 |
'query' | 1109 |
'test' | 283 |
'train' | 565 |
- Przykłady ( tfds.as_dataframe ):