- Descrizione :
BEIR è un benchmark eterogeneo contenente diverse attività IR. Fornisce inoltre un quadro comune e semplice per la valutazione dei modelli di recupero basati sulla PNL all'interno del benchmark.
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://github.com/beir-cellar/beir
Codice sorgente :
tfds.datasets.beir.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Struttura delle caratteristiche :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
'passage_id': Text(shape=(), dtype=string),
'passage_metadata': Text(shape=(), dtype=string),
'query': Text(shape=(), dtype=string),
'query_id': Text(shape=(), dtype=string),
'query_metadata': Text(shape=(), dtype=string),
'score': float32,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
passaggio | Testo | corda | ||
ID_passaggio | Testo | corda | ||
metadati_passaggio | Testo | corda | ||
domanda | Testo | corda | ||
query_id | Testo | corda | ||
query_metadati | Testo | corda | ||
punto | Tensore | galleggiante32 |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@inproceedings{
thakur2021beir,
title={ {BEIR}: A Heterogeneous Benchmark for Zero-shot Evaluation of Information Retrieval Models},
author={Nandan Thakur and Nils Reimers and Andreas R{"u}ckl{'e} and Abhishek Srivastava and Iryna Gurevych},
booktitle={Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 2)},
year={2021},
url={https://openreview.net/forum?id=wCu6T5xFjeJ}
}
beir/msmarco (configurazione predefinita)
Dimensione del download :
1.01 GiB
Dimensione del set di dati:
4.53 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 8.841.823 |
'query' | 509.962 |
'test' | 9.139 |
'train' | 516.472 |
'validation' | 7.433 |
- Esempi ( tfds.as_dataframe ):
beir/trec_covid
Dimensione del download :
70.45 MiB
Dimensione del set di dati:
292.04 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 171.332 |
'query' | 50 |
'test' | 35.480 |
- Esempi ( tfds.as_dataframe ):
beir/nfcorpus
Dimensione del download :
2.34 MiB
Dimensione del set di dati:
24.94 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 3.633 |
'query' | 3.237 |
'test' | 3.128 |
'train' | 3.588 |
'validation' | 3.119 |
- Esempi ( tfds.as_dataframe ):
birra/nq
Dimensione del download :
475.22 MiB
Dimensione del set di dati :
1.66 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 2.681.468 |
'query' | 3.452 |
'test' | 4.201 |
- Esempi ( tfds.as_dataframe ):
birra/hotpotqa
Dimensione del download :
623.73 MiB
Dimensione del set di dati:
2.64 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 5.233.329 |
'query' | 97.852 |
'test' | 13.783 |
'train' | 101,307 |
'validation' | 10.335 |
- Esempi ( tfds.as_dataframe ):
birra/fiqa
Dimensione del download :
17.12 MiB
Dimensione del set di dati:
73.39 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 57.638 |
'query' | 6.648 |
'test' | 1.706 |
'train' | 14.166 |
'validation' | 1.238 |
- Esempi ( tfds.as_dataframe ):
birra/arguana
Dimensione del download :
3.60 MiB
Dimensione del set di dati:
15.08 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 8.674 |
'query' | 1.406 |
'test' | 1.401 |
- Esempi ( tfds.as_dataframe ):
beir/webis_touche2020
Dimensione del download :
216.61 MiB
Dimensione del set di dati:
747.57 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 382.545 |
'query' | 49 |
'test' | 2.099 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.android
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
883.49 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 22.998 |
'query' | 699 |
'test' | 1.696 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.english
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
3.78 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 40.221 |
'query' | 1.570 |
'test' | 3.765 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.gaming
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
2.64 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 45.301 |
'query' | 1.595 |
'test' | 2.263 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.gis
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
1.47 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 37.637 |
'query' | 885 |
'test' | 1.114 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.mathematica
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
1.58 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 16.705 |
'query' | 804 |
'test' | 1.358 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.physics
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
2.02 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 38.316 |
'query' | 1.039 |
'test' | 1.933 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.programmers
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
2.14 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 32.176 |
'query' | 876 |
'test' | 1.675 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.stats
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
941.07 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 42.269 |
'query' | 652 |
'test' | 913 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.tex
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
21.75 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 68.184 |
'query' | 2.906 |
'test' | 5.154 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.unix
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
2.04 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 47.382 |
'query' | 1.072 |
'test' | 1.693 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.webmasters
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
650.08 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 17.405 |
'query' | 506 |
'test' | 1.395 |
- Esempi ( tfds.as_dataframe ):
beir/cqadupstack.wordpress
Dimensioni del download :
4.98 GiB
Dimensione del set di dati:
726.15 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 48.605 |
'query' | 541 |
'test' | 744 |
- Esempi ( tfds.as_dataframe ):
birra/quora
Dimensione del download :
15.12 MiB
Dimensione del set di dati:
121.33 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 522.931 |
'query' | 15.000 |
'test' | 15.675 |
'validation' | 7.626 |
- Esempi ( tfds.as_dataframe ):
beir/dbpedia_entity
Dimensione del download :
609.67 MiB
Dimensione del set di dati:
2.47 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 4.635.922 |
'query' | 467 |
'test' | 40.724 |
'validation' | 5.658 |
- Esempi ( tfds.as_dataframe ):
birra/scidocs
Dimensione del download :
135.87 MiB
Dimensione del set di dati:
573.04 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 25.657 |
'query' | 1.000 |
'test' | 25.657 |
- Esempi ( tfds.as_dataframe ):
birra/febbre
Dimensione del download :
1.15 GiB
Dimensione del set di dati:
3.70 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 5.416.568 |
'query' | 123,142 |
'test' | 1.499 |
'train' | 12.547 |
'validation' | 1.460 |
- Esempi ( tfds.as_dataframe ):
beir/clima_febbre
Dimensione del download :
1.14 GiB
Dimensione del set di dati:
3.64 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 5.416.593 |
'query' | 1.535 |
'test' | 1.344 |
- Esempi ( tfds.as_dataframe ):
beir/scifatto
Dimensione del download :
2.69 MiB
Dimensione del set di dati:
10.16 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'passage' | 5.183 |
'query' | 1.109 |
'test' | 283 |
'train' | 565 |
- Esempi ( tfds.as_dataframe ):