- Descrizione :
MSLR-WEB sono due set di dati Learning-to-Rank su larga scala rilasciati da Microsoft Research. Il primo set di dati (denominato "30k") contiene 30.000 query e il secondo set di dati (denominato "10k") contiene 10.000 query. Ogni set di dati è costituito da coppie query-documento rappresentate come vettori di caratteristiche e corrispondenti etichette di giudizio di pertinenza.
È possibile specificare se utilizzare la versione "10k" o "30k" del set di dati e una piegatura corrispondente, come segue:
ds = tfds.load("mslr_web/30k_fold1")
Se viene specificato solo mslr_web
, l'opzione mslr_web/10k_fold1
è selezionata per impostazione predefinita:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
Pagina iniziale : https://www.microsoft.com/en-us/research/project/mslr/
Codice sorgente :
tfds.ranking.mslr_web.MslrWeb
Versioni :
-
1.0.0
: Versione iniziale. -
1.1.0
: raggruppa le funzionalità in un'unica funzionalità "float_features". -
1.2.0
(predefinito): aggiungere identificatori di query e documento.
-
Cache automatica ( documentazione ): No
Struttura delle caratteristiche :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
doc_id | Tensore | (Nessuno,) | int64 | |
float_features | Tensore | (Nessuno, 136) | galleggiante64 | |
etichetta | Tensore | (Nessuno,) | galleggiante64 | |
query_id | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (configurazione predefinita)
Dimensione del download :
1.15 GiB
Dimensione del set di dati:
310.08 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Esempi ( tfds.as_dataframe ):
mslr_web/10k_fold2
Dimensione del download :
1.15 GiB
Dimensione del set di dati:
310.08 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Esempi ( tfds.as_dataframe ):
mslr_web/10k_fold3
Dimensione del download :
1.15 GiB
Dimensione del set di dati:
310.08 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Esempi ( tfds.as_dataframe ):
mslr_web/10k_fold4
Dimensione del download :
1.15 GiB
Dimensione del set di dati:
310.08 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Esempi ( tfds.as_dataframe ):
mslr_web/10k_fold5
Dimensione del download :
1.15 GiB
Dimensione del set di dati:
310.08 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Esempi ( tfds.as_dataframe ):
mslr_web/30k_fold1
Dimensione del download :
3.59 GiB
Dimensione del set di dati:
964.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Esempi ( tfds.as_dataframe ):
mslr_web/30k_fold2
Dimensione del download :
3.59 GiB
Dimensione del set di dati:
964.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 6.307 |
'train' | 18.918 |
'vali' | 6.306 |
- Esempi ( tfds.as_dataframe ):
mslr_web/30k_fold3
Dimensione del download :
3.59 GiB
Dimensione del set di dati:
964.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 6.306 |
'train' | 18.918 |
'vali' | 6.307 |
- Esempi ( tfds.as_dataframe ):
mslr_web/30k_fold4
Dimensione del download :
3.59 GiB
Dimensione del set di dati:
964.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Esempi ( tfds.as_dataframe ):
mslr_web/30k_fold5
Dimensione del download :
3.59 GiB
Dimensione del set di dati:
964.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Esempi ( tfds.as_dataframe ):