mslr_web

  • Descrizione :

MSLR-WEB sono due set di dati Learning-to-Rank su larga scala rilasciati da Microsoft Research. Il primo set di dati (denominato "30k") contiene 30.000 query e il secondo set di dati (denominato "10k") contiene 10.000 query. Ogni set di dati è costituito da coppie query-documento rappresentate come vettori di caratteristiche e corrispondenti etichette di giudizio di pertinenza.

È possibile specificare se utilizzare la versione "10k" o "30k" del set di dati e una piegatura corrispondente, come segue:

ds = tfds.load("mslr_web/30k_fold1")

Se viene specificato solo mslr_web , l'opzione mslr_web/10k_fold1 è selezionata per impostazione predefinita:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
doc_id Tensore (Nessuno,) int64
float_features Tensore (Nessuno, 136) galleggiante64
etichetta Tensore (Nessuno,) galleggiante64
query_id Testo corda
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (configurazione predefinita)

  • Dimensione del download : 1.15 GiB

  • Dimensione del set di dati: 310.08 MiB

  • Divisioni :

Diviso Esempi
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold2

  • Dimensione del download : 1.15 GiB

  • Dimensione del set di dati: 310.08 MiB

  • Divisioni :

Diviso Esempi
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold3

  • Dimensione del download : 1.15 GiB

  • Dimensione del set di dati: 310.08 MiB

  • Divisioni :

Diviso Esempi
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold4

  • Dimensione del download : 1.15 GiB

  • Dimensione del set di dati: 310.08 MiB

  • Divisioni :

Diviso Esempi
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold5

  • Dimensione del download : 1.15 GiB

  • Dimensione del set di dati: 310.08 MiB

  • Divisioni :

Diviso Esempi
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/30k_fold1

  • Dimensione del download : 3.59 GiB

  • Dimensione del set di dati: 964.09 MiB

  • Divisioni :

Diviso Esempi
'test' 6.306
'train' 18.919
'vali' 6.306

mslr_web/30k_fold2

  • Dimensione del download : 3.59 GiB

  • Dimensione del set di dati: 964.09 MiB

  • Divisioni :

Diviso Esempi
'test' 6.307
'train' 18.918
'vali' 6.306

mslr_web/30k_fold3

  • Dimensione del download : 3.59 GiB

  • Dimensione del set di dati: 964.09 MiB

  • Divisioni :

Diviso Esempi
'test' 6.306
'train' 18.918
'vali' 6.307

mslr_web/30k_fold4

  • Dimensione del download : 3.59 GiB

  • Dimensione del set di dati: 964.09 MiB

  • Divisioni :

Diviso Esempi
'test' 6.306
'train' 18.919
'vali' 6.306

mslr_web/30k_fold5

  • Dimensione del download : 3.59 GiB

  • Dimensione del set di dati: 964.09 MiB

  • Divisioni :

Diviso Esempi
'test' 6.306
'train' 18.919
'vali' 6.306