mslr_web

  • opis :

MSLR-WEB to dwa wielkoskalowe zestawy danych Learning-to-Rank wydane przez Microsoft Research. Pierwszy zestaw danych (o nazwie „30 000”) zawiera 30 000 zapytań, a drugi zestaw danych (o nazwie „10 000”) zawiera 10 000 zapytań. Każdy zestaw danych składa się z par zapytanie-dokument reprezentowanych jako wektory cech i odpowiadające im etykiety oceny istotności.

Możesz określić, czy chcesz użyć wersji zestawu danych „10 000” czy „30 000” i odpowiedniego zwinięcia w następujący sposób:

ds = tfds.load("mslr_web/30k_fold1")

Jeśli określono tylko mslr_web , opcja mslr_web/10k_fold1 jest wybrana domyślnie:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
identyfikator_dokumentu Napinacz (Nic,) int64
float_features Napinacz (Brak, 136) pływak64
etykieta Napinacz (Nic,) pływak64
identyfikator_zapytania Tekst strunowy
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (domyślna konfiguracja)

  • Rozmiar pliku do pobrania : 1.15 GiB

  • Rozmiar zestawu danych : 310.08 MiB

  • Podziały :

Podział Przykłady
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold2

  • Rozmiar pliku do pobrania : 1.15 GiB

  • Rozmiar zestawu danych : 310.08 MiB

  • Podziały :

Podział Przykłady
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold3

  • Rozmiar pliku do pobrania : 1.15 GiB

  • Rozmiar zestawu danych : 310.08 MiB

  • Podziały :

Podział Przykłady
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold4

  • Rozmiar pliku do pobrania : 1.15 GiB

  • Rozmiar zestawu danych : 310.08 MiB

  • Podziały :

Podział Przykłady
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold5

  • Rozmiar pliku do pobrania : 1.15 GiB

  • Rozmiar zestawu danych : 310.08 MiB

  • Podziały :

Podział Przykłady
'test' 2000
'train' 6000
'vali' 2000

mslr_web/30k_fold1

  • Rozmiar pliku do pobrania : 3.59 GiB

  • Rozmiar zbioru danych : 964.09 MiB

  • Podziały :

Podział Przykłady
'test' 6306
'train' 18919
'vali' 6306

mslr_web/30k_fold2

  • Rozmiar pliku do pobrania : 3.59 GiB

  • Rozmiar zbioru danych : 964.09 MiB

  • Podziały :

Podział Przykłady
'test' 6307
'train' 18918
'vali' 6306

mslr_web/30k_fold3

  • Rozmiar pliku do pobrania : 3.59 GiB

  • Rozmiar zbioru danych : 964.09 MiB

  • Podziały :

Podział Przykłady
'test' 6306
'train' 18918
'vali' 6307

mslr_web/30k_fold4

  • Rozmiar pliku do pobrania : 3.59 GiB

  • Rozmiar zbioru danych : 964.09 MiB

  • Podziały :

Podział Przykłady
'test' 6306
'train' 18919
'vali' 6306

mslr_web/30k_fold5

  • Rozmiar pliku do pobrania : 3.59 GiB

  • Rozmiar zbioru danych : 964.09 MiB

  • Podziały :

Podział Przykłady
'test' 6306
'train' 18919
'vali' 6306