एमएसएलआर_वेब

  • विवरण :

MSLR-WEB Microsoft रिसर्च द्वारा जारी किए गए दो बड़े पैमाने के लर्निंग-टू-रैंक डेटासेट हैं। पहले डेटासेट ("30k" कहा जाता है) में 30,000 प्रश्न हैं और दूसरे डेटासेट ("10k" कहा जाता है) में 10,000 प्रश्न हैं। प्रत्येक डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जिन्हें फीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाया जाता है।

आप निर्दिष्ट कर सकते हैं कि डेटासेट के "10k" या "30k" संस्करण का उपयोग करना है या नहीं, और एक संबंधित फोल्ड निम्नानुसार है:

ds = tfds.load("mslr_web/30k_fold1")

यदि केवल mslr_web निर्दिष्ट है, तो mslr_web/10k_fold1 विकल्प डिफ़ॉल्ट रूप से चुना जाता है:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
doc_id टेन्सर (कोई भी नहीं,) int64
फ्लोट_फीचर्स टेन्सर (कोई नहीं, 136) फ्लोट64
लेबल टेन्सर (कोई भी नहीं,) फ्लोट64
query_id लेख डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डाउनलोड आकार : 1.15 GiB

  • डेटासेट का आकार : 310.08 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000
'train' 6,000
'vali' 2,000

एमएसएलआर_वेब/10k_fold2

  • डाउनलोड आकार : 1.15 GiB

  • डेटासेट का आकार : 310.08 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000
'train' 6,000
'vali' 2,000

एमएसएलआर_वेब/10k_fold3

  • डाउनलोड आकार : 1.15 GiB

  • डेटासेट का आकार : 310.08 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000
'train' 6,000
'vali' 2,000

एमएसएलआर_वेब/10k_fold4

  • डाउनलोड आकार : 1.15 GiB

  • डेटासेट का आकार : 310.08 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000
'train' 6,000
'vali' 2,000

एमएसएलआर_वेब/10k_fold5

  • डाउनलोड आकार : 1.15 GiB

  • डेटासेट का आकार : 310.08 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000
'train' 6,000
'vali' 2,000

एमएसएलआर_वेब/30k_fold1

  • डाउनलोड आकार : 3.59 GiB

  • डेटासेट का आकार : 964.09 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,306
'train' 18,919
'vali' 6,306

एमएसएलआर_वेब/30k_fold2

  • डाउनलोड आकार : 3.59 GiB

  • डेटासेट का आकार : 964.09 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,307
'train' 18,918
'vali' 6,306

एमएसएलआर_वेब/30k_fold3

  • डाउनलोड आकार : 3.59 GiB

  • डेटासेट का आकार : 964.09 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,306
'train' 18,918
'vali' 6,307

एमएसएलआर_वेब/30k_fold4

  • डाउनलोड आकार : 3.59 GiB

  • डेटासेट का आकार : 964.09 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,306
'train' 18,919
'vali' 6,306

एमएसएलआर_वेब/30k_fold5

  • डाउनलोड आकार : 3.59 GiB

  • डेटासेट का आकार : 964.09 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,306
'train' 18,919
'vali' 6,306