- विवरण :
MSLR-WEB Microsoft रिसर्च द्वारा जारी किए गए दो बड़े पैमाने के लर्निंग-टू-रैंक डेटासेट हैं। पहले डेटासेट ("30k" कहा जाता है) में 30,000 प्रश्न हैं और दूसरे डेटासेट ("10k" कहा जाता है) में 10,000 प्रश्न हैं। प्रत्येक डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जिन्हें फीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाया जाता है।
आप निर्दिष्ट कर सकते हैं कि डेटासेट के "10k" या "30k" संस्करण का उपयोग करना है या नहीं, और एक संबंधित फोल्ड निम्नानुसार है:
ds = tfds.load("mslr_web/30k_fold1")
यदि केवल mslr_web
निर्दिष्ट है, तो mslr_web/10k_fold1
विकल्प डिफ़ॉल्ट रूप से चुना जाता है:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
होमपेज : https://www.microsoft.com/en-us/research/project/mslr/
स्रोत कोड :
tfds.ranking.mslr_web.MslrWeb
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
1.1.0
: फीचरों को एक 'फ्लोट_फीचर्स' फीचर में बंडल करें। -
1.2.0
(डिफ़ॉल्ट): क्वेरी और दस्तावेज़ पहचानकर्ता जोड़ें।
-
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
फ़ीचर संरचना :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
doc_id | टेन्सर | (कोई भी नहीं,) | int64 | |
फ्लोट_फीचर्स | टेन्सर | (कोई नहीं, 136) | फ्लोट64 | |
लेबल | टेन्सर | (कोई भी नहीं,) | फ्लोट64 | |
query_id | लेख | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
डाउनलोड आकार :
1.15 GiB
डेटासेट का आकार :
310.08 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/10k_fold2
डाउनलोड आकार :
1.15 GiB
डेटासेट का आकार :
310.08 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/10k_fold3
डाउनलोड आकार :
1.15 GiB
डेटासेट का आकार :
310.08 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/10k_fold4
डाउनलोड आकार :
1.15 GiB
डेटासेट का आकार :
310.08 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/10k_fold5
डाउनलोड आकार :
1.15 GiB
डेटासेट का आकार :
310.08 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/30k_fold1
डाउनलोड आकार :
3.59 GiB
डेटासेट का आकार :
964.09 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/30k_fold2
डाउनलोड आकार :
3.59 GiB
डेटासेट का आकार :
964.09 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,307 |
'train' | 18,918 |
'vali' | 6,306 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/30k_fold3
डाउनलोड आकार :
3.59 GiB
डेटासेट का आकार :
964.09 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,306 |
'train' | 18,918 |
'vali' | 6,307 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/30k_fold4
डाउनलोड आकार :
3.59 GiB
डेटासेट का आकार :
964.09 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- उदाहरण ( tfds.as_dataframe ):
एमएसएलआर_वेब/30k_fold5
डाउनलोड आकार :
3.59 GiB
डेटासेट का आकार :
964.09 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- उदाहरण ( tfds.as_dataframe ):