- विवरण :
Yahoo Learning to Rank Challenge डेटासेट (जिसे "C14" भी कहा जाता है) Yahoo द्वारा जारी किया गया एक लर्निंग-टू-रैंक डेटासेट है। डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जो फ़ीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाए जाते हैं।
डेटासेट में दो संस्करण होते हैं:
- सेट 1:
set1
क्वेरी-दस्तावेज़ जोड़े शामिल हैं। - सेट 2:
set2
क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
आप इस प्रकार निर्दिष्ट कर सकते हैं कि set1
के सेट1 या set2
संस्करण का उपयोग करना है या नहीं:
ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")
यदि केवल yahoo_ltrc
निर्दिष्ट किया गया है, तो yahoo_ltrc/set1
विकल्प डिफ़ॉल्ट रूप से चुना जाता है:
# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
होमपेज : https://research.yahoo.com/datasets
स्रोत कोड :
tfds.ranking.yahoo_ltrc.YahooLTRC
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
1.1.0
(डिफ़ॉल्ट): क्वेरी और दस्तावेज़ पहचानकर्ता जोड़ें।
-
डाउनलोड आकार :
Unknown size
मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir
(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/
) में डाउनलोड करना होगा:
https://research.yahoo.com/datasets पर C14 Yahoo Learning To Rank Challenge डेटासेट के लिए एक्सेस का अनुरोध करें डाउनलोड की गई डेटासेट.ltrc_yahoo.tar.bz2
dataset.tgz
कोmanual_dir/
में रखें।पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@inproceedings{chapelle2011yahoo,
title={Yahoo! learning to rank challenge overview},
author={Chapelle, Olivier and Chang, Yi},
booktitle={Proceedings of the learning to rank challenge},
pages={1--24},
year={2011},
organization={PMLR}
}
yahoo_ltrc/set1 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
डेटासेट का आकार :
795.39 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,983 |
'train' | 19,944 |
'vali' | 2,994 |
- फ़ीचर संरचना :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 699), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
doc_id | टेन्सर | (कोई भी नहीं,) | int64 | |
फ्लोट_फीचर्स | टेन्सर | (कोई नहीं, 699) | फ्लोट64 | |
लेबल | टेन्सर | (कोई भी नहीं,) | फ्लोट64 | |
query_id | लेख | डोरी |
- उदाहरण ( tfds.as_dataframe ):
याहू_एलटीआरसी/सेट2
डेटासेट का आकार :
194.92 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 3,798 |
'train' | 1,266 |
'vali' | 1,266 |
- फ़ीचर संरचना :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 700), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
doc_id | टेन्सर | (कोई भी नहीं,) | int64 | |
फ्लोट_फीचर्स | टेन्सर | (कोई नहीं, 700) | फ्लोट64 | |
लेबल | टेन्सर | (कोई भी नहीं,) | फ्लोट64 | |
query_id | लेख | डोरी |
- उदाहरण ( tfds.as_dataframe ):