- विवरण :
इस्तेला डेटासेट इस्टेला द्वारा जारी किए गए तीन बड़े पैमाने के लर्निंग-टू-रैंक डेटासेट हैं। प्रत्येक डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जिन्हें फीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाया जाता है।
डेटासेट में तीन संस्करण होते हैं:
-
main
("इस्तेला लेटर"): 10,454,629 क्वेरी-दस्तावेज़ जोड़े शामिल हैं। -
s
("इस्तेला-एस लेटोर"): 3,408,630 क्वेरी-दस्तावेज़ जोड़े शामिल हैं। -
x
("इस्तेला-एक्स लेटर"): 26,791,447 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
आप इस प्रकार निर्दिष्ट कर सकते हैं कि डेटासेट के main
, s
या x
संस्करण का उपयोग करना है या नहीं:
ds = tfds.load("istella/main")
ds = tfds.load("istella/s")
ds = tfds.load("istella/x")
यदि केवल istella
निर्दिष्ट है, istella/main
विकल्प डिफ़ॉल्ट रूप से चुना जाता है:
# This is the same as `tfds.load("istella/main")`
ds = tfds.load("istella")
स्रोत कोड :
tfds.ranking.istella.Istella
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
1.0.1
: फ्लोट64 का समर्थन करने के लिए क्रमबद्धता को ठीक करें। -
1.1.0
: फीचरों को एक 'फ्लोट_फीचर्स' फीचर में बंडल करें। -
1.2.0
(डिफ़ॉल्ट): क्वेरी और दस्तावेज़ पहचानकर्ता जोड़ें।
-
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
फ़ीचर संरचना :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 220), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
doc_id | टेन्सर | (कोई भी नहीं,) | int64 | |
फ्लोट_फीचर्स | टेन्सर | (कोई नहीं, 220) | फ्लोट64 | |
लेबल | टेन्सर | (कोई भी नहीं,) | फ्लोट64 | |
query_id | लेख | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{10.1145/2987380,
author = {Dato, Domenico and Lucchese, Claudio and Nardini, Franco Maria and Orlando, Salvatore and Perego, Raffaele and Tonellotto, Nicola and Venturini, Rossano},
title = {Fast Ranking with Additive Ensembles of Oblivious and Non-Oblivious Regression Trees},
year = {2016},
publisher = {ACM},
address = {New York, NY, USA},
volume = {35},
number = {2},
issn = {1046-8188},
url = {https://doi.org/10.1145/2987380},
doi = {10.1145/2987380},
journal = {ACM Transactions on Information Systems},
articleno = {15},
numpages = {31},
}
istella/मुख्य (डिफ़ॉल्ट कॉन्फ़िगरेशन)
डाउनलोड आकार :
1.20 GiB
डेटासेट का आकार :
1.12 GiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 9,799 |
'train' | 23,219 |
- उदाहरण ( tfds.as_dataframe ):
इस्तेला / एस
डाउनलोड आकार :
450.26 MiB
डेटासेट का आकार :
421.88 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,562 |
'train' | 19,245 |
'vali' | 7,211 |
- उदाहरण ( tfds.as_dataframe ):
इस्तेला/एक्स
डाउनलोड का आकार :
4.42 GiB
डेटासेट का आकार :
2.46 GiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- उदाहरण ( tfds.as_dataframe ):
- विवरण :
इस्तेला डेटासेट इस्टेला द्वारा जारी किए गए तीन बड़े पैमाने के लर्निंग-टू-रैंक डेटासेट हैं। प्रत्येक डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जिन्हें फीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाया जाता है।
डेटासेट में तीन संस्करण होते हैं:
-
main
("इस्तेला लेटर"): 10,454,629 क्वेरी-दस्तावेज़ जोड़े शामिल हैं। -
s
("इस्तेला-एस लेटोर"): 3,408,630 क्वेरी-दस्तावेज़ जोड़े शामिल हैं। -
x
("इस्तेला-एक्स लेटर"): 26,791,447 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
आप इस प्रकार निर्दिष्ट कर सकते हैं कि डेटासेट के main
, s
या x
संस्करण का उपयोग करना है या नहीं:
ds = tfds.load("istella/main")
ds = tfds.load("istella/s")
ds = tfds.load("istella/x")
यदि केवल istella
निर्दिष्ट है, istella/main
विकल्प डिफ़ॉल्ट रूप से चुना जाता है:
# This is the same as `tfds.load("istella/main")`
ds = tfds.load("istella")
स्रोत कोड :
tfds.ranking.istella.Istella
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
1.0.1
: फ्लोट64 का समर्थन करने के लिए क्रमबद्धता को ठीक करें। -
1.1.0
: फीचरों को एक 'फ्लोट_फीचर्स' फीचर में बंडल करें। -
1.2.0
(डिफ़ॉल्ट): क्वेरी और दस्तावेज़ पहचानकर्ता जोड़ें।
-
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
फ़ीचर संरचना :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 220), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
doc_id | टेन्सर | (कोई भी नहीं,) | int64 | |
फ्लोट_फीचर्स | टेन्सर | (कोई नहीं, 220) | फ्लोट64 | |
लेबल | टेन्सर | (कोई भी नहीं,) | फ्लोट64 | |
query_id | लेख | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{10.1145/2987380,
author = {Dato, Domenico and Lucchese, Claudio and Nardini, Franco Maria and Orlando, Salvatore and Perego, Raffaele and Tonellotto, Nicola and Venturini, Rossano},
title = {Fast Ranking with Additive Ensembles of Oblivious and Non-Oblivious Regression Trees},
year = {2016},
publisher = {ACM},
address = {New York, NY, USA},
volume = {35},
number = {2},
issn = {1046-8188},
url = {https://doi.org/10.1145/2987380},
doi = {10.1145/2987380},
journal = {ACM Transactions on Information Systems},
articleno = {15},
numpages = {31},
}
istella/मुख्य (डिफ़ॉल्ट कॉन्फ़िगरेशन)
डाउनलोड आकार :
1.20 GiB
डेटासेट का आकार :
1.12 GiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 9,799 |
'train' | 23,219 |
- उदाहरण ( tfds.as_dataframe ):
इस्तेला / एस
डाउनलोड आकार :
450.26 MiB
डेटासेट का आकार :
421.88 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 6,562 |
'train' | 19,245 |
'vali' | 7,211 |
- उदाहरण ( tfds.as_dataframe ):
इस्तेला/एक्स
डाउनलोड का आकार :
4.42 GiB
डेटासेट का आकार :
2.46 GiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- उदाहरण ( tfds.as_dataframe ):