इस्टेला

  • विवरण :

इस्तेला डेटासेट इस्टेला द्वारा जारी किए गए तीन बड़े पैमाने के लर्निंग-टू-रैंक डेटासेट हैं। प्रत्येक डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जिन्हें फीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाया जाता है।

डेटासेट में तीन संस्करण होते हैं:

  • main ("इस्तेला लेटर"): 10,454,629 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
  • s ("इस्तेला-एस लेटोर"): 3,408,630 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
  • x ("इस्तेला-एक्स लेटर"): 26,791,447 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।

आप इस प्रकार निर्दिष्ट कर सकते हैं कि डेटासेट के main , s या x संस्करण का उपयोग करना है या नहीं:

ds = tfds.load("istella/main")
ds = tfds.load("istella/s")
ds = tfds.load("istella/x")

यदि केवल istella निर्दिष्ट है, istella/main विकल्प डिफ़ॉल्ट रूप से चुना जाता है:

# This is the same as `tfds.load("istella/main")`
ds = tfds.load("istella")
  • होमपेज : http://quickrank.isti.cnr.it/istella-dataset/

  • स्रोत कोड : tfds.ranking.istella.Istella

  • संस्करण :

    • 1.0.0 : प्रारंभिक रिलीज।
    • 1.0.1 : फ्लोट64 का समर्थन करने के लिए क्रमबद्धता को ठीक करें।
    • 1.1.0 : फीचरों को एक 'फ्लोट_फीचर्स' फीचर में बंडल करें।
    • 1.2.0 (डिफ़ॉल्ट): क्वेरी और दस्तावेज़ पहचानकर्ता जोड़ें।
  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • फ़ीचर संरचना :

FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 220), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
doc_id टेन्सर (कोई भी नहीं,) int64
फ्लोट_फीचर्स टेन्सर (कोई नहीं, 220) फ्लोट64
लेबल टेन्सर (कोई भी नहीं,) फ्लोट64
query_id लेख डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{10.1145/2987380,
  author = {Dato, Domenico and Lucchese, Claudio and Nardini, Franco Maria and Orlando, Salvatore and Perego, Raffaele and Tonellotto, Nicola and Venturini, Rossano},
  title = {Fast Ranking with Additive Ensembles of Oblivious and Non-Oblivious Regression Trees},
  year = {2016},
  publisher = {ACM},
  address = {New York, NY, USA},
  volume = {35},
  number = {2},
  issn = {1046-8188},
  url = {https://doi.org/10.1145/2987380},
  doi = {10.1145/2987380},
  journal = {ACM Transactions on Information Systems},
  articleno = {15},
  numpages = {31},
}

istella/मुख्य (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डाउनलोड आकार : 1.20 GiB

  • डेटासेट का आकार : 1.12 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 9,799
'train' 23,219

इस्तेला / एस

  • डाउनलोड आकार : 450.26 MiB

  • डेटासेट का आकार : 421.88 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,562
'train' 19,245
'vali' 7,211

इस्तेला/एक्स

  • डाउनलोड का आकार : 4.42 GiB

  • डेटासेट का आकार : 2.46 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000
'train' 6,000
'vali' 2,000
,

  • विवरण :

इस्तेला डेटासेट इस्टेला द्वारा जारी किए गए तीन बड़े पैमाने के लर्निंग-टू-रैंक डेटासेट हैं। प्रत्येक डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जिन्हें फीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाया जाता है।

डेटासेट में तीन संस्करण होते हैं:

  • main ("इस्तेला लेटर"): 10,454,629 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
  • s ("इस्तेला-एस लेटोर"): 3,408,630 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
  • x ("इस्तेला-एक्स लेटर"): 26,791,447 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।

आप इस प्रकार निर्दिष्ट कर सकते हैं कि डेटासेट के main , s या x संस्करण का उपयोग करना है या नहीं:

ds = tfds.load("istella/main")
ds = tfds.load("istella/s")
ds = tfds.load("istella/x")

यदि केवल istella निर्दिष्ट है, istella/main विकल्प डिफ़ॉल्ट रूप से चुना जाता है:

# This is the same as `tfds.load("istella/main")`
ds = tfds.load("istella")
  • होमपेज : http://quickrank.isti.cnr.it/istella-dataset/

  • स्रोत कोड : tfds.ranking.istella.Istella

  • संस्करण :

    • 1.0.0 : प्रारंभिक रिलीज।
    • 1.0.1 : फ्लोट64 का समर्थन करने के लिए क्रमबद्धता को ठीक करें।
    • 1.1.0 : फीचरों को एक 'फ्लोट_फीचर्स' फीचर में बंडल करें।
    • 1.2.0 (डिफ़ॉल्ट): क्वेरी और दस्तावेज़ पहचानकर्ता जोड़ें।
  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • फ़ीचर संरचना :

FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 220), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
doc_id टेन्सर (कोई भी नहीं,) int64
फ्लोट_फीचर्स टेन्सर (कोई नहीं, 220) फ्लोट64
लेबल टेन्सर (कोई भी नहीं,) फ्लोट64
query_id लेख डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{10.1145/2987380,
  author = {Dato, Domenico and Lucchese, Claudio and Nardini, Franco Maria and Orlando, Salvatore and Perego, Raffaele and Tonellotto, Nicola and Venturini, Rossano},
  title = {Fast Ranking with Additive Ensembles of Oblivious and Non-Oblivious Regression Trees},
  year = {2016},
  publisher = {ACM},
  address = {New York, NY, USA},
  volume = {35},
  number = {2},
  issn = {1046-8188},
  url = {https://doi.org/10.1145/2987380},
  doi = {10.1145/2987380},
  journal = {ACM Transactions on Information Systems},
  articleno = {15},
  numpages = {31},
}

istella/मुख्य (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डाउनलोड आकार : 1.20 GiB

  • डेटासेट का आकार : 1.12 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 9,799
'train' 23,219

इस्तेला / एस

  • डाउनलोड आकार : 450.26 MiB

  • डेटासेट का आकार : 421.88 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,562
'train' 19,245
'vali' 7,211

इस्तेला/एक्स

  • डाउनलोड का आकार : 4.42 GiB

  • डेटासेट का आकार : 2.46 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000
'train' 6,000
'vali' 2,000