- विवरण :
एसएनएलआई कॉर्पस (संस्करण 1.0) 570k मानव-लिखित अंग्रेजी वाक्य जोड़े का एक संग्रह है, जिसे मैन्युअल रूप से लेबल के साथ संतुलित वर्गीकरण के लिए लेबल किया गया है, जो प्राकृतिक भाषा अनुमान (एनएलआई) के कार्य का समर्थन करता है, जिसे पाठ संबंधी प्रवेश को पहचानने के रूप में भी जाना जाता है। (आरटीई)।
स्रोत कोड :
tfds.datasets.snli.Builder
संस्करण :
-
1.1.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
90.17 MiB
डेटासेट का आकार :
87.00 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 10,000 |
'train' | 550,152 |
'validation' | 10,000 |
- फ़ीचर संरचना :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
परिकल्पना | लेख | डोरी | ||
लेबल | क्लासलेबल | int64 | ||
आधार | लेख | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}