- विवरण :
बहु-शैली प्राकृतिक भाषा अनुमान (मल्टीएनएलआई) कॉर्पस 433k वाक्य जोड़े का भीड़-स्रोत संग्रह है जो पाठ्य संबंधी जानकारी के साथ टिप्पणी करता है। कॉर्पस को एसएनएलआई कॉर्पस पर तैयार किया गया है, लेकिन इसमें भिन्नता है जिसमें बोली जाने वाली और लिखित पाठ की शैलियों की एक श्रृंखला शामिल है, और एक विशिष्ट क्रॉस-शैली सामान्यीकरण मूल्यांकन का समर्थन करती है। कॉर्पस कोपेनहेगन में EMNLP में RepEval 2017 कार्यशाला के साझा कार्य के आधार के रूप में कार्य करता है।
स्रोत कोड :
tfds.text.MultiNLIMismatch
संस्करण :
-
0.1.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड का आकार :
216.34 MiB
डेटासेट का आकार :
90.91 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 392,702 |
'validation' | 10,000 |
- फ़ीचर संरचना :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': Text(shape=(), dtype=string),
'premise': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
परिकल्पना | मूलपाठ | डोरी | ||
लेबल | मूलपाठ | डोरी | ||
आधार | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}