- विवरण :
बूलक्यू हाँ/नहीं प्रश्नों का एक प्रश्न उत्तर डेटासेट है जिसमें 15942 उदाहरण हैं। ये प्रश्न स्वाभाविक रूप से उत्पन्न होते हैं, वे असंयमित और अप्रतिबंधित सेटिंग्स में उत्पन्न होते हैं।
प्रत्येक उदाहरण वैकल्पिक अतिरिक्त संदर्भ के रूप में पृष्ठ के शीर्षक के साथ (प्रश्न, गद्यांश, उत्तर) का एक त्रिक है। टेक्स्ट-जोड़ी वर्गीकरण सेटअप मौजूदा प्राकृतिक भाषा अनुमान कार्यों के समान है।
मुखपृष्ठ : https://github.com/google-research-datasets/boolean-questions
स्रोत कोड :
tfds.datasets.bool_q.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
8.36 MiB
डेटासेट का आकार :
8.51 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 9,427 |
'validation' | 3,270 |
- फ़ीचर संरचना :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
उत्तर | टेन्सर | बूल | ||
रास्ता | मूलपाठ | डोरी | ||
प्रश्न | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}