- विवरण :
कॉन्टेक्स्ट में प्रश्न उत्तर मॉडलिंग, समझ और सूचना मांगने वाले संवाद में भाग लेने के लिए एक डेटासेट है। डेटा उदाहरणों में दो क्राउड वर्कर्स के बीच एक संवादात्मक संवाद शामिल होता है: (1) एक छात्र जो एक छिपे हुए विकिपीडिया पाठ के बारे में जितना संभव हो सके सीखने के लिए फ्रीफॉर्म प्रश्नों का एक क्रम प्रस्तुत करता है, और (2) एक शिक्षक जो छोटे अंश प्रदान करके प्रश्नों का उत्तर देता है। (विस्तार) पाठ से। QuAC मौजूदा मशीन कॉम्प्रिहेंशन डेटासेट में नहीं पाई जाने वाली चुनौतियों का परिचय देता है: इसके प्रश्न अक्सर अधिक ओपन-एंडेड, अनुत्तरदायी या केवल संवाद संदर्भ में सार्थक होते हैं।
होमपेज : https://quac.ai/
स्रोत कोड :
tfds.datasets.quac.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
73.47 MiB
डेटासेट का आकार :
298.04 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 83,568 |
'validation' | 7,354 |
- फ़ीचर संरचना :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'background': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'followup': Text(shape=(), dtype=string),
'orig_answer': FeaturesDict({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'section_title': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'yesno': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
जवाब | क्रम | |||
उत्तर/जवाब_शुरू | टेन्सर | int32 | ||
उत्तर/पाठ | मूलपाठ | डोरी | ||
पार्श्वभूमि | मूलपाठ | डोरी | ||
संदर्भ | मूलपाठ | डोरी | ||
आगे की कार्रवाई करना | मूलपाठ | डोरी | ||
मूल_उत्तर | विशेषताएं डिक्ट | |||
orig_answer/answer_start | टेन्सर | int32 | ||
मूल_उत्तर/पाठ | मूलपाठ | डोरी | ||
प्रश्न | मूलपाठ | डोरी | ||
अनुभाग शीर्षक | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी | ||
हाँ नही | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):('context', 'answers')
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{choi2018quac,
title={Quac: Question answering in context},
author={Choi, Eunsol and He, He and Iyyer, Mohit and Yatskar, Mark and Yih, Wen-tau and Choi, Yejin and Liang, Percy and Zettlemoyer, Luke},
journal={arXiv preprint arXiv:1808.07036},
year={2018}
}