- विवरण :
क्यूएएससी एक प्रश्न-उत्तर डेटासेट है जो वाक्य रचना पर ध्यान केंद्रित करता है। इसमें ग्रेड स्कूल साइंस (8,134 ट्रेन, 926 देव, 920 टेस्ट) के बारे में 9,980 8-वे बहुविकल्पीय प्रश्न शामिल हैं, और यह 17M वाक्यों के संग्रह के साथ आता है।
होमपेज : https://allenai.org/data/qasc
स्रोत कोड :
tfds.datasets.qasc.Builder
संस्करण :
-
0.1.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
1.54 MiB
डेटासेट का आकार :
6.61 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 920 |
'train' | 8,134 |
'validation' | 926 |
- फ़ीचर संरचना :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
उत्तर कुंजी | मूलपाठ | डोरी | ||
विकल्प | क्रम | |||
विकल्प / लेबल | मूलपाठ | डोरी | ||
विकल्प / पाठ | मूलपाठ | डोरी | ||
संयुक्ततथ्य | मूलपाठ | डोरी | ||
तथ्य1 | मूलपाठ | डोरी | ||
तथ्य2 | मूलपाठ | डोरी | ||
formatted_question | मूलपाठ | डोरी | ||
पहचान | मूलपाठ | डोरी | ||
प्रश्न | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}