- विवरण :
रेस 28,000 से अधिक मार्ग और लगभग 100,000 प्रश्नों के साथ बड़े पैमाने पर पढ़ने की समझ का डेटासेट है। डेटासेट चीन में अंग्रेजी परीक्षाओं से एकत्र किया गया है, जो मिडिल स्कूल और हाई स्कूल के छात्रों के लिए डिज़ाइन किए गए हैं। मशीन की समझ के लिए डेटासेट को प्रशिक्षण और परीक्षण सेट के रूप में परोसा जा सकता है।
कॉन्फ़िगरेशन विवरण : RACE डेटासेट के लिए बिल्डर कॉन्फ़िगरेशन।
स्रोत कोड :
tfds.datasets.race.Builder
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
2.0.0
(डिफ़ॉल्ट): उदाहरण आईडी जोड़ें।
-
डाउनलोड का आकार :
24.26 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
फ़ीचर संरचना :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
जवाब | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी | |
लेख | मूलपाठ | डोरी | ||
example_id | मूलपाठ | डोरी | ||
विकल्प | अनुक्रम (अनुक्रम (पाठ)) | (कोई नहीं, कोई नहीं) | डोरी | |
प्रशन | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
दौड़/उच्च (डिफ़ॉल्ट कॉन्फ़िगरेशन)
डेटासेट का आकार :
52.39 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- उदाहरण ( tfds.as_dataframe ):
दौड़/मध्य
डेटासेट का आकार :
12.51 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- उदाहरण ( tfds.as_dataframe ):