- الوصف :
Race عبارة عن مجموعة بيانات واسعة النطاق لفهم القراءة تضم أكثر من 28000 مقطع وما يقرب من 100000 سؤال. يتم جمع مجموعة البيانات من اختبارات اللغة الإنجليزية في الصين ، والتي تم تصميمها لطلاب المدارس المتوسطة والثانوية. يمكن تقديم مجموعة البيانات كمجموعات تدريب واختبار لفهم الآلة.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
وصف التكوين : تكوين Builder لمجموعة بيانات RACE.
الصفحة الرئيسية : https://www.cs.cmu.edu/~glai1/data/race/
كود المصدر :
tfds.datasets.race.Builder
إصدارات :
-
1.0.0
: الإصدار الأولي. -
2.0.0
(افتراضي): أضف معرف المثال.
-
حجم التحميل :
24.26 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
الإجابات | تسلسل (نص) | (لا أحد،) | سلسلة | |
مقالة - سلعة | نص | سلسلة | ||
example_id | نص | سلسلة | ||
والخيارات | تسلسل (تسلسل (نص)) | (ليس ليس) | سلسلة | |
أسئلة | تسلسل (نص) | (لا أحد،) | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
سباق / مرتفع (التكوين الافتراضي)
حجم مجموعة البيانات :
52.39 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'dev' | 1،021 |
'test' | 1045 |
'train' | 18.728 |
- أمثلة ( tfds.as_dataframe ):
العرق / الوسط
حجم مجموعة البيانات :
12.51 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6409 |
- أمثلة ( tfds.as_dataframe ):