العنصر

  • الوصف :

Race عبارة عن مجموعة بيانات واسعة النطاق لفهم القراءة تضم أكثر من 28000 مقطع وما يقرب من 100000 سؤال. يتم جمع مجموعة البيانات من اختبارات اللغة الإنجليزية في الصين ، والتي تم تصميمها لطلاب المدارس المتوسطة والثانوية. يمكن تقديم مجموعة البيانات كمجموعات تدريب واختبار لفهم الآلة.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
الإجابات تسلسل (نص) (لا أحد،) سلسلة
مقالة - سلعة نص سلسلة
example_id نص سلسلة
والخيارات تسلسل (تسلسل (نص)) (ليس ليس) سلسلة
أسئلة تسلسل (نص) (لا أحد،) سلسلة
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

سباق / مرتفع (التكوين الافتراضي)

  • حجم مجموعة البيانات : 52.39 MiB

  • الانقسامات :

انشق، مزق أمثلة
'dev' 1،021
'test' 1045
'train' 18.728

العرق / الوسط

  • حجم مجموعة البيانات : 12.51 MiB

  • الانقسامات :

انشق، مزق أمثلة
'dev' 368
'test' 362
'train' 6409