العنصر

الوصف :

Race عبارة عن مجموعة بيانات واسعة النطاق لفهم القراءة تضم أكثر من 28000 مقطع وما يقرب من 100000 سؤال. يتم جمع مجموعة البيانات من اختبارات اللغة الإنجليزية في الصين ، والتي تم تصميمها لطلاب المدارس المتوسطة والثانوية. يمكن تقديم مجموعة البيانات كمجموعات تدريب واختبار لفهم الآلة.

وثائق إضافية : استكشف في الأوراق باستخدام الرمز
وصف التكوين : تكوين Builder لمجموعة بيانات RACE.
الصفحة الرئيسية : https://www.cs.cmu.edu/~glai1/data/race/
كود المصدر : tfds.datasets.race.Builder
إصدارات :
- 1.0.0 : الإصدار الأولي.
- 2.0.0 (افتراضي): أضف معرف المثال.
حجم التحميل : 24.26 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع
	الميزات
الإجابات	تسلسل (نص)	(لا أحد،)	سلسلة
مقالة - سلعة	نص		سلسلة
example_id	نص		سلسلة
والخيارات	تسلسل (تسلسل (نص))	(ليس ليس)	سلسلة
أسئلة	تسلسل (نص)	(لا أحد،)	سلسلة

المفاتيح الخاضعة للإشراف (انظر المستند as_supervised ): None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :

@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

سباق / مرتفع (التكوين الافتراضي)

حجم مجموعة البيانات : 52.39 MiB
الانقسامات :

انشق، مزق	أمثلة
`'dev'`	1،021
`'test'`	1045
`'train'`	18.728

أمثلة ( tfds.as_dataframe ):

العرق / الوسط

حجم مجموعة البيانات : 12.51 MiB
الانقسامات :

انشق، مزق	أمثلة
`'dev'`	368
`'test'`	362
`'train'`	6409

أمثلة ( tfds.as_dataframe ):

العنصر تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

سباق / مرتفع (التكوين الافتراضي)

العرق / الوسط

العنصر