- الوصف :
Eraser Multi RC هي مجموعة بيانات للاستعلامات عبر مقاطع متعددة الأسطر ، جنبًا إلى جنب مع الإجابات والتعليل المنطقي. يحتوي كل مثال في مجموعة البيانات هذه على الأجزاء الخمسة التالية
- ممر متعدد الخطوط 2. استعلام عن المقطع 3. إجابة على الاستعلام
- تصنيف ما إذا كانت الإجابة صحيحة أم خاطئة 5. شرح يبرر التصنيف
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://cogcomp.seas.upenn.edu/multirc/
كود المصدر :
tfds.text.EraserMultiRc
إصدارات :
-
0.1.1
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
1.59 MiB
حجم مجموعة البيانات :
62.59 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 4848 |
'train' | 24،029 |
'validation' | 3214 |
- هيكل الميزة :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
الأدلة | تسلسل (نص) | (لا أحد،) | سلسلة | |
ضع الكلمة المناسبة | ClassLabel | int64 | ||
الممر | نص | سلسلة | ||
الاستعلام_و_الإجابة | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}