الممحاة

الوصف :

Eraser Multi RC هي مجموعة بيانات للاستعلامات عبر مقاطع متعددة الأسطر ، جنبًا إلى جنب مع الإجابات والتعليل المنطقي. يحتوي كل مثال في مجموعة البيانات هذه على الأجزاء الخمسة التالية

ممر متعدد الخطوط 2. استعلام عن المقطع 3. إجابة على الاستعلام
تصنيف ما إذا كانت الإجابة صحيحة أم خاطئة 5. شرح يبرر التصنيف

وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://cogcomp.seas.upenn.edu/multirc/
كود المصدر : tfds.text.EraserMultiRc
إصدارات :
- 0.1.1 (افتراضي): لا توجد ملاحظات حول الإصدار.
حجم التحميل : 1.59 MiB
حجم مجموعة البيانات : 62.59 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :

انشق، مزق	أمثلة
`'test'`	4848
`'train'`	24،029
`'validation'`	3214

هيكل الميزة :

FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع
	الميزات
الأدلة	تسلسل (نص)	(لا أحد،)	سلسلة
ضع الكلمة المناسبة	ClassLabel		int64
الممر	نص		سلسلة
الاستعلام_و_الإجابة	نص		سلسلة

المفاتيح الخاضعة للإشراف (انظر المستند as_supervised ): None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):

الاقتباس :

@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}

الممحاة تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

الممحاة