- توضیحات :
Eraser Multi RC مجموعه داده ای برای پرس و جوها در قسمت های چند خطی، همراه با پاسخ ها و منطق است. هر نمونه در این مجموعه داده دارای 5 بخش زیر است
- یک متن چند خطی 2. یک پرس و جو در مورد قطعه 3. یک پاسخ به پرس و جو
- طبقه بندی درست یا غلط بودن پاسخ 5. توضیحی که طبقه بندی را توجیه می کند
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://cogcomp.seas.upenn.edu/multirc/
کد منبع :
tfds.text.EraserMultiRc
نسخه ها :
-
0.1.1
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.59 MiB
حجم مجموعه داده :
62.59 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 4,848 |
'train' | 24,029 |
'validation' | 3,214 |
- ساختار ویژگی :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
شواهد | دنباله (متن) | (هیچ یک،) | رشته | |
برچسب | ClassLabel | int64 | ||
گذر | متن | رشته | ||
query_and_answer | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}