- توضیحات :
MC-TACO مجموعهای از 13 هزار جفت پرسش و پاسخ است که نیاز به درک عقل سلیم زمانی دارد. مجموعه داده شامل پنج ویژگی زمانی است:
- مدت زمان (مدت یک رویداد چقدر طول می کشد)
- ترتیب زمانی (ترتیب معمول رویدادها)
- زمان معمولی (زمانی که یک رویداد رخ می دهد)
- فرکانس (هر چند وقت یکبار یک رویداد رخ می دهد)
- ایستایی (خواه یک حالت برای مدت بسیار طولانی یا به طور نامحدود حفظ شود)
ما امیدواریم که این مجموعه داده بتواند کاوش آینده این کلاس خاص از مشکلات استدلالی را ارتقا دهد.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/CogComp/MCTACO
کد منبع :
tfds.datasets.mctaco.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
2.27 MiB
حجم مجموعه داده :
3.18 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 9,442 |
'validation' | 3783 |
- ساختار ویژگی :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
پاسخ | متن | رشته | ||
دسته بندی | ClassLabel | int64 | ||
برچسب | ClassLabel | int64 | ||
سوال | متن | رشته | ||
جمله | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}