- الوصف :
MC-TACO عبارة عن مجموعة بيانات مكونة من 13 ألف زوج من الأسئلة والأجوبة التي تتطلب فهمًا زمنيًا منطقيًا. تحتوي مجموعة البيانات على خمس خصائص زمنية:
- المدة (كم من الوقت يستغرق الحدث)
- الترتيب الزمني (ترتيب نموذجي للأحداث)
- الوقت المعتاد (عند وقوع حدث ما)
- التردد (كم مرة يحدث الحدث)
- الثبات (سواء تم الحفاظ على الحالة لفترة طويلة جدًا أو إلى أجل غير مسمى)
نأمل أن تتمكن مجموعة البيانات هذه من تعزيز الاستكشاف المستقبلي لهذه الفئة المعينة من مشاكل التفكير.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/CogComp/MCTACO
كود المصدر :
tfds.datasets.mctaco.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
2.27 MiB
حجم مجموعة البيانات :
3.18 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 9442 |
'validation' | 3،783 |
- هيكل الميزة :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
إجابة | نص | خيط | ||
فئة | ClassLabel | int64 | ||
ملصق | ClassLabel | int64 | ||
سؤال | نص | خيط | ||
جملة | نص | خيط |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}