- الوصف :
تعد مجموعة بيانات HellaSwag معيارًا لـ Commonsense NLI. يتضمن السياق وبعض النهايات التي تكمل السياق.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية https://rowanzellers.com/hellaswag/
كود المصدر :
tfds.text.Hellaswag
إصدارات :
-
0.0.1
: لا توجد ملاحظات إصدار. -
1.0.0
: إضافة تقسيمات منفصلة لمجموعات التحقق من الصحة / الاختبار داخل المجال وخارجه. -
1.1.0
(افتراضي): بعد انقسام آخر للمصدر (wikiHow مقابل Activitynet)
-
حجم التحميل :
68.18 MiB
حجم مجموعة البيانات :
107.45 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 10،003 |
'test_ind_activitynet' | 1،870 |
'test_ind_wikihow' | 3132 |
'test_ood_activitynet' | 1،651 |
'test_ood_wikihow' | 3350 |
'train' | 39905 |
'train_activitynet' | 14،740 |
'train_wikihow' | 25165 |
'validation' | 10،042 |
'validation_ind_activitynet' | 1،809 |
'validation_ind_wikihow' | 3،192 |
'validation_ood_activitynet' | 1،434 |
'validation_ood_wikihow' | 3،607 |
- هيكل الميزة :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
نشاط_تصنيف | نص | سلسلة | ||
سياق الكلام | نص | سلسلة | ||
النهايات | تسلسل (نص) | (لا أحد،) | سلسلة | |
ضع الكلمة المناسبة | موتر | int32 | ||
source_id | نص | سلسلة | ||
نوع منقسم | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}