- الوصف :
تقوم مجموعة بيانات LAMBADA بتقييم قدرات النماذج الحسابية لفهم النص عن طريق مهمة التنبؤ بالكلمات. LAMBADA عبارة عن مجموعة من المقاطع السردية التي تشترك في السمة التي تمكن الأشخاص من تخمين كلمتهم الأخيرة إذا تعرضوا للمقطع بأكمله ، ولكن ليس فقط إذا رأوا الجملة الأخيرة التي تسبق الكلمة الهدف
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية https://zenodo.org/record/2630551#.X4Xzn5NKjUI
كود المصدر :
tfds.datasets.lambada.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
319.03 MiB
حجم مجموعة البيانات :
3.49 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 5153 |
'train' | 4،869 |
- هيكل الميزة :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
الممر | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}