امبادا

  • الوصف :

تقوم مجموعة بيانات LAMBADA بتقييم قدرات النماذج الحسابية لفهم النص عن طريق مهمة التنبؤ بالكلمات. LAMBADA عبارة عن مجموعة من المقاطع السردية التي تشترك في السمة التي تمكن الأشخاص من تخمين كلمتهم الأخيرة إذا تعرضوا للمقطع بأكمله ، ولكن ليس فقط إذا رأوا الجملة الأخيرة التي تسبق الكلمة الهدف

انشق، مزق أمثلة
'test' 5153
'train' 4،869
  • هيكل الميزة :
FeaturesDict({
    'passage': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
الممر نص سلسلة
  • الاقتباس :
@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{\'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{\'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}