لامبادا

توضیحات :

مجموعه داده LAMBADA قابلیت های مدل های محاسباتی را برای درک متن با استفاده از یک کار پیش بینی کلمه ارزیابی می کند. لامبادا مجموعه‌ای از قسمت‌های روایی است که این ویژگی را به اشتراک می‌گذارد که سوژه‌های انسانی در صورت قرار گرفتن در معرض کل قسمت می‌توانند آخرین کلمه خود را حدس بزنند، اما اگر فقط آخرین جمله قبل از کلمه مورد نظر را ببینند نه.

اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
کد منبع : tfds.datasets.lambada.Builder
نسخه ها :
- 1.0.0 (پیش فرض): انتشار اولیه.
حجم دانلود : 319.03 MiB
حجم مجموعه داده : 3.49 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :

شکاف	مثال ها
`'test'`	5,153
`'train'`	4,869

ساختار ویژگی :

FeaturesDict({
    'passage': Text(shape=(), dtype=string),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D	شرح
	FeaturesDict
گذر	متن		رشته

کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{\'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{\'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}

لامبادا با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

لامبادا