- Açıklama :
LAMBADA veri seti, bir kelime tahmini görevi aracılığıyla metin anlama için hesaplamalı modellerin yeteneklerini değerlendirir. LAMBADA, insan deneklerin yalnızca hedef kelimeden önceki son cümleyi görmeleri durumunda değil, tüm pasaja maruz kaldıklarında son kelimelerini tahmin edebilmeleri özelliğini paylaşan bir anlatı pasajları koleksiyonudur.
Ana Sayfa : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Kaynak kodu :
tfds.datasets.lambada.Builder
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
319.03 MiB
Veri kümesi boyutu :
3.49 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 5.153 |
'train' | 4.869 |
- Özellik yapısı :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
geçit | Metin | sicim |
Denetlenen anahtarlar (Bkz.
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}