- Deskripsi :
Dataset LAMBADA mengevaluasi kemampuan model komputasi untuk pemahaman teks melalui tugas prediksi kata. LAMBADA adalah kumpulan petikan naratif yang memiliki karakteristik bahwa subjek manusia dapat menebak kata terakhirnya jika mereka melihat keseluruhan bacaan, tetapi tidak jika mereka hanya melihat kalimat terakhir sebelum kata sasaran.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Kode sumber :
tfds.datasets.lambada.Builder
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
319.03 MiB
Ukuran dataset :
3.49 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.153 |
'train' | 4.869 |
- Struktur fitur :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
jalan | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}