lambada

Deskripsi :

Dataset LAMBADA mengevaluasi kemampuan model komputasi untuk pemahaman teks melalui tugas prediksi kata. LAMBADA adalah kumpulan petikan naratif yang memiliki karakteristik bahwa subjek manusia dapat menebak kata terakhirnya jika mereka melihat keseluruhan bacaan, tetapi tidak jika mereka hanya melihat kalimat terakhir sebelum kata sasaran.

Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Kode sumber : tfds.datasets.lambada.Builder
Versi :
- 1.0.0 (default): Rilis awal.
Ukuran unduhan : 319.03 MiB
Ukuran dataset : 3.49 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :

Membelah	Contoh
`'test'`	5.153
`'train'`	4.869

Struktur fitur :

FeaturesDict({
    'passage': Text(shape=(), dtype=string),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Dtype	Keterangan
	fiturDict
jalan	Teks		rangkaian

Kunci yang diawasi (Lihat as_supervised doc ): None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):

Kutipan :

@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{\'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{\'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}

lambada Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

lambada