- Deskripsi :
Kumpulan pesan email karyawan di Enron Corporation.
Ada dua fitur:
- email_body: teks isi email.
subject_line: teks subjek email.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/ryanzhumich/AESLC
Kode sumber :
tfds.datasets.aeslc.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
11.10 MiB
Ukuran dataset :
14.96 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.906 |
'train' | 14.436 |
'validation' | 1.960 |
- Struktur fitur :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
email_body | Teks | rangkaian | ||
garis subjek | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('email_body', 'subject_line')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}