- תיאור :
אוסף הודעות אימייל של עובדים בתאגיד אנרון.
ישנן שתי תכונות:
- email_body: טקסט גוף האימייל.
subject_line: טקסט נושא האימייל.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/ryanzhumich/AESLC
קוד מקור :
tfds.datasets.aeslc.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
11.10 MiB
גודל ערכת נתונים:
14.96 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 1,906 |
'train' | 14,436 |
'validation' | 1,960 |
- מבנה תכונה :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
email_body | טֶקסט | חוּט | ||
שורת נושא | טֶקסט | חוּט |
מפתחות בפיקוח (ראה כמסמך בפיקוח): ('
as_supervised
('email_body', 'subject_line')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}