- الوصف :
مجموعة من رسائل البريد الإلكتروني للموظفين في شركة Enron.
هناك نوعان من الميزات:
- email_body: النص الأساسي للبريد الإلكتروني.
subject_line: نص موضوع البريد الإلكتروني.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/ryanzhumich/AESLC
كود المصدر :
tfds.datasets.aeslc.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
11.10 MiB
حجم مجموعة البيانات :
14.96 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 1،906 |
'train' | 14،436 |
'validation' | 1960 |
- هيكل الميزة :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
هيئة البريد الإلكتروني | نص | سلسلة | ||
سطر الموضوع | نص | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('email_body', 'subject_line')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}