- Описание :
Коллекция сообщений электронной почты сотрудников корпорации Enron.
Есть две особенности:
- email_body: основной текст электронной почты.
subject_line: текст темы письма.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/ryanzhumich/AESLC
Исходный код :
tfds.datasets.aeslc.Builder
Версии :
-
1.0.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
11.10 MiB
Размер набора данных :
14.96 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 1906 |
'train' | 14 436 |
'validation' | 1960 |
- Структура функции :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
email_body | Текст | нить | ||
Сюжетная линия | Текст | нить |
Контролируемые ключи (см . документ
as_supervised
):('email_body', 'subject_line')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}