- Descripción :
Una colección de mensajes de correo electrónico de los empleados de Enron Corporation.
Hay dos características:
- email_body: texto del cuerpo del correo electrónico.
subject_line: texto del asunto del correo electrónico.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/ryanzhumich/AESLC
Código fuente :
tfds.datasets.aeslc.Builder
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
11.10 MiB
Tamaño del conjunto de datos :
14.96 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 1,906 |
'train' | 14,436 |
'validation' | 1,960 |
- Estructura de características :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
cuerpo del correo electronico | Texto | cuerda | ||
línea de asunto | Texto | cuerda |
Claves supervisadas (ver
as_supervised
doc ):('email_body', 'subject_line')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}