- Descripción :
Multi-News, consiste en artículos de noticias y resúmenes escritos por humanos de estos artículos del sitio newser.com. Cada resumen está escrito profesionalmente por editores e incluye enlaces a los artículos originales citados.
Hay dos características: - documento: texto de artículos de noticias separados por token especial "|||||". - resumen: resumen de noticias.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/Alex-Fabbri/Multi-News
Código fuente :
tfds.summarization.MultiNews
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
245.06 MiB
Tamaño del conjunto de datos :
669.80 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 5,622 |
'train' | 44,972 |
'validation' | 5,622 |
- Estructura de características :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
documento | Texto | cuerda | ||
resumen | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
):('document', 'summary')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}