- Descriptif :
Multi-News, se compose d'articles d'actualité et de résumés rédigés par des humains de ces articles issus du site newser.com. Chaque résumé est rédigé de manière professionnelle par des éditeurs et comprend des liens vers les articles originaux cités.
Il y a deux fonctionnalités : - document : texte des articles de presse séparés par un jeton spécial "|||||". - résumé : résumé de l'actualité.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/Alex-Fabbri/Multi-News
Code source :
tfds.summarization.MultiNews
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
245.06 MiB
Taille du jeu de données :
669.80 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 5 622 |
'train' | 44 972 |
'validation' | 5 622 |
- Structure des fonctionnalités :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
document | Texte | chaîne de caractères | ||
sommaire | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):('document', 'summary')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}