xsum

  • Descriptif :

Ensemble de données de résumé extrême (XSum).

Il existe deux fonctionnalités : - document : saisie d'un article d'actualité. - résumé : une phrase récapitulant l'article.

Ces données doivent être téléchargées et extraites manuellement comme décrit dans https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md Le dossier 'xsum-extracts-from-downloads' doit être compressé comme 'xsum-extracts-from-downloads.tar.gz' et placez-le dans le dossier téléchargé manuellement.

Diviser Exemples
'test' 11 301
'train' 203 577
'validation' 11 305
  • Structure des fonctionnalités :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
document Texte chaîne de caractères
sommaire Texte chaîne de caractères
  • Citation :
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}