multi_news

  • Descrição :

Multi-News, consiste em artigos de notícias e resumos escritos por humanos desses artigos do site newser.com. Cada resumo é escrito profissionalmente por editores e inclui links para os artigos originais citados.

Existem duas características: - document: texto de artigos de notícias separados por token especial "|||||". - resumo: resumo da notícia.

Dividir Exemplos
'test' 5.622
'train' 44.972
'validation' 5.622
  • Estrutura de recursos :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
documento Texto corda
resumo Texto corda
  • Citação :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}