multi_news

  • Описание :

Multi-News состоит из новостных статей и написанных человеком резюме этих статей с сайта newser.com. Каждое резюме профессионально написано редакторами и включает ссылки на цитируемые оригинальные статьи.

Есть две функции: - документ: текст новостных статей, разделенный специальным токеном "|||||". - резюме: сводка новостей.

Расколоть Примеры
'test' 5622
'train' 44 972
'validation' 5622
  • Структура функции :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
документ Текст нить
резюме Текст нить
  • Цитата :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}