multi_news

  • Mô tả :

Multi-News, bao gồm các bài báo và bản tóm tắt do con người viết về những bài báo này từ trang newser.com. Mỗi bản tóm tắt được viết một cách chuyên nghiệp bởi các biên tập viên và bao gồm các liên kết đến các bài báo gốc được trích dẫn.

Có hai tính năng: - tài liệu: văn bản của các bài báo được phân tách bằng mã thông báo đặc biệt "|||||". - summary: tóm tắt tin tức.

Tách ra ví dụ
'test' 5,622
'train' 44,972
'validation' 5,622
  • Cấu trúc tính năng :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tài liệu Chữ sợi dây
bản tóm tắt Chữ sợi dây
  • trích dẫn :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}