multi_news

  • 説明:

マルチニュースは、サイトnewser.comからのニュース記事とこれらの記事の人間が書いた要約で構成されています.各要約は編集者によって専門的に書かれており、引用された元の記事へのリンクが含まれています。

2 つの機能があります: - ドキュメント: 特別なトークン "|||||" で区切られたニュース記事のテキスト。 - 要約: ニュースの要約。

スプリット
'test' 5,622
'train' 44,972
'validation' 5,622
  • 機能構造:
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
資料文章ストリング
まとめ文章ストリング
  • 引用
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}