- 説明:
マルチニュースは、サイトnewser.comからのニュース記事とこれらの記事の人間が書いた要約で構成されています.各要約は編集者によって専門的に書かれており、引用された元の記事へのリンクが含まれています。
2 つの機能があります: - ドキュメント: 特別なトークン "|||||" で区切られたニュース記事のテキスト。 - 要約: ニュースの要約。
追加のドキュメント:コード を使用したペーパーの探索
ソースコード:
tfds.summarization.MultiNews
バージョン:
-
1.0.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
245.06 MiB
データセットサイズ:
669.80 MiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 5,622 |
'train' | 44,972 |
'validation' | 5,622 |
- 機能構造:
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
資料 | 文章 | ストリング | ||
まとめ | 文章 | ストリング |
監視されたキー(
as_supervised
docを参照):('document', 'summary')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}