- 説明:
BillSum、米国議会およびカリフォルニア州法案の要約。
いくつかの機能があります: - テキスト: 請求書のテキスト。 - 概要: 請求書の概要。 - title: 請求書のタイトル。私たちの手形のための機能。 ca bills にはありません。 - text_len: テキストの文字数。 - sum_len: 要約の文字数。
追加のドキュメント:コード を使用したペーパーの探索
ソースコード:
tfds.datasets.billsum.Builder
バージョン:
-
3.0.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
64.14 MiB
データセットサイズ:
260.84 MiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'ca_test' | 1,237 |
'test' | 3,269 |
'train' | 18,949 |
- 機能構造:
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
まとめ | 文章 | ストリング | ||
文章 | 文章 | ストリング | ||
題名 | 文章 | ストリング |
監視されたキー(
as_supervised
docを参照):('text', 'summary')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}