- 説明:
WikiBio はウィキペディアの伝記ページを使用して構築されており、最初の段落とトークン化されたインフォボックスが含まれています。データセットは、標準化されたテーブル形式に従います。
追加のドキュメント:コード を使用したペーパーの探索
ホームページ: https://github.com/DavidGrangier/wikipedia-biography-dataset
ソースコード:
tfds.structured.WikiBio
バージョン:
-
0.1.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
318.53 MiB
データセットのサイズ:
795.98 MiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 72,831 |
'train' | 582,659 |
'validation' | 72,831 |
- 機能構造:
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
入力テキスト | 特徴辞書 | |||
入力テキスト/コンテキスト | テンソル | ストリング | ||
入力テキスト/テーブル | 順序 | |||
input_text/table/column_header | テンソル | ストリング | ||
入力テキスト/テーブル/コンテンツ | テンソル | ストリング | ||
入力テキスト/テーブル/行番号 | テンソル | int16 | ||
target_text | テンソル | ストリング |
監視されたキー(
as_supervised
docを参照):('input_text', 'target_text')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@inproceedings{lebret-etal-2016-neural,
title = "Neural Text Generation from Structured Data with Application to the Biography Domain",
author = "Lebret, R{'e}mi and
Grangier, David and
Auli, Michael",
booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2016",
address = "Austin, Texas",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D16-1128",
doi = "10.18653/v1/D16-1128",
pages = "1203--1213",
}