- 説明:
データには、(DBpedia)[ https://wiki.dbpedia.org/ ] から抽出された主語-述語-目的語の形式の 1 ~ 7 個のトリプルのセットと、これらのトリプルを言語化した自然言語テキストが含まれています。テスト データは 15 の異なるドメインにまたがっており、トレーニング データには 10 のみが表示されます。データセットは、標準化されたテーブル形式に従います。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.structured.web_nlg.WebNlg
バージョン:
-
0.1.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
19.76 MiB
データセットサイズ:
13.78 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'test_all' | 4,928 |
'test_unseen' | 2,433 |
'train' | 18,102 |
'validation' | 2,268 |
- 機能構造:
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
入力テキスト | 特徴辞書 | |||
入力テキスト/コンテキスト | テンソル | ストリング | ||
入力テキスト/テーブル | 順序 | |||
input_text/table/column_header | テンソル | ストリング | ||
入力テキスト/テーブル/コンテンツ | テンソル | ストリング | ||
入力テキスト/テーブル/行番号 | テンソル | int16 | ||
target_text | テンソル | ストリング |
監視されたキー(
as_supervised
docを参照):('input_text', 'target_text')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}