- 説明:
データセットには、表と質問のペアと、それぞれの回答が含まれています。質問には、多段階の推論と、比較、集計、算術計算などのさまざまなデータ操作が必要です。表は、少なくとも 8 行 5 列のウィキペディアの表からランダムに選択されました。
(ドキュメントの使用上の注意に従って)
Dev: トレーニング データを 3 回 (5 回ではなく) 分割した平均精度。つまり、それぞれ「split-{1,2,3}-train」でトレーニングし、「split-{1,2,3}-dev」でテストしてから、精度を平均化します。
テスト: 「train」でトレーニングし、「test」でテストします。
追加のドキュメント:コード を使用したペーパーの探索
ホームページ: https://ppasupat.github.io/WikiTableQuestions/#usage-notes
ソース コード:
tfds.structured.wiki_table_questions.WikiTableQuestions
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
65.36 MiB
データセットサイズ:
237.24 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'split-1-dev' | 2,810 |
'split-1-train' | 11,321 |
'split-2-dev' | 2,838 |
'split-2-train' | 11,312 |
'split-3-dev' | 2,838 |
'split-3-train' | 11,311 |
'test' | 4,344 |
'train' | 14,149 |
- 機能構造:
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
入力テキスト | 特徴辞書 | |||
入力テキスト/コンテキスト | テンソル | ストリング | ||
入力テキスト/テーブル | 順序 | |||
input_text/table/column_header | テンソル | ストリング | ||
入力テキスト/テーブル/コンテンツ | テンソル | ストリング | ||
入力テキスト/テーブル/行番号 | テンソル | int16 | ||
target_text | テンソル | ストリング |
監視されたキー(
as_supervised
docを参照):('input_text', 'target_text')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}