- 説明:
TriviaqQA は、650,000 件を超える質疑応答証拠のトリプルを含む読解データセットです。 TriviaqQA には、トリビア愛好家によって作成された 95,000 の質問と回答のペアと、独立して収集された証拠ドキュメント (質問ごとに平均 6 つ) が含まれており、質問に回答するための高品質の遠隔監視を提供します。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.trivia_qa.Builder
バージョン:
-
1.1.0
(デフォルト): リリース ノートはありません。
-
機能構造:
FeaturesDict({
'answer': FeaturesDict({
'aliases': Sequence(Text(shape=(), dtype=string)),
'matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_value': Text(shape=(), dtype=string),
'type': Text(shape=(), dtype=string),
'value': Text(shape=(), dtype=string),
}),
'entity_pages': Sequence({
'doc_source': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'wiki_context': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'question_id': Text(shape=(), dtype=string),
'question_source': Text(shape=(), dtype=string),
'search_results': Sequence({
'description': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'rank': int32,
'search_context': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
}),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
答え | 特徴辞書 | |||
回答/エイリアス | シーケンス(テキスト) | (なし、) | 弦 | |
answer/matched_wiki_entity_name | 文章 | 弦 | ||
回答/normalized_aliases | シーケンス(テキスト) | (なし、) | 弦 | |
回答/normalized_matched_wiki_entity_name | 文章 | 弦 | ||
回答/正規化された_値 | 文章 | 弦 | ||
答え/タイプ | 文章 | 弦 | ||
答え/値 | 文章 | 弦 | ||
entity_pages | 順序 | |||
entity_pages/doc_source | 文章 | 弦 | ||
entity_pages/ファイル名 | 文章 | 弦 | ||
entity_pages/タイトル | 文章 | 弦 | ||
entity_pages/wiki_context | 文章 | 弦 | ||
質問 | 文章 | 弦 | ||
question_id | 文章 | 弦 | ||
question_source | 文章 | 弦 | ||
の検索結果 | 順序 | |||
検索結果/説明 | 文章 | 弦 | ||
検索結果/ファイル名 | 文章 | 弦 | ||
検索結果/ランク | テンソル | int32 | ||
検索結果/検索コンテキスト | 文章 | 弦 | ||
検索結果/タイトル | 文章 | 弦 | ||
検索結果/URL | 文章 | 弦 |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@article{2017arXivtriviaqa,
author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
Daniel and {Zettlemoyer}, Luke},
title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
journal = {arXiv e-prints},
year = 2017,
eid = {arXiv:1705.03551},
pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
eprint = {1705.03551},
}
trivia_qa/rc (デフォルト設定)
構成の説明: 特定の質問のすべてのドキュメントに回答文字列が含まれる質問と回答のペア。ウィキペディアと検索結果からのコンテキストが含まれます。
ダウンロードサイズ:
2.48 GiB
データセットサイズ:
14.99 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- 例( tfds.as_dataframe ):
trivia_qa/rc.nocontext
構成の説明: 特定の質問のすべてのドキュメントに回答文字列が含まれる質問と回答のペア。
ダウンロードサイズ:
2.48 GiB
データセットサイズ:
196.84 MiB
自動キャッシュ(ドキュメント): はい (テスト、検証)、
shuffle_files=False
の場合のみ (トレーニング)スプリット:
スプリット | 例 |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- 例( tfds.as_dataframe ):
trivia_qa/unfiltered
構成の説明: 特定の質問に対するすべてのドキュメントに回答文字列が含まれているわけではない、オープン ドメイン QA 用の 110k の質問と回答のペア。これにより、フィルタリングされていないデータセットが IR スタイルの QA により適したものになります。ウィキペディアと検索結果からのコンテキストが含まれます。
ダウンロードサイズ:
3.07 GiB
データセットサイズ:
27.27 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 10,832 |
'train' | 87,622 |
'validation' | 11,313 |
- 例( tfds.as_dataframe ):
trivia_qa/unfiltered.nocontext
構成の説明: 特定の質問に対するすべてのドキュメントに回答文字列が含まれているわけではない、オープン ドメイン QA 用の 110k の質問と回答のペア。これにより、フィルタリングされていないデータセットが IR スタイルの QA により適したものになります。
ダウンロードサイズ:
603.25 MiB
データセットのサイズ:
119.78 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'test' | 10,832 |
'train' | 87,622 |
'validation' | 11,313 |
- 例( tfds.as_dataframe ):
- 説明:
TriviaqQA は、650,000 件を超える質疑応答証拠のトリプルを含む読解データセットです。 TriviaqQA には、トリビア愛好家によって作成された 95,000 の質問と回答のペアと、独立して収集された証拠ドキュメント (質問ごとに平均 6 つ) が含まれており、質問に回答するための高品質の遠隔監視を提供します。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.trivia_qa.Builder
バージョン:
-
1.1.0
(デフォルト): リリース ノートはありません。
-
機能構造:
FeaturesDict({
'answer': FeaturesDict({
'aliases': Sequence(Text(shape=(), dtype=string)),
'matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_aliases': Sequence(Text(shape=(), dtype=string)),
'normalized_matched_wiki_entity_name': Text(shape=(), dtype=string),
'normalized_value': Text(shape=(), dtype=string),
'type': Text(shape=(), dtype=string),
'value': Text(shape=(), dtype=string),
}),
'entity_pages': Sequence({
'doc_source': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'wiki_context': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'question_id': Text(shape=(), dtype=string),
'question_source': Text(shape=(), dtype=string),
'search_results': Sequence({
'description': Text(shape=(), dtype=string),
'filename': Text(shape=(), dtype=string),
'rank': int32,
'search_context': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
}),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
答え | 特徴辞書 | |||
回答/エイリアス | シーケンス(テキスト) | (なし、) | 弦 | |
answer/matched_wiki_entity_name | 文章 | 弦 | ||
回答/normalized_aliases | シーケンス(テキスト) | (なし、) | 弦 | |
回答/normalized_matched_wiki_entity_name | 文章 | 弦 | ||
回答/正規化された_値 | 文章 | 弦 | ||
答え/タイプ | 文章 | 弦 | ||
答え/値 | 文章 | 弦 | ||
entity_pages | 順序 | |||
entity_pages/doc_source | 文章 | 弦 | ||
entity_pages/ファイル名 | 文章 | 弦 | ||
entity_pages/タイトル | 文章 | 弦 | ||
entity_pages/wiki_context | 文章 | 弦 | ||
質問 | 文章 | 弦 | ||
question_id | 文章 | 弦 | ||
question_source | 文章 | 弦 | ||
の検索結果 | 順序 | |||
検索結果/説明 | 文章 | 弦 | ||
検索結果/ファイル名 | 文章 | 弦 | ||
検索結果/ランク | テンソル | int32 | ||
検索結果/検索コンテキスト | 文章 | 弦 | ||
検索結果/タイトル | 文章 | 弦 | ||
検索結果/url | 文章 | 弦 |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@article{2017arXivtriviaqa,
author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
Daniel and {Zettlemoyer}, Luke},
title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
journal = {arXiv e-prints},
year = 2017,
eid = {arXiv:1705.03551},
pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
eprint = {1705.03551},
}
trivia_qa/rc (デフォルト設定)
構成の説明: 特定の質問のすべてのドキュメントに回答文字列が含まれる質問と回答のペア。ウィキペディアと検索結果からのコンテキストが含まれます。
ダウンロードサイズ:
2.48 GiB
データセットサイズ:
14.99 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- 例( tfds.as_dataframe ):
trivia_qa/rc.nocontext
構成の説明: 特定の質問のすべてのドキュメントに回答文字列が含まれる質問と回答のペア。
ダウンロードサイズ:
2.48 GiB
データセットサイズ:
196.84 MiB
自動キャッシュ(ドキュメント): はい (テスト、検証)、
shuffle_files=False
の場合のみ (トレーニング)スプリット:
スプリット | 例 |
---|---|
'test' | 17,210 |
'train' | 138,384 |
'validation' | 18,669 |
- 例( tfds.as_dataframe ):
trivia_qa/unfiltered
構成の説明: 特定の質問に対するすべてのドキュメントに回答文字列が含まれているわけではない、オープン ドメイン QA 用の 110k の質問と回答のペア。これにより、フィルタリングされていないデータセットが IR スタイルの QA により適したものになります。ウィキペディアと検索結果からのコンテキストが含まれます。
ダウンロードサイズ:
3.07 GiB
データセットサイズ:
27.27 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 10,832 |
'train' | 87,622 |
'validation' | 11,313 |
- 例( tfds.as_dataframe ):
trivia_qa/unfiltered.nocontext
構成の説明: 特定の質問に対するすべてのドキュメントに回答文字列が含まれているわけではない、オープン ドメイン QA 用の 110k の質問と回答のペア。これにより、フィルタリングされていないデータセットが IR スタイルの QA により適したものになります。
ダウンロードサイズ:
603.25 MiB
データセットのサイズ:
119.78 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'test' | 10,832 |
'train' | 87,622 |
'validation' | 11,313 |
- 例( tfds.as_dataframe ):