- 説明:
Race は、28,000 を超えるパッセージと 100,000 近くの問題を含む大規模な読解データセットです。このデータセットは、中学生と高校生を対象とした中国の英語試験から収集されています。データセットは、機械理解のトレーニング セットとテスト セットとして使用できます。
追加のドキュメント:コード を使用したペーパーの探索
構成の説明: RACE データセットのビルダー構成。
ソースコード:
tfds.datasets.race.Builder
バージョン:
-
1.0.0
: 初期リリース。 -
2.0.0
(デフォルト): サンプル ID を追加します。
-
ダウンロードサイズ:
24.26 MiB
自動キャッシュ(ドキュメント): はい
機能構造:
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
答え | シーケンス(テキスト) | (なし、) | ストリング | |
記事 | 文章 | ストリング | ||
example_id | 文章 | ストリング | ||
オプション | Sequence(シーケンス(テキスト)) | (なし、なし) | ストリング | |
質問 | シーケンス(テキスト) | (なし、) | ストリング |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
race/high (デフォルト設定)
データセットのサイズ:
52.39 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- 例( tfds.as_dataframe ):
レース/ミドル
データセットサイズ:
12.51 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- 例( tfds.as_dataframe ):