ウィノグランデ

  • 説明

WinoGrande は、44,000 個の問題からなる大規模なデータセットで、元の Winograd Schema Challenge の設計からインスピレーションを受けていますが、データセットの規模と硬度の両方を向上させるために調整されています。

スプリット
'test' 1,767
'train_l' 10,234
'train_m' 2,558
'train_s' 640
'train_xl' 40,398
'train_xs' 160
'validation' 1,267
  • 機能の構造:
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'option1': Text(shape=(), dtype=string),
    'option2': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
ラベルクラスラベルint64
オプション1文章
オプション2文章
文章
@article{sakaguchi2019winogrande,
    title={WinoGrande: An Adversarial Winograd Schema Challenge at Scale},
    author={Sakaguchi, Keisuke and Bras, Ronan Le and Bhagavatula, Chandra and Choi, Yejin},
    journal={arXiv preprint arXiv:1907.10641},
    year={2019}
}