bot_adversarial_dialogue

  • 説明:

ボット敵対対話データセット。

ボット敵対対話タスクからの攻撃性のラベルが付けられた対話データセット。対話は、人間にボットに敵対的に話しかけるよう依頼して収集されました。

詳細については論文をご覧ください。

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (デフォルト設定)

  • 構成の説明: トレーニング、検証、テストの分割に分割されたダイアログ データセット。

  • ダウンロードサイズ: 3.06 MiB

  • データセットのサイズ: 23.38 MiB

  • 分割:

スプリット
'test' 2,598
'train' 69,274
'valid' 7,002
  • 機能の構造:
FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
ボットペルソナシーケンス(テキスト) (なし、)ボットによって偽装されたペルソナ。
ダイアログIDテンソルfloat32
エピソード_完了テンソルブール
ID文章サンプルのID。
ラベルクラスラベルint64
ラウンドIDテンソルfloat32
スピーカーから評価へ文章ラベルが付けられた発話の話者。
文章文章分類する発話。

bot_adversarial_dialogue/human_nonadv_safety_eval

  • 構成の説明: 攻撃性についてクラウドソーシングの作業者によって評価される人間の安全性評価セット。

  • ダウンロードサイズ: 10.57 KiB

  • データセットのサイズ: 34.55 KiB

  • 分割:

スプリット
'test' 180
  • 機能の構造:
FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
エピソード_完了テンソルブール
ID文章サンプルのID。
ラベルクラスラベルint64
文章文章分類する発話。