- 説明:
ボット敵対対話データセット。
ボット敵対対話タスクからの攻撃性のラベルが付けられた対話データセット。対話は、人間にボットに敵対的に話しかけるよう依頼して収集されました。
詳細については論文をご覧ください。
ホームページ: https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
自動キャッシュ(ドキュメント): はい
監視キー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (デフォルト設定)
構成の説明: トレーニング、検証、テストの分割に分割されたダイアログ データセット。
ダウンロードサイズ:
3.06 MiB
データセットのサイズ:
23.38 MiB
分割:
スプリット | 例 |
---|---|
'test' | 2,598 |
'train' | 69,274 |
'valid' | 7,002 |
- 機能の構造:
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ボットペルソナ | シーケンス(テキスト) | (なし、) | 弦 | ボットによって偽装されたペルソナ。 |
ダイアログID | テンソル | float32 | ||
エピソード_完了 | テンソル | ブール | ||
ID | 文章 | 弦 | サンプルのID。 | |
ラベル | クラスラベル | int64 | ||
ラウンドID | テンソル | float32 | ||
スピーカーから評価へ | 文章 | 弦 | ラベルが付けられた発話の話者。 | |
文章 | 文章 | 弦 | 分類する発話。 |
- 例( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
構成の説明: 攻撃性についてクラウドソーシングの作業者によって評価される人間の安全性評価セット。
ダウンロードサイズ:
10.57 KiB
データセットのサイズ:
34.55 KiB
分割:
スプリット | 例 |
---|---|
'test' | 180 |
- 機能の構造:
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
エピソード_完了 | テンソル | ブール | ||
ID | 文章 | 弦 | サンプルのID。 | |
ラベル | クラスラベル | int64 | ||
文章 | 文章 | 弦 | 分類する発話。 |
- 例( tfds.as_dataframe ):