- Açıklama :
Bot Çelişkili Diyalog Veri Kümesi.
Bot Çekişmeli Diyalog görevinden saldırganlıkla etiketlenen diyalog veri kümeleri. Diyaloglar, insanlardan botlarla düşmanca konuşmaları istenerek toplandı.
Makalede daha fazla ayrıntı.
Ana sayfa : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
Kaynak kodu :
tfds.datasets.bot_adversarial_dialogue.Builder
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
Otomatik önbelleğe alınmış ( belgeler ): Evet
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (varsayılan yapılandırma)
Yapılandırma açıklaması : Eğitim, doğrulama ve test bölümlerine bölünmüş diyalog veri kümeleri.
İndirme boyutu :
3.06 MiB
Veri kümesi boyutu :
23.38 MiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 2.598 |
'train' | 69.274 |
'valid' | 7.002 |
- Özellik yapısı :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
bot_persona | Sıra(Metin) | (Hiçbiri,) | sicim | Bot tarafından taklit edilen kişi. |
diyalog_id | Tensör | kayan nokta32 | ||
bölüm_done | Tensör | bool | ||
İD | Metin | sicim | Numunenin kimliği. | |
etiketler | SınıfEtiketi | int64 | ||
round_id | Tensör | kayan nokta32 | ||
Speaker_to_eval | Metin | sicim | Etiketli ifadelerin konuşmacısı. | |
metin | Metin | sicim | Sınıflandırılacak ifade. |
- Örnekler ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
Yapılandırma açıklaması : Kalabalık kaynaklı çalışanlar tarafından saldırganlık açısından değerlendirilen bir insan güvenliği değerlendirme seti.
İndirme boyutu :
10.57 KiB
Veri kümesi boyutu :
34.55 KiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 180 |
- Özellik yapısı :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
bölüm_done | Tensör | bool | ||
İD | Metin | sicim | Numunenin kimliği. | |
etiketler | SınıfEtiketi | int64 | ||
metin | Metin | sicim | Sınıflandırılacak ifade. |
- Örnekler ( tfds.as_dataframe ):