bot_adversarial_dialogue

  • Açıklama :

Bot Çelişkili Diyalog Veri Kümesi.

Bot Çekişmeli Diyalog görevinden saldırganlıkla etiketlenen diyalog veri kümeleri. Diyaloglar, insanlardan botlarla düşmanca konuşmaları istenerek toplandı.

Makalede daha fazla ayrıntı.

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Eğitim, doğrulama ve test bölümlerine bölünmüş diyalog veri kümeleri.

  • İndirme boyutu : 3.06 MiB

  • Veri kümesi boyutu : 23.38 MiB

  • Bölünmeler :

Bölmek Örnekler
'test' 2.598
'train' 69.274
'valid' 7.002
  • Özellik yapısı :
FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
bot_persona Sıra(Metin) (Hiçbiri,) sicim Bot tarafından taklit edilen kişi.
diyalog_id Tensör kayan nokta32
bölüm_done Tensör bool
İD Metin sicim Numunenin kimliği.
etiketler SınıfEtiketi int64
round_id Tensör kayan nokta32
Speaker_to_eval Metin sicim Etiketli ifadelerin konuşmacısı.
metin Metin sicim Sınıflandırılacak ifade.

bot_adversarial_dialogue/human_nonadv_safety_eval

  • Yapılandırma açıklaması : Kalabalık kaynaklı çalışanlar tarafından saldırganlık açısından değerlendirilen bir insan güvenliği değerlendirme seti.

  • İndirme boyutu : 10.57 KiB

  • Veri kümesi boyutu : 34.55 KiB

  • Bölünmeler :

Bölmek Örnekler
'test' 180
  • Özellik yapısı :
FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
bölüm_done Tensör bool
İD Metin sicim Numunenin kimliği.
etiketler SınıfEtiketi int64
metin Metin sicim Sınıflandırılacak ifade.