bot_adversarial_dialogue

  • คำอธิบาย :

ชุดข้อมูล Bot Adversarial Dialogue

ชุดข้อมูลการสนทนาที่มีป้ายกำกับว่ามีความไม่เหมาะสมจากงาน Bot Adversarial Dialogue บทสนทนาถูกรวบรวมโดยการขอให้มนุษย์พูดคุยกับบอทในทางตรงข้าม

รายละเอียดเพิ่มเติมใน กระดาษ

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : ชุดข้อมูลบทสนทนา แบ่งออกเป็นแบบฝึก การตรวจสอบ และการแยกการทดสอบ

  • ขนาดดาวน์โหลด : 3.06 MiB

  • ขนาดชุดข้อมูล : 23.38 MiB

  • แยก :

แยก ตัวอย่าง
'test' 2,598
'train' 69,274
'valid' 7,002
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
bot_persona ลำดับ(ข้อความ) (ไม่มี,) เชือก บุคคลที่แอบอ้างโดยบอท
บทสนทนา_id เทนเซอร์ ลอย32
ตอน_เสร็จแล้ว เทนเซอร์ บูล
รหัส ข้อความ เชือก รหัสของตัวอย่าง
ฉลาก ClassLabel int64
รอบ_id เทนเซอร์ ลอย32
Speaker_to_eval ข้อความ เชือก ผู้พูดของคำพูดที่มีป้ายกำกับ
ข้อความ ข้อความ เชือก คำพูดที่จะจำแนก

bot_adversarial_dialogue/human_nonadv_safety_eval

  • คำอธิบายการกำหนดค่า : ชุดการประเมินความปลอดภัยของมนุษย์ซึ่งประเมินโดยพนักงานที่รวบรวมมวลชนสำหรับการโจมตี

  • ขนาดดาวน์โหลด : 10.57 KiB

  • ขนาดชุดข้อมูล : 34.55 KiB

  • แยก :

แยก ตัวอย่าง
'test' 180
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ตอน_เสร็จแล้ว เทนเซอร์ บูล
รหัส ข้อความ เชือก รหัสของตัวอย่าง
ฉลาก ClassLabel int64
ข้อความ ข้อความ เชือก คำพูดที่จะจำแนก