bot_adversarial_dialogue

คำอธิบาย :

ชุดข้อมูล Bot Adversarial Dialogue

ชุดข้อมูลการสนทนาที่มีป้ายกำกับว่ามีความไม่เหมาะสมจากงาน Bot Adversarial Dialogue บทสนทนาถูกรวบรวมโดยการขอให้มนุษย์พูดคุยกับบอทในทางตรงข้าม

รายละเอียดเพิ่มเติมใน กระดาษ

หน้าแรก : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
ซอร์สโค้ด : tfds.datasets.bot_adversarial_dialogue.Builder
รุ่น :
- 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
แคชอัตโนมัติ ( เอกสาร ): ใช่
คีย์ภายใต้การดูแล (ดู as_supervised doc ): None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (การกำหนดค่าเริ่มต้น)

คำอธิบายการกำหนดค่า : ชุดข้อมูลบทสนทนา แบ่งออกเป็นแบบฝึก การตรวจสอบ และการแยกการทดสอบ
ขนาดดาวน์โหลด : 3.06 MiB
ขนาดชุดข้อมูล : 23.38 MiB
แยก :

แยก	ตัวอย่าง
`'test'`	2,598
`'train'`	69,274
`'valid'`	7,002

โครงสร้างคุณสมบัติ :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

เอกสารคุณสมบัติ :

คุณสมบัติ	ระดับ	รูปร่าง	ประเภทD	คำอธิบาย
	คุณสมบัติDict
bot_persona	ลำดับ(ข้อความ)	(ไม่มี,)	เชือก	บุคคลที่แอบอ้างโดยบอท
บทสนทนา_id	เทนเซอร์		ลอย32
ตอน_เสร็จแล้ว	เทนเซอร์		บูล
รหัส	ข้อความ		เชือก	รหัสของตัวอย่าง
ฉลาก	ClassLabel		int64
รอบ_id	เทนเซอร์		ลอย32
Speaker_to_eval	ข้อความ		เชือก	ผู้พูดของคำพูดที่มีป้ายกำกับ
ข้อความ	ข้อความ		เชือก	คำพูดที่จะจำแนก

ตัวอย่าง ( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

คำอธิบายการกำหนดค่า : ชุดการประเมินความปลอดภัยของมนุษย์ซึ่งประเมินโดยพนักงานที่รวบรวมมวลชนสำหรับการโจมตี
ขนาดดาวน์โหลด : 10.57 KiB
ขนาดชุดข้อมูล : 34.55 KiB
แยก :

แยก	ตัวอย่าง
`'test'`	180

โครงสร้างคุณสมบัติ :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

เอกสารคุณสมบัติ :

คุณสมบัติ	ระดับ	ประเภทD	คำอธิบาย
	คุณสมบัติDict
ตอน_เสร็จแล้ว	เทนเซอร์	บูล
รหัส	ข้อความ	เชือก	รหัสของตัวอย่าง
ฉลาก	ClassLabel	int64
ข้อความ	ข้อความ	เชือก	คำพูดที่จะจำแนก

ตัวอย่าง ( tfds.as_dataframe ):