- คำอธิบาย :
ชุดข้อมูล Schema-Guided Dialogue (SGD) ประกอบด้วยการสนทนาที่เน้นงานหลายโดเมนที่มีคำอธิบายประกอบมากกว่า 20,000 รายการระหว่างมนุษย์กับผู้ช่วยเสมือน การสนทนาเหล่านี้เกี่ยวข้องกับการโต้ตอบกับบริการและ API ที่ครอบคลุม 20 โดเมน ตั้งแต่ธนาคารและกิจกรรมไปจนถึงสื่อ ปฏิทิน การเดินทาง และสภาพอากาศ สำหรับโดเมนส่วนใหญ่เหล่านี้ ชุดข้อมูลประกอบด้วย API ที่แตกต่างกันหลายตัว ซึ่งหลายตัวมีฟังก์ชันการทำงานที่ทับซ้อนกัน แต่มีอินเทอร์เฟซที่แตกต่างกัน ซึ่งสะท้อนถึงสถานการณ์ทั่วไปในโลกแห่งความเป็นจริง คำอธิบายประกอบที่มีอยู่อย่างหลากหลายสามารถใช้สำหรับการคาดคะเนความตั้งใจ การเติมช่อง การติดตามสถานะการสนทนา การเรียนรู้การเลียนแบบนโยบาย การสร้างภาษา การเรียนรู้การจำลองผู้ใช้ รวมถึงงานอื่นๆ ในผู้ช่วยเสมือนขนาดใหญ่ นอกจากนี้ ชุดข้อมูลยังมีโดเมนและบริการที่มองไม่เห็นในชุดการประเมินเพื่อวัดประสิทธิภาพในการตั้งค่าแบบไม่มีช็อตหรือช็อตน้อย
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
ซอร์สโค้ด :
tfds.datasets.schema_guided_dialogue.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
35.12 MiB
ขนาดชุดข้อมูล :
25.36 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ลำโพงตัวแรก | ป้ายกำกับคลาส | int64 | ||
ข้อมูลเมตา | คุณสมบัติDict | |||
ข้อมูลเมตา/บริการ | ลำดับ | |||
ข้อมูลเมตา/บริการ/ชื่อ | เทนเซอร์ | สตริง | ||
คำพูด | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}