wiki_dialog

  • คำอธิบาย :

WikiDialog เป็นชุดข้อมูลขนาดใหญ่ของการสนทนาเพื่อแสวงหาข้อมูลที่สร้างขึ้นโดยสังเคราะห์ แต่ละบทสนทนาในชุดข้อมูลมีผู้พูดสองคนซึ่งมีพื้นฐานมาจากข้อความจากวิกิพีเดียภาษาอังกฤษ: คำพูดของผู้พูดคนหนึ่งประกอบด้วยประโยคที่แน่นอนจากข้อความ; ลำโพงอีกตัวถูกสร้างขึ้นโดยโมเดลภาษาขนาดใหญ่

  • คำอธิบาย การกำหนดค่า: WikiDialog สร้างขึ้นจากไดอะล็อก inpainter ที่ปรับแต่งบน OR-QuAC และ QReCC OQ ย่อมาจาก OR-QuAC และ QReCC

  • หน้าแรก : https://github.com/google-research/dialog-inpainting#wikidialog-oq

  • รหัสแหล่งที่มา : tfds.text.wiki_dialog.WikiDialog

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
  • ขนาดการดาวน์โหลด : 7.04 GiB

  • ขนาดชุดข้อมูล : 36.58 GiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 11,264,129
'validation' 113,822
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'author_num': Sequence(int32),
    'passage': Text(shape=(), dtype=string),
    'pid': Text(shape=(), dtype=string),
    'sentences': Sequence(Text(shape=(), dtype=string)),
    'title': Text(shape=(), dtype=string),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ผู้เขียน_num ลำดับ (เทนเซอร์) (ไม่มี,) int32
ทางเดิน ข้อความ สตริง
ปิด ข้อความ สตริง
ประโยค ลำดับ (ข้อความ) (ไม่มี,) สตริง
ชื่อ ข้อความ สตริง
คำพูด ลำดับ (ข้อความ) (ไม่มี,) สตริง
  • การอ้างอิง :
@inproceedings{dai2022dialoginpainting,
  title={Dialog Inpainting: Turning Documents to Dialogs},
  author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
  booktitle={International Conference on Machine Learning (ICML)},
  year={2022},
  organization={PMLR}
}

wiki_dialog/OQ (การกำหนดค่าเริ่มต้น)