- คำอธิบาย :
WikiDialog เป็นชุดข้อมูลขนาดใหญ่ของการสนทนาเพื่อแสวงหาข้อมูลที่สร้างขึ้นโดยสังเคราะห์ แต่ละบทสนทนาในชุดข้อมูลมีผู้พูดสองคนซึ่งมีพื้นฐานมาจากข้อความจากวิกิพีเดียภาษาอังกฤษ: คำพูดของผู้พูดคนหนึ่งประกอบด้วยประโยคที่แน่นอนจากข้อความ; ลำโพงอีกตัวถูกสร้างขึ้นโดยโมเดลภาษาขนาดใหญ่
คำอธิบาย การกำหนดค่า: WikiDialog สร้างขึ้นจากไดอะล็อก inpainter ที่ปรับแต่งบน OR-QuAC และ QReCC
OQ
ย่อมาจาก OR-QuAC และ QReCCหน้าแรก : https://github.com/google-research/dialog-inpainting#wikidialog-oq
รหัสแหล่งที่มา :
tfds.text.wiki_dialog.WikiDialog
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
7.04 GiB
ขนาดชุดข้อมูล :
36.58 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 11,264,129 |
'validation' | 113,822 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'author_num': Sequence(int32),
'passage': Text(shape=(), dtype=string),
'pid': Text(shape=(), dtype=string),
'sentences': Sequence(Text(shape=(), dtype=string)),
'title': Text(shape=(), dtype=string),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ผู้เขียน_num | ลำดับ (เทนเซอร์) | (ไม่มี,) | int32 | |
ทางเดิน | ข้อความ | สตริง | ||
ปิด | ข้อความ | สตริง | ||
ประโยค | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง | |
ชื่อ | ข้อความ | สตริง | ||
คำพูด | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{dai2022dialoginpainting,
title={Dialog Inpainting: Turning Documents to Dialogs},
author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
booktitle={International Conference on Machine Learning (ICML)},
year={2022},
organization={PMLR}
}