- คำอธิบาย :
ชุดข้อมูลที่มีการสนทนา 14K พร้อมคู่คำถาม-คำตอบ 81,000 คู่ QReCC สร้างขึ้นจากคำถามจาก TREC CAsT, QuAC และ Google Natural Questions
หน้าแรก : https://github.com/apple/ml-qrecc
ซอร์สโค้ด :
tfds.text.qrecc.QReCC
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดดาวน์โหลด :
7.60 MiB
ขนาดชุดข้อมูล :
69.29 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 16,451 |
'train' | 63,501 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คำตอบ | ข้อความ | เชือก | ||
answer_url | ข้อความ | เชือก | ||
บริบท | ลำดับ(ข้อความ) | (ไม่มี,) | เชือก | |
การสนทนา_id | สเกลาร์ | int32 | รหัสของการสนทนา | |
คำถาม | ข้อความ | เชือก | ||
คำถาม_เขียนใหม่ | ข้อความ | เชือก | ||
แหล่งที่มา | ข้อความ | เชือก | แหล่งที่มาดั้งเดิมของข้อมูล ไม่ว่าจะเป็น QuAC, CAsT หรือคำถามทั่วไป | |
Turn_id | สเกลาร์ | int32 | รหัสของการสนทนาภายในการสนทนา |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}