q_re_cc

  • คำอธิบาย :

ชุดข้อมูลที่มีการสนทนา 14K พร้อมคู่คำถาม-คำตอบ 81,000 คู่ QReCC สร้างขึ้นจากคำถามจาก TREC CAsT, QuAC และ Google Natural Questions

  • หน้าแรก : https://github.com/apple/ml-qrecc

  • ซอร์สโค้ด : tfds.text.qrecc.QReCC

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
  • ขนาดดาวน์โหลด : 7.60 MiB

  • ขนาดชุดข้อมูล : 69.29 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • แยก :

แยก ตัวอย่าง
'test' 16,451
'train' 63,501
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
คำตอบ ข้อความ เชือก
answer_url ข้อความ เชือก
บริบท ลำดับ(ข้อความ) (ไม่มี,) เชือก
การสนทนา_id สเกลาร์ int32 รหัสของการสนทนา
คำถาม ข้อความ เชือก
คำถาม_เขียนใหม่ ข้อความ เชือก
แหล่งที่มา ข้อความ เชือก แหล่งที่มาดั้งเดิมของข้อมูล ไม่ว่าจะเป็น QuAC, CAsT หรือคำถามทั่วไป
Turn_id สเกลาร์ int32 รหัสของการสนทนาภายในการสนทนา
  • การอ้างอิง :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}