openbookqa

  • คำอธิบาย :

ชุดข้อมูลประกอบด้วยคำถามปรนัย 4 ทาง 5,957 ข้อ นอกจากนี้ ยังมีข้อเท็จจริงความรู้ทั่วไป 5,167 รายการที่รวบรวมโดยฝูงชน และคำถามเกี่ยวกับการฝึกอบรม/การพัฒนา/การทดสอบในเวอร์ชันขยาย ซึ่งแต่ละคำถามเกี่ยวข้องกับข้อเท็จจริงหลักที่เป็นต้นกำเนิด คะแนนความแม่นยำของมนุษย์ คะแนนความชัดเจน และพนักงานฝูงชนที่ไม่เปิดเผยตัวตน รหัส

แยก ตัวอย่าง
'test' 500
'train' 4,957
'validation' 500
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'clarity': float32,
    'fact1': Text(shape=(), dtype=string),
    'humanScore': float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=string),
        'choice_B': Text(shape=(), dtype=string),
        'choice_C': Text(shape=(), dtype=string),
        'choice_D': Text(shape=(), dtype=string),
        'stem': Text(shape=(), dtype=string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
คีย์คำตอบ ป้ายกำกับคลาส int64
ความชัดเจน เทนเซอร์ ลอย32
ข้อเท็จจริง1 ข้อความ สตริง
คะแนนมนุษย์ เทนเซอร์ ลอย32
คำถาม คุณสมบัติDict
คำถาม/ทางเลือก_A ข้อความ สตริง
คำถาม/ทางเลือก_B ข้อความ สตริง
คำถาม/ทางเลือก_ค ข้อความ สตริง
คำถาม/ทางเลือก_D ข้อความ สตริง
คำถาม/ลำต้น ข้อความ สตริง
turkIdไม่ระบุชื่อ ข้อความ สตริง
  • การอ้างอิง :
@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}