mctaco

  • คำอธิบาย :

MC-TACO เป็นชุดข้อมูลของคู่คำถาม-คำตอบ 13,000 คู่ ซึ่งต้องอาศัยความเข้าใจในสามัญสำนึกชั่วคราว ชุดข้อมูลประกอบด้วยห้าคุณสมบัติชั่วคราว:

  1. ระยะเวลา (ระยะเวลาที่เหตุการณ์ใช้เวลา)
  2. ลำดับชั่วขณะ (ลำดับเหตุการณ์โดยทั่วไป)
  3. เวลาปกติ (เมื่อเหตุการณ์เกิดขึ้น)
  4. ความถี่ (เหตุการณ์เกิดขึ้นบ่อยเพียงใด)
  5. ความนิ่ง (ไม่ว่าสถานะจะคงอยู่เป็นเวลานานมากหรือไม่มีกำหนด)

เราหวังว่าชุดข้อมูลนี้สามารถส่งเสริมการสำรวจปัญหาการใช้เหตุผลในระดับนี้ในอนาคต

แยก ตัวอย่าง
'test' 9,442
'validation' 3,783
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
คำตอบ ข้อความ สตริง
หมวดหมู่ ป้ายกำกับคลาส int64
ฉลาก ป้ายกำกับคลาส int64
คำถาม ข้อความ สตริง
ประโยค ข้อความ สตริง
  • การอ้างอิง :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}