- คำอธิบาย :
MC-TACO เป็นชุดข้อมูลของคู่คำถาม-คำตอบ 13,000 คู่ ซึ่งต้องอาศัยความเข้าใจในสามัญสำนึกชั่วคราว ชุดข้อมูลประกอบด้วยห้าคุณสมบัติชั่วคราว:
- ระยะเวลา (ระยะเวลาที่เหตุการณ์ใช้เวลา)
- ลำดับชั่วขณะ (ลำดับเหตุการณ์โดยทั่วไป)
- เวลาปกติ (เมื่อเหตุการณ์เกิดขึ้น)
- ความถี่ (เหตุการณ์เกิดขึ้นบ่อยเพียงใด)
- ความนิ่ง (ไม่ว่าสถานะจะคงอยู่เป็นเวลานานมากหรือไม่มีกำหนด)
เราหวังว่าชุดข้อมูลนี้สามารถส่งเสริมการสำรวจปัญหาการใช้เหตุผลในระดับนี้ในอนาคต
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://github.com/CogComp/MCTACO
รหัสที่มา :
tfds.datasets.mctaco.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
2.27 MiB
ขนาดชุดข้อมูล :
3.18 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 9,442 |
'validation' | 3,783 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คำตอบ | ข้อความ | สตริง | ||
หมวดหมู่ | ป้ายกำกับคลาส | int64 | ||
ฉลาก | ป้ายกำกับคลาส | int64 | ||
คำถาม | ข้อความ | สตริง | ||
ประโยค | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}