- คำอธิบาย :
Eraser Multi RC เป็นชุดข้อมูลสำหรับการสืบค้นข้อความหลายบรรทัด พร้อมด้วยคำตอบและเหตุผล แต่ละตัวอย่างในชุดข้อมูลนี้มี 5 ส่วนดังต่อไปนี้
- A Mutli-line Passage 2. คำถามเกี่ยวกับเนื้อเรื่อง 3. คำตอบสำหรับคำถาม
- ก. การจำแนกว่าคำตอบถูกหรือผิด 5. คำอธิบายที่สมควรแก่การจำแนก
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
รหัสที่มา :
tfds.text.EraserMultiRc
รุ่น :
-
0.1.1
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
1.59 MiB
ขนาดชุดข้อมูล :
62.59 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 4,848 |
'train' | 24,029 |
'validation' | 3,214 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
หลักฐาน | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง | |
ฉลาก | ป้ายกำกับคลาส | int64 | ||
ทางเดิน | ข้อความ | สตริง | ||
แบบสอบถาม_และ_คำตอบ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}