- คำอธิบาย :
ชุดข้อมูลใหม่ของคำถามวิทยาศาสตร์แบบปรนัยระดับประถมศึกษาของแท้ 7,787 ข้อ รวบรวมเพื่อสนับสนุนการวิจัยในการตอบคำถามขั้นสูง ชุดข้อมูลถูกแบ่งออกเป็น Challenge Set และ Easy Set โดยที่ชุดแรกมีเพียงคำถามที่ตอบผิดโดยทั้งอัลกอริทึมที่ใช้การดึงข้อมูลและอัลกอริธึมการเกิดร่วมกันของคำ นอกจากนี้ เรายังรวมคลังข้อมูลประโยควิทยาศาสตร์กว่า 14 ล้านประโยคที่เกี่ยวข้องกับงาน และการนำโมเดลพื้นฐานทางประสาทสามแบบมาใช้สำหรับชุดข้อมูลนี้ เรากำหนดให้ ARC เป็นความท้าทายต่อชุมชน
โฮมเพจ : https://allenai.org/data/arc
รหัสที่มา :
tfds.datasets.ai2_arc.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
649.30 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
โครงสร้างคุณลักษณะ :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=5),
'choices': Sequence({
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
'text': Text(shape=(), dtype=string),
}),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คีย์คำตอบ | ป้ายกำกับคลาส | int64 | ||
ทางเลือก | ลำดับ | |||
ตัวเลือก/ฉลาก | ป้ายกำกับคลาส | int64 | ||
ตัวเลือก/ข้อความ | ข้อความ | สตริง | ||
รหัส | ข้อความ | สตริง | ||
คำถาม | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@article{allenai:arc,
author = {Peter Clark and Isaac Cowhey and Oren Etzioni and Tushar Khot and
Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
title = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
journal = {arXiv:1803.05457v1},
year = {2018},
}
ai2_arc/ARC-Challenge (ค่าเริ่มต้น)
คำอธิบาย การกำหนดค่า : Challenge Set of 2590 คำถาม "ยาก" (ผู้ที่ทั้งวิธีดึงข้อมูลและวิธีที่เกิดขึ้นร่วมกันไม่สามารถตอบได้อย่างถูกต้อง)
ขนาดชุดข้อมูล :
939.91 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1,172 |
'train' | 1,119 |
'validation' | 299 |
- ตัวอย่าง ( tfds.as_dataframe ):
ai2_arc/ARC-ง่าย
คำอธิบาย การกำหนดค่า: ชุดคำถาม 5197 ข้ออย่างง่ายสำหรับ ARC Challenge
ขนาดชุดข้อมูล :
1.63 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,376 |
'train' | 2,251 |
'validation' | 570 |
- ตัวอย่าง ( tfds.as_dataframe ):