ai2_arc

  • คำอธิบาย :

ชุดข้อมูลใหม่ของคำถามวิทยาศาสตร์แบบปรนัยระดับประถมศึกษาของแท้ 7,787 ข้อ รวบรวมเพื่อสนับสนุนการวิจัยในการตอบคำถามขั้นสูง ชุดข้อมูลถูกแบ่งออกเป็น Challenge Set และ Easy Set โดยที่ชุดแรกมีเพียงคำถามที่ตอบผิดโดยทั้งอัลกอริทึมที่ใช้การดึงข้อมูลและอัลกอริธึมการเกิดร่วมกันของคำ นอกจากนี้ เรายังรวมคลังข้อมูลประโยควิทยาศาสตร์กว่า 14 ล้านประโยคที่เกี่ยวข้องกับงาน และการนำโมเดลพื้นฐานทางประสาทสามแบบมาใช้สำหรับชุดข้อมูลนี้ เรากำหนดให้ ARC เป็นความท้าทายต่อชุมชน

  • โฮมเพจ : https://allenai.org/data/arc

  • รหัสที่มา : tfds.datasets.ai2_arc.Builder

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดการดาวน์โหลด : 649.30 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • โครงสร้างคุณลักษณะ :

FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'choices': Sequence({
        'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
        'text': Text(shape=(), dtype=string),
    }),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
คีย์คำตอบ ป้ายกำกับคลาส int64
ทางเลือก ลำดับ
ตัวเลือก/ฉลาก ป้ายกำกับคลาส int64
ตัวเลือก/ข้อความ ข้อความ สตริง
รหัส ข้อความ สตริง
คำถาม ข้อความ สตริง
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • รูปภาพ ( tfds.show_examples ): ไม่รองรับ

  • การอ้างอิง :

@article{allenai:arc,
      author    = {Peter Clark  and Isaac Cowhey and Oren Etzioni and Tushar Khot and
                    Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
      title     = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
      journal   = {arXiv:1803.05457v1},
      year      = {2018},
}

ai2_arc/ARC-Challenge (ค่าเริ่มต้น)

  • คำอธิบาย การกำหนดค่า : Challenge Set of 2590 คำถาม "ยาก" (ผู้ที่ทั้งวิธีดึงข้อมูลและวิธีที่เกิดขึ้นร่วมกันไม่สามารถตอบได้อย่างถูกต้อง)

  • ขนาดชุดข้อมูล : 939.91 KiB

  • แยก :

แยก ตัวอย่าง
'test' 1,172
'train' 1,119
'validation' 299

ai2_arc/ARC-ง่าย

  • คำอธิบาย การกำหนดค่า: ชุดคำถาม 5197 ข้ออย่างง่ายสำหรับ ARC Challenge

  • ขนาดชุดข้อมูล : 1.63 MiB

  • แยก :

แยก ตัวอย่าง
'test' 2,376
'train' 2,251
'validation' 570