answer_equivalence

คำอธิบาย :

ชุดข้อมูลความเท่าเทียมกันของคำตอบประกอบด้วยการให้คะแนนโดยมนุษย์ในการคาดคะเนแบบจำลองจากแบบจำลองต่างๆ ในชุดข้อมูล SQuAD การให้คะแนนกำหนดว่าคำตอบที่คาดคะเนนั้น 'เทียบเท่า' กับคำตอบทองคำหรือไม่ (พิจารณาทั้งคำถามและบริบท)

โดยเฉพาะอย่างยิ่ง โดยคำว่า 'เทียบเท่า' เราหมายความว่าคำตอบที่คาดคะเนมีข้อมูลอย่างน้อยเหมือนกับคำตอบทองคำ และไม่เพิ่มข้อมูลที่ไม่จำเป็น ชุดข้อมูลประกอบด้วยคำอธิบายประกอบสำหรับ: * การคาดคะเนจาก BiDAF บน SQuAD dev * การคาดคะเนจาก XLNet บน SQuAD dev * การคาดคะเนจาก Luke บน SQuAD dev * การคาดคะเนจาก Albert ในการฝึกอบรม SQuAD ผู้พัฒนา และตัวอย่างการทดสอบ

หน้าแรก : https://github.com/google-research-datasets/answer-equivalence-dataset
ซอร์สโค้ด : tfds.datasets.answer_equivalence.Builder
รุ่น :
- 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
ขนาดการดาวน์โหลด : 45.86 MiB
ขนาดชุดข้อมูล : 47.24 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :

แยก	ตัวอย่าง
`'ae_dev'`	4,446
`'ae_test'`	9,724
`'dev_bidaf'`	7,522
`'dev_luke'`	4,590
`'dev_xlnet'`	7,932
`'train'`	9,090

โครงสร้างคุณลักษณะ :

FeaturesDict({
    'candidate': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'gold_index': int32,
    'qid': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
    'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'reference': Text(shape=(), dtype=string),
    'score': float32,
})

เอกสารคุณสมบัติ :

ลักษณะเฉพาะ	ระดับ	Dประเภท
	คุณสมบัติDict
ผู้สมัคร	ข้อความ	สตริง
บริบท	ข้อความ	สตริง
gold_index	เทนเซอร์	int32
คิด	ข้อความ	สตริง
คำถาม	ข้อความ	สตริง
คำถามที่ 1	ป้ายกำกับคลาส	int64
คำถามที่ 2	ป้ายกำกับคลาส	int64
คำถามที่ 3	ป้ายกำกับคลาส	int64
คำถามที่ 4	ป้ายกำกับคลาส	int64
อ้างอิง	ข้อความ	สตริง
คะแนน	เทนเซอร์	ลอย32

คีย์ภายใต้การดูแล (ดู as_supervised doc ): None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):

การอ้างอิง :

@article{bulian-etal-2022-tomayto,
      title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
      author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
      year={2022},
      eprint={2202.07654},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}