- คำอธิบาย :
ชุดข้อมูล HellaSwag เป็นมาตรฐานสำหรับ Commonsense NLI ประกอบด้วยบริบทและส่วนท้ายบางส่วนที่ทำให้บริบทสมบูรณ์
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://rowanzellers.com/hellaswag/
รหัสที่มา :
tfds.text.Hellaswag
รุ่น :
-
0.0.1
: ไม่มีบันทึกประจำรุ่น -
1.0.0
: การเพิ่มการแยกแยกกันสำหรับชุดการตรวจสอบความถูกต้อง/การทดสอบในโดเมนและนอกโดเมน -
1.1.0
(ค่าเริ่มต้น): อีกมิติแยกสำหรับแหล่งที่มา (wikihow vs activitynet)
-
ขนาดการดาวน์โหลด :
68.18 MiB
ขนาดชุดข้อมูล :
107.45 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 10,003 |
'test_ind_activitynet' | 1,870 |
'test_ind_wikihow' | 3,132 |
'test_ood_activitynet' | 1,651 |
'test_ood_wikihow' | 3,350 |
'train' | 39,905 |
'train_activitynet' | 14,740 |
'train_wikihow' | 25,165 |
'validation' | 10,042 |
'validation_ind_activitynet' | 1,809 |
'validation_ind_wikihow' | 3,192 |
'validation_ood_activitynet' | 1,434 |
'validation_ood_wikihow' | 3,607 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
activity_label | ข้อความ | สตริง | ||
บริบท | ข้อความ | สตริง | ||
ตอนจบ | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง | |
ฉลาก | เทนเซอร์ | int32 | ||
รหัสแหล่งที่มา | ข้อความ | สตริง | ||
split_type | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}