- 설명 :
HellaSwag 데이터 세트는 Commonsense NLI의 벤치마크입니다. 여기에는 컨텍스트와 컨텍스트를 완성하는 일부 엔딩이 포함됩니다.
소스 코드 :
tfds.text.Hellaswag
버전 :
-
0.0.1
: 릴리스 노트가 없습니다. -
1.0.0
: 도메인 내 및 도메인 외부 유효성 검사/테스트 세트에 대해 별도의 분할을 추가합니다. -
1.1.0
(기본값): 소스에 대한 또 다른 분할 차원(wikihow 대 activitynet)
-
다운로드 크기 :
68.18 MiB
데이터 세트 크기 :
107.45 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'test' | 10,003 |
'test_ind_activitynet' | 1,870 |
'test_ind_wikihow' | 3,132 |
'test_ood_activitynet' | 1,651 |
'test_ood_wikihow' | 3,350 |
'train' | 39,905 |
'train_activitynet' | 14,740 |
'train_wikihow' | 25,165 |
'validation' | 10,042 |
'validation_ind_activitynet' | 1,809 |
'validation_ind_wikihow' | 3,192 |
'validation_ood_activitynet' | 1,434 |
'validation_ood_wikihow' | 3,607 |
- 기능 구조 :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
활동_라벨 | 텍스트 | 끈 | ||
문맥 | 텍스트 | 끈 | ||
결말 | 시퀀스(텍스트) | (없음,) | 끈 | |
상표 | 텐서 | int32 | ||
source_id | 텍스트 | 끈 | ||
split_type | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}