- Descrizione :
Il set di dati HellaSwag è un punto di riferimento per Commonsense NLI. Include un contesto e alcuni finali che completano il contesto.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://rowanzellers.com/hellaswag/
Codice sorgente :
tfds.text.Hellaswag
Versioni :
-
0.0.1
: Nessuna nota di rilascio. -
1.0.0
: Aggiunta di divisioni separate per set di convalida/test all'interno e all'esterno del dominio. -
1.1.0
(impostazione predefinita): un'altra dimensione divisa per la fonte (wikihow vs activitynet)
-
Dimensione del download :
68.18 MiB
Dimensione del set di dati:
107.45 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'test' | 10.003 |
'test_ind_activitynet' | 1.870 |
'test_ind_wikihow' | 3.132 |
'test_ood_activitynet' | 1.651 |
'test_ood_wikihow' | 3.350 |
'train' | 39.905 |
'train_activitynet' | 14.740 |
'train_wikihow' | 25.165 |
'validation' | 10.042 |
'validation_ind_activitynet' | 1.809 |
'validation_ind_wikihow' | 3.192 |
'validation_ood_activitynet' | 1.434 |
'validation_ood_wikihow' | 3.607 |
- Struttura delle caratteristiche :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
etichetta_attività | Testo | corda | ||
contesto | Testo | corda | ||
finali | Sequenza(Testo) | (Nessuno,) | corda | |
etichetta | Tensore | int32 | ||
source_id | Testo | corda | ||
split_type | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}