- Descripción :
El conjunto de datos HellaSwag es un punto de referencia para Commonsense NLI. Incluye un contexto y unas terminaciones que completan el contexto.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://rowanzellers.com/hellaswag/
Código fuente :
tfds.text.Hellaswag
Versiones :
-
0.0.1
: Sin notas de la versión. -
1.0.0
: Adición de divisiones separadas para conjuntos de validación/prueba dentro y fuera del dominio. -
1.1.0
(predeterminado): otra dimensión dividida para la fuente (wikihow vs activitynet)
-
Tamaño de la descarga :
68.18 MiB
Tamaño del conjunto de datos :
107.45 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 10,003 |
'test_ind_activitynet' | 1,870 |
'test_ind_wikihow' | 3,132 |
'test_ood_activitynet' | 1,651 |
'test_ood_wikihow' | 3,350 |
'train' | 39,905 |
'train_activitynet' | 14,740 |
'train_wikihow' | 25,165 |
'validation' | 10,042 |
'validation_ind_activitynet' | 1,809 |
'validation_ind_wikihow' | 3,192 |
'validation_ood_activitynet' | 1,434 |
'validation_ood_wikihow' | 3,607 |
- Estructura de características :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
etiqueta_actividad | Texto | cuerda | ||
contexto | Texto | cuerda | ||
terminaciones | Secuencia (Texto) | (Ninguna,) | cuerda | |
etiqueta | Tensor | int32 | ||
source_id | Texto | cuerda | ||
dividido | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}