- Descripción :
Este conjunto de datos contiene traducciones automáticas de MNLI a cada uno de los idiomas XNLI. Los datos de traducción son proporcionados por XTREME. Tenga en cuenta que esto es diferente de los datos traducidos automáticamente proporcionados por el documento XNLI original.
Página de inicio: https://www.nyu.edu/projects/bowman/xnli/
Código fuente :
tfds.text.xtreme_xnli.XtremeXnli
Versiones :
-
1.1.0
(predeterminado): Sin notas de la versión.
-
Tamaño de descarga :
2.31 GiB
Tamaño del conjunto de datos :
1.59 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 392,570 |
- Estructura de características :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
hipótesis | TraducciónVariableIdiomas | |||
hipótesis/lenguaje | Texto | cuerda | ||
hipótesis/traducción | Texto | cuerda | ||
etiqueta | Etiqueta de clase | int64 | ||
premisa | Traducción | |||
premisa/ar | Texto | cuerda | ||
premisa/bg | Texto | cuerda | ||
premisa/de | Texto | cuerda | ||
premisa/el | Texto | cuerda | ||
premisa/es | Texto | cuerda | ||
premisa/s | Texto | cuerda | ||
premisa/es | Texto | cuerda | ||
premisa/hola | Texto | cuerda | ||
premisa/ru | Texto | cuerda | ||
premisa/sw | Texto | cuerda | ||
premisa/th | Texto | cuerda | ||
premisa/tr | Texto | cuerda | ||
premisa/ur | Texto | cuerda | ||
premisa/vi | Texto | cuerda | ||
premisa/zh | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}