- Descriptif :
Cet ensemble de données contient des traductions automatiques de MNLI dans chacune des langues XNLI. Les données de traduction sont fournies par XTREME. Notez que cela est différent des données traduites par machine fournies par le papier XNLI d'origine.
Page d' accueil : https://www.nyu.edu/projects/bowman/xnli/
Code source :
tfds.text.xtreme_xnli.XtremeXnli
Versions :
-
1.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
2.31 GiB
Taille du jeu de données :
1.59 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 392 570 |
- Structure des fonctionnalités :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
hypothèse | TraductionVariableLanguages | |||
hypothèse/langage | Texte | chaîne de caractères | ||
hypothèse/traduction | Texte | chaîne de caractères | ||
étiquette | Étiquette de classe | int64 | ||
prémisse | Traduction | |||
prémisse / ar | Texte | chaîne de caractères | ||
prémisse/bg | Texte | chaîne de caractères | ||
prémisse/de | Texte | chaîne de caractères | ||
prémisse / el | Texte | chaîne de caractères | ||
prémisse/fr | Texte | chaîne de caractères | ||
prémisse(s) | Texte | chaîne de caractères | ||
prémisse/en | Texte | chaîne de caractères | ||
prémisse/salut | Texte | chaîne de caractères | ||
prémisse/ru | Texte | chaîne de caractères | ||
prémisse/sw | Texte | chaîne de caractères | ||
prémisse/th | Texte | chaîne de caractères | ||
prémisse/tr | Texte | chaîne de caractères | ||
prémisse / votre | Texte | chaîne de caractères | ||
prémisse/vi | Texte | chaîne de caractères | ||
prémisse/zh | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}