xtreme_xnli

  • Descriptif :

Cet ensemble de données contient des traductions automatiques de MNLI dans chacune des langues XNLI. Les données de traduction sont fournies par XTREME. Notez que cela est différent des données traduites par machine fournies par le papier XNLI d'origine.

Diviser Exemples
'train' 392 570
  • Structure des fonctionnalités :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
hypothèse TraductionVariableLanguages
hypothèse/langage Texte chaîne de caractères
hypothèse/traduction Texte chaîne de caractères
étiquette Étiquette de classe int64
prémisse Traduction
prémisse / ar Texte chaîne de caractères
prémisse/bg Texte chaîne de caractères
prémisse/de Texte chaîne de caractères
prémisse / el Texte chaîne de caractères
prémisse/fr Texte chaîne de caractères
prémisse(s) Texte chaîne de caractères
prémisse/en Texte chaîne de caractères
prémisse/salut Texte chaîne de caractères
prémisse/ru Texte chaîne de caractères
prémisse/sw Texte chaîne de caractères
prémisse/th Texte chaîne de caractères
prémisse/tr Texte chaîne de caractères
prémisse / votre Texte chaîne de caractères
prémisse/vi Texte chaîne de caractères
prémisse/zh Texte chaîne de caractères
  • Citation :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}