- Descriptif :
Cet ensemble de données contient des traductions automatiques des données d'entraînement PAWS en anglais. Les traductions sont fournies par le benchmark XTREME et couvrent les langues suivantes :
- Français
- Espagnol
- Allemand
- Chinois
- Japonais
- coréen
Pour plus de détails sur PAWS, voir les articles : PAWS : Paraphrase Adversaries from Word Scrambling sur https://arxiv.org/abs/1904.01130 et PAWS-X : A Cross-lingual Adversarial Dataset for Paraphrase Identification sur https://arxiv. org/abs/1908.11828
Pour plus de détails sur XTREME, veuillez consulter : XTREME : A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization at https://arxiv.org/abs/2003.11080
Page d' accueil : https://github.com/google-research/xtreme
Code source :
tfds.text.xtreme_pawsx.XtremePawsx
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Mise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
étiquette | Étiquette de classe | int64 | ||
phrase1 | Texte | chaîne de caractères | ||
phrase2 | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (configuration par défaut)
Description de la configuration : Traduit en de
Taille du téléchargement :
22.34 MiB
Taille du jeu de données :
14.19 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 49 340 |
- Exemples ( tfds.as_dataframe ):
xtreme_pawsx/es
Description de la configuration : Traduit en es
Taille du téléchargement :
22.27 MiB
Taille du jeu de données :
14.09 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 49 244 |
- Exemples ( tfds.as_dataframe ):
xtreme_pawsx/fr
Description de la configuration : Traduit en fr
Taille du téléchargement :
22.70 MiB
Taille du jeu de données :
14.53 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 49 208 |
- Exemples ( tfds.as_dataframe ):
xtreme_pawsx/ja
Description de la configuration : Traduit en ja
Taille du téléchargement :
25.12 MiB
Taille du jeu de données :
16.98 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 49 086 |
- Exemples ( tfds.as_dataframe ):
xtreme_pawsx/ko
Description de la configuration : Traduit en ko
Taille du téléchargement :
22.99 MiB
Taille du jeu de données :
14.86 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 49 298 |
- Exemples ( tfds.as_dataframe ):
xtreme_pawsx/zh
Description de la configuration : Traduit en zh
Taille du téléchargement :
21.45 MiB
Taille du jeu de données :
13.21 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 49 149 |
- Exemples ( tfds.as_dataframe ):