- Descrizione :
Questo set di dati contiene traduzioni automatiche dei dati di addestramento PAWS in inglese. Le traduzioni sono fornite dal benchmark XTREME e coprono le seguenti lingue:
- francese
- spagnolo
- Tedesco
- Cinese
- giapponese
- coreano
Per ulteriori dettagli su PAWS, vedere i documenti: PAWS: Paraphrase Adversaries from Word Scrambling su https://arxiv.org/abs/1904.01130 e PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification su https://arxiv. org/abs/1908.11828
Per i dettagli relativi a XTREME, fare riferimento a: XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization su https://arxiv.org/abs/2003.11080
Pagina iniziale : https://github.com/google-research/xtreme
Codice sorgente :
tfds.text.xtreme_pawsx.XtremePawsx
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Auto-cache ( documentazione ): Sì
Struttura delle caratteristiche :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
etichetta | ClassLabel | int64 | ||
frase1 | Testo | corda | ||
frase2 | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (configurazione predefinita)
Descrizione della configurazione : Tradotto in de
Dimensione del download :
22.34 MiB
Dimensione del set di dati:
14.19 MiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 49.340 |
- Esempi ( tfds.as_dataframe ):
xtreme_pawsx/es
Descrizione config : Tradotto in es
Dimensione del download :
22.27 MiB
Dimensione del set di dati:
14.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 49.244 |
- Esempi ( tfds.as_dataframe ):
xtreme_pawsx/fr
Descrizione della configurazione : Tradotto in fr
Dimensione del download :
22.70 MiB
Dimensione del set di dati:
14.53 MiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 49.208 |
- Esempi ( tfds.as_dataframe ):
xtreme_pawsx/ja
Descrizione della configurazione : Tradotto in ja
Dimensione del download :
25.12 MiB
Dimensione del set di dati:
16.98 MiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 49.086 |
- Esempi ( tfds.as_dataframe ):
xtreme_pawsx/ko
Descrizione della configurazione : Tradotto in ko
Dimensioni del download :
22.99 MiB
Dimensione del set di dati:
14.86 MiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 49.298 |
- Esempi ( tfds.as_dataframe ):
xtreme_pawsx/zh
Descrizione della configurazione : Tradotto in zh
Dimensione del download :
21.45 MiB
Dimensione del set di dati:
13.21 MiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 49.149 |
- Esempi ( tfds.as_dataframe ):