- Descripción :
Este conjunto de datos contiene traducciones automáticas de los datos de entrenamiento de PAWS en inglés. Las traducciones son proporcionadas por el benchmark XTREME y cubren los siguientes idiomas:
- Francés
- español
- Alemán
- Chino
- japonés
- coreano
Para obtener más detalles sobre PAWS, consulte los artículos: PAWS: Paraphrase Adversaries from Word Scrambling en https://arxiv.org/abs/1904.01130 y PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification en https://arxiv. org/abs/1908.11828
Para obtener detalles relacionados con XTREME, consulte: XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization en https://arxiv.org/abs/2003.11080
Página de inicio: https://github.com/google-research/xtreme
Código fuente :
tfds.text.xtreme_pawsx.XtremePawsx
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Almacenamiento automático en caché ( documentación ): Sí
Estructura de características :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
etiqueta | Etiqueta de clase | int64 | ||
oracion1 | Texto | cuerda | ||
oracion2 | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (configuración predeterminada)
Descripción de la configuración : Traducido a de
Tamaño de la descarga :
22.34 MiB
Tamaño del conjunto de datos :
14.19 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 49,340 |
- Ejemplos ( tfds.as_dataframe ):
xtreme_pawsx/es
Descripción de la configuración : Traducido a es
Tamaño de la descarga :
22.27 MiB
Tamaño del conjunto de datos :
14.09 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 49,244 |
- Ejemplos ( tfds.as_dataframe ):
xtreme_pawsx/es
Descripción de la configuración : Traducido a fr
Tamaño de descarga :
22.70 MiB
Tamaño del conjunto de datos :
14.53 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 49,208 |
- Ejemplos ( tfds.as_dataframe ):
xtreme_pawsx/ja
Descripción de la configuración : Traducido a ja
Tamaño de la descarga :
25.12 MiB
Tamaño del conjunto de datos :
16.98 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 49,086 |
- Ejemplos ( tfds.as_dataframe ):
xtreme_pawsx/ko
Descripción de la configuración : Traducido a ko
Tamaño de la descarga :
22.99 MiB
Tamaño del conjunto de datos :
14.86 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 49,298 |
- Ejemplos ( tfds.as_dataframe ):
xtreme_pawsx/zh
Descripción de la configuración : Traducido a zh
Tamaño de la descarga :
21.45 MiB
Tamaño del conjunto de datos :
13.21 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 49,149 |
- Ejemplos ( tfds.as_dataframe ):