- Descripción :
Conjuntos de datos de evaluación para traducción automática de bajos recursos: nepalí-inglés y cingalés-inglés.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/facebookresearch/flores/
Código fuente :
tfds.translate.Flores
Versiones :
-
1.2.0
(predeterminado): Sin notas de la versión.
-
Tamaño de descarga :
1.47 MiB
Almacenamiento automático en caché ( documentación ): Sí
Figura ( tfds.show_examples ): no compatible.
Cita :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (configuración predeterminada)
Descripción de la configuración : conjunto de datos de traducción de ne a en.
Tamaño del conjunto de datos :
1.89 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,835 |
'validation' | 2,559 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
Traducción | ||||
es | Texto | cuerda | ||
nordeste | Texto | cuerda |
Teclas supervisadas (ver
as_supervised
doc ):('ne', 'en')
Ejemplos ( tfds.as_dataframe ):
flores/sién
Descripción de la configuración : conjunto de datos de traducción de si a en.
Tamaño del conjunto de datos :
2.05 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,766 |
'validation' | 2,898 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
Traducción | ||||
es | Texto | cuerda | ||
si | Texto | cuerda |
Teclas supervisadas (ver
as_supervised
doc ):('si', 'en')
Ejemplos ( tfds.as_dataframe ):