- Descriptif :
Ensembles de données d'évaluation pour la traduction automatique à faibles ressources : népalais-anglais et cinghalais-anglais.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/facebookresearch/flores/
Code source :
tfds.translate.Flores
Versions :
-
1.2.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
1.47 MiB
Mise en cache automatique ( documentation ): Oui
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (configuration par défaut)
Description de la configuration : ensemble de données de traduction de ne à en.
Taille du jeu de données :
1.89 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 2 835 |
'validation' | 2 559 |
- Structure des fonctionnalités :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
Traduction | ||||
fr | Texte | chaîne de caractères | ||
ne | Texte | chaîne de caractères |
Touches supervisées (Voir
as_supervised
doc ):('ne', 'en')
Exemples ( tfds.as_dataframe ):
flores/siens
Description de la configuration : ensemble de données de traduction de si à en.
Taille du jeu de données :
2.05 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 2 766 |
'validation' | 2 898 |
- Structure des fonctionnalités :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
Traduction | ||||
fr | Texte | chaîne de caractères | ||
si | Texte | chaîne de caractères |
Touches supervisées (Voir
as_supervised
doc ):('si', 'en')
Exemples ( tfds.as_dataframe ):