- Descrição :
Conjuntos de dados de avaliação para tradução automática de poucos recursos: nepalês-inglês e cingalês-inglês.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/facebookresearch/flores/
Código fonte :
tfds.translate.Flores
Versões :
-
1.2.0
(padrão): sem notas de versão.
-
Tamanho do download :
1.47 MiB
Cache automático ( documentação ): Sim
Figura ( tfds.show_examples ): Não suportado.
Citação :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (configuração padrão)
Descrição da configuração : Conjunto de dados de tradução de ne para en.
Tamanho do conjunto de dados :
1.89 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.835 |
'validation' | 2.559 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
ne | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('ne', 'en')
Exemplos ( tfds.as_dataframe ):
flores/sien
Descrição da configuração : Conjunto de dados de tradução de si para en.
Tamanho do conjunto de dados :
2.05 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.766 |
'validation' | 2.898 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
si | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('si', 'en')
Exemplos ( tfds.as_dataframe ):