- Описание :
Оценочные наборы данных для малоресурсного машинного перевода: непальский-английский и сингальский-английский.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/facebookresearch/flores/
Исходный код :
tfds.translate.Flores
Версии :
-
1.2.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
1.47 MiB
Автоматическое кэширование ( документация ): Да
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (конфигурация по умолчанию)
Описание конфигурации : набор данных перевода с ne на en.
Размер набора данных :
1.89 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 2835 |
'validation' | 2559 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
Перевод | ||||
en | Текст | нить | ||
пе | Текст | нить |
Контролируемые ключи (см . документ
as_supervised
):('ne', 'en')
Примеры ( tfds.as_dataframe ):
флорес/сиен
Описание конфигурации : набор данных перевода с si на en.
Размер набора данных :
2.05 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 2766 |
'validation' | 2898 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
Перевод | ||||
en | Текст | нить | ||
си | Текст | нить |
Контролируемые ключи (см.
as_supervised
doc ):('si', 'en')
Примеры ( tfds.as_dataframe ):