цветы

  • Описание :

Оценочные наборы данных для малоресурсного машинного перевода: непальский-английский и сингальский-английский.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (конфигурация по умолчанию)

  • Описание конфигурации : набор данных перевода с ne на en.

  • Размер набора данных : 1.89 MiB .

  • Сплиты :

Расколоть Примеры
'test' 2835
'validation' 2559
  • Структура функции :
Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
Перевод
en Текст нить
пе Текст нить

флорес/сиен

  • Описание конфигурации : набор данных перевода с si на en.

  • Размер набора данных : 2.05 MiB .

  • Сплиты :

Расколоть Примеры
'test' 2766
'validation' 2898
  • Структура функции :
Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
Перевод
en Текст нить
си Текст нить