فلوريس

  • الوصف :

مجموعات بيانات التقييم للترجمة الآلية منخفضة الموارد: النيبالية-الإنجليزية والسنهالية-الإنجليزية.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

فلوريس / نين (التكوين الافتراضي)

  • وصف التكوين : مجموعة بيانات الترجمة من ne إلى en.

  • حجم مجموعة البيانات : 1.89 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2835
'validation' 2،559
  • هيكل الميزة :
Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
ترجمة
en نص سلسلة
شمال شرق نص سلسلة

فلوريس / سين

  • وصف التكوين : مجموعة بيانات الترجمة من si إلى en.

  • حجم مجموعة البيانات : 2.05 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2766
'validation' 2898
  • هيكل الميزة :
Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
ترجمة
en نص سلسلة
سا نص سلسلة