- الوصف :
مجموعات بيانات التقييم للترجمة الآلية منخفضة الموارد: النيبالية-الإنجليزية والسنهالية-الإنجليزية.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/facebookresearch/flores/
كود المصدر :
tfds.translate.Flores
إصدارات :
-
1.2.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
1.47 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
فلوريس / نين (التكوين الافتراضي)
وصف التكوين : مجموعة بيانات الترجمة من ne إلى en.
حجم مجموعة البيانات :
1.89 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2835 |
'validation' | 2،559 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
ترجمة | ||||
en | نص | سلسلة | ||
شمال شرق | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_supervised
doc ):('ne', 'en')
أمثلة ( tfds.as_dataframe ):
فلوريس / سين
وصف التكوين : مجموعة بيانات الترجمة من si إلى en.
حجم مجموعة البيانات :
2.05 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2766 |
'validation' | 2898 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
ترجمة | ||||
en | نص | سلسلة | ||
سا | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_supervised
doc ):('si', 'en')
أمثلة ( tfds.as_dataframe ):