- বর্ণনা :
স্বল্প-সম্পদ মেশিন অনুবাদের জন্য মূল্যায়ন ডেটাসেট: নেপালি-ইংরেজি এবং সিংহলা-ইংরেজি।
সোর্স কোড :
tfds.translate.Flores
সংস্করণ :
-
1.2.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
1.47 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : অনুবাদ ডেটাসেট ne থেকে en.
ডেটাসেটের আকার :
1.89 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,835 |
'validation' | 2,559 |
- বৈশিষ্ট্য গঠন :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
অনুবাদ | ||||
en | পাঠ্য | স্ট্রিং | ||
ne | পাঠ্য | স্ট্রিং |
তত্ত্বাবধানে থাকা কী (দেখুন
as_supervised
doc ):('ne', 'en')
উদাহরণ ( tfds.as_dataframe ):
flores/sien
কনফিগারেশনের বিবরণ : si থেকে en পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
2.05 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,766 |
'validation' | 2,898 |
- বৈশিষ্ট্য গঠন :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
অনুবাদ | ||||
en | পাঠ্য | স্ট্রিং | ||
si | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('si', 'en')
উদাহরণ ( tfds.as_dataframe ):