চরম

  • বর্ণনা :

এক্সট্রিম বেঞ্চমার্ক

বহুভাষিক এনকোডারের ক্রস-লিঙ্গুয়াল ট্রান্সফার ইভালুয়েশন (XTREME) বেঞ্চমার্ক হল প্রাক-প্রশিক্ষিত বহুভাষিক মডেলের ক্রস-লিঙ্গুয়াল সাধারণীকরণ ক্ষমতার মূল্যায়নের জন্য একটি বেঞ্চমার্ক। এটি 40টি টাইপোলজিক্যালি বৈচিত্র্যময় ভাষা (12টি ভাষা পরিবারে বিস্তৃত) কভার করে এবং নয়টি কাজ অন্তর্ভুক্ত করে যেগুলির জন্য যৌথভাবে বাক্য গঠন এবং শব্দার্থবিদ্যার বিভিন্ন স্তর সম্পর্কে যুক্তির প্রয়োজন হয়৷ XTREME-এর ভাষাগুলিকে ভাষার বৈচিত্র্য, বিদ্যমান কাজগুলির কভারেজ এবং প্রশিক্ষণের ডেটার প্রাপ্যতা বাড়াতে বেছে নেওয়া হয়েছে। এর মধ্যে অনেক কম অধ্যয়ন করা ভাষা রয়েছে, যেমন দ্রাবিড় ভাষা তামিল (দক্ষিণ ভারত, শ্রীলঙ্কা এবং সিঙ্গাপুরে কথিত), তেলেগু এবং মালায়লাম (প্রধানত দক্ষিণ ভারতে কথিত), এবং নাইজার-কঙ্গো ভাষা সোয়াহিলি এবং ইওরুবা, কথ্য। আফ্রিকায়.

বেঞ্চমার্কের সম্পূর্ণ বিবরণের জন্য, কাগজটি দেখুন।

  • হোমপেজ :

https://sites.research.google/xtreme