- বর্ণনা :
এক্সট্রিম বেঞ্চমার্ক
বহুভাষিক এনকোডারের ক্রস-লিঙ্গুয়াল ট্রান্সফার ইভালুয়েশন (XTREME) বেঞ্চমার্ক হল প্রাক-প্রশিক্ষিত বহুভাষিক মডেলের ক্রস-লিঙ্গুয়াল সাধারণীকরণ ক্ষমতার মূল্যায়নের জন্য একটি বেঞ্চমার্ক। এটি 40টি টাইপোলজিক্যালি বৈচিত্র্যময় ভাষা (12টি ভাষা পরিবারে বিস্তৃত) কভার করে এবং নয়টি কাজ অন্তর্ভুক্ত করে যেগুলির জন্য যৌথভাবে বাক্য গঠন এবং শব্দার্থবিদ্যার বিভিন্ন স্তর সম্পর্কে যুক্তির প্রয়োজন হয়৷ XTREME-এর ভাষাগুলিকে ভাষার বৈচিত্র্য, বিদ্যমান কাজগুলির কভারেজ এবং প্রশিক্ষণের ডেটার প্রাপ্যতা বাড়াতে বেছে নেওয়া হয়েছে। এর মধ্যে অনেক কম অধ্যয়ন করা ভাষা রয়েছে, যেমন দ্রাবিড় ভাষা তামিল (দক্ষিণ ভারত, শ্রীলঙ্কা এবং সিঙ্গাপুরে কথিত), তেলেগু এবং মালায়লাম (প্রধানত দক্ষিণ ভারতে কথিত), এবং নাইজার-কঙ্গো ভাষা সোয়াহিলি এবং ইওরুবা, কথ্য। আফ্রিকায়.
বেঞ্চমার্কের সম্পূর্ণ বিবরণের জন্য, কাগজটি দেখুন।
- হোমপেজ :
https://sites.research.google/xtreme
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ
-
ডিফল্ট সংস্করণে ডেটাসেট :
-
xnli
:xtreme_xnli:1.1.0
-
pawsx
:xtreme_pawsx:1.0.0
- অবস্থান:
pos
xtreme_pos:1.0.0
- ner:
ner
wikiann:1.0.0
-
xquad
:xquad:3.0.0
-
mlqa
:mlqa:1.0.0
-
tydiqa
:tydi_qa:3.0.0
-
bucc
:bucc:1.0.0
-
tatoeba
:tatoeba:1.0.0
-
উদ্ধৃতি :