- विवरण :
एक्सट्रीम बेंचमार्क
बहुभाषी एनकोडर्स (XTREME) बेंचमार्क का क्रॉस-लिंगुअल ट्रांसफ़र मूल्यांकन पूर्व-प्रशिक्षित बहुभाषी मॉडल की क्रॉस-लिंगुअल सामान्यीकरण क्षमता के मूल्यांकन के लिए एक बेंचमार्क है। इसमें 40 विशिष्ट रूप से विविध भाषाओं (12 भाषा परिवारों में फैले हुए) शामिल हैं और इसमें नौ कार्य शामिल हैं जिन्हें सामूहिक रूप से वाक्य रचना और शब्दार्थ के विभिन्न स्तरों के बारे में तर्क की आवश्यकता होती है। XTREME में भाषाओं का चयन भाषा विविधता को अधिकतम करने, मौजूदा कार्यों में कवरेज और प्रशिक्षण डेटा की उपलब्धता के लिए किया जाता है। इनमें से कई कम अध्ययन वाली भाषाएँ हैं, जैसे द्रविड़ भाषाएँ तमिल (दक्षिणी भारत, श्रीलंका और सिंगापुर में बोली जाने वाली), तेलुगु और मलयालम (मुख्य रूप से दक्षिणी भारत में बोली जाती हैं), और नाइजर-कांगो भाषाएँ स्वाहिली और योरूबा बोली जाती हैं। अफ्रीका में।
बेंचमार्क के पूर्ण विवरण के लिए, पेपर देखें।
- मुखपृष्ठ :
https://sites.research.google/xtreme
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज
-
डिफ़ॉल्ट संस्करण में डेटासेट :
-
xnli
:xtreme_xnli:1.1.0
-
pawsx
:xtreme_pawsx:1.0.0
-
pos
:xtreme_pos:1.0.0
-
ner
:wikiann:1.0.0
-
xquad
:xquad:3.0.0
-
mlqa
:mlqa:1.0.0
-
tydiqa
:tydi_qa:3.0.0
-
bucc
:bucc:1.0.0
-
tatoeba
:tatoeba:1.0.0
-
उद्धरण :