चरम

  • विवरण :

एक्सट्रीम बेंचमार्क

बहुभाषी एनकोडर्स (XTREME) बेंचमार्क का क्रॉस-लिंगुअल ट्रांसफ़र मूल्यांकन पूर्व-प्रशिक्षित बहुभाषी मॉडल की क्रॉस-लिंगुअल सामान्यीकरण क्षमता के मूल्यांकन के लिए एक बेंचमार्क है। इसमें 40 विशिष्ट रूप से विविध भाषाओं (12 भाषा परिवारों में फैले हुए) शामिल हैं और इसमें नौ कार्य शामिल हैं जिन्हें सामूहिक रूप से वाक्य रचना और शब्दार्थ के विभिन्न स्तरों के बारे में तर्क की आवश्यकता होती है। XTREME में भाषाओं का चयन भाषा विविधता को अधिकतम करने, मौजूदा कार्यों में कवरेज और प्रशिक्षण डेटा की उपलब्धता के लिए किया जाता है। इनमें से कई कम अध्ययन वाली भाषाएँ हैं, जैसे द्रविड़ भाषाएँ तमिल (दक्षिणी भारत, श्रीलंका और सिंगापुर में बोली जाने वाली), तेलुगु और मलयालम (मुख्य रूप से दक्षिणी भारत में बोली जाती हैं), और नाइजर-कांगो भाषाएँ स्वाहिली और योरूबा बोली जाती हैं। अफ्रीका में।

बेंचमार्क के पूर्ण विवरण के लिए, पेपर देखें।

  • मुखपृष्ठ :

https://sites.research.google/xtreme