- الوصف :
MLQA (مجموعة بيانات الإجابة على الأسئلة متعددة اللغات) هي مجموعة بيانات معيارية لتقييم أداء الإجابة على الأسئلة متعددة اللغات. تتكون مجموعة البيانات من 7 لغات: العربية ، الألمانية ، الإسبانية ، الإنجليزية ، الهندية ، الفيتنامية ، الصينية.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/facebookresearch/MLQA
كود المصدر :
tfds.datasets.mlqa.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
72.21 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
الإجابات | تسلسل | |||
الإجابات / answer_start | موتر | int32 | ||
الإجابات / النص | نص | خيط | ||
سياق | نص | خيط | ||
بطاقة تعريف | موتر | خيط | ||
سؤال | نص | خيط | ||
عنوان | نص | خيط |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa / ar (التكوين الافتراضي)
وصف التكوين : MLQA 'ar' dev and test splits.
حجم مجموعة البيانات :
9.28 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 5335 |
'validation' | 517 |
- أمثلة ( tfds.as_dataframe ):
ملقا / دي
وصف التكوين : MLQA 'de' dev and test splits.
حجم مجموعة البيانات :
5.06 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 4517 |
'validation' | 512 |
- أمثلة ( tfds.as_dataframe ):
ملقا / ar
وصف التكوين : MLQA 'en' dev and test splits.
حجم مجموعة البيانات :
15.72 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 11.590 |
'validation' | 1148 |
- أمثلة ( tfds.as_dataframe ):
ملقا / ع
وصف التكوين : تقسيمات تطوير واختبار MLQA.
حجم مجموعة البيانات :
5.09 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 5253 |
'validation' | 500 |
- أمثلة ( tfds.as_dataframe ):
ملقا / مرحبا
وصف التكوين : MLQA 'hi' dev and test splits.
حجم مجموعة البيانات :
12.83 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 4918 |
'validation' | 507 |
- أمثلة ( tfds.as_dataframe ):
ملقا / السادس
وصف التكوين : MLQA 'vi' dev and test splits.
حجم مجموعة البيانات :
8.77 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 5،495 |
'validation' | 511 |
- أمثلة ( tfds.as_dataframe ):
ملقا / زه
وصف التكوين : MLQA 'zh' dev and test splits.
حجم مجموعة البيانات :
5.13 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 5137 |
'validation' | 504 |
- أمثلة ( tfds.as_dataframe ):