mlqa

  • বর্ণনা :

MLQA (Multilingual Question Answering Dataset) হল বহুভাষিক প্রশ্নের উত্তরের কার্যকারিতা মূল্যায়নের জন্য একটি বেঞ্চমার্ক ডেটাসেট। ডেটাসেটটি 7টি ভাষা নিয়ে গঠিত: আরবি, জার্মান, স্প্যানিশ, ইংরেজি, হিন্দি, ভিয়েতনামী, চীনা।

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
উত্তর ক্রম
উত্তর/উত্তর_শুরু টেনসর int32
উত্তর/পাঠ্য পাঠ্য স্ট্রিং
প্রসঙ্গ পাঠ্য স্ট্রিং
আইডি টেনসর স্ট্রিং
প্রশ্ন পাঠ্য স্ট্রিং
শিরোনাম পাঠ্য স্ট্রিং
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : MLQA 'ar' ডেভ এবং টেস্ট স্প্লিট।

  • ডেটাসেটের আকার : 9.28 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ৫,৩৩৫
'validation' 517

mlqa/de

  • কনফিগারেশনের বিবরণ : MLQA 'de' ডেভ এবং টেস্ট স্প্লিট।

  • ডেটাসেটের আকার : 5.06 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 4,517
'validation' 512

mlqa/en

  • কনফিগারেশনের বিবরণ : MLQA 'en' ডেভ এবং টেস্ট স্প্লিট।

  • ডেটাসেটের আকার : 15.72 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 11,590
'validation' 1,148

mlqa/es

  • কনফিগারেশনের বিবরণ : MLQA 'es' ডেভ এবং টেস্ট স্প্লিট।

  • ডেটাসেটের আকার : 5.09 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 5,253
'validation' 500

mlqa/hi

  • কনফিগারেশনের বিবরণ : MLQA 'হাই' ডেভ এবং টেস্ট স্প্লিট।

  • ডেটাসেটের আকার : 12.83 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 4,918
'validation' 507

mlqa/vi

  • কনফিগারেশনের বিবরণ : MLQA 'vi' ডেভ এবং টেস্ট স্প্লিট।

  • ডেটাসেটের আকার : 8.77 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ৫,৪৯৫
'validation' 511

mlqa/zh

  • কনফিগারেশনের বিবরণ : MLQA 'zh' ডেভ এবং টেস্ট স্প্লিট।

  • ডেটাসেটের আকার : 5.13 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 5,137
'validation' 504