- বর্ণনা :
MLQA (Multilingual Question Answering Dataset) হল বহুভাষিক প্রশ্নের উত্তরের কার্যকারিতা মূল্যায়নের জন্য একটি বেঞ্চমার্ক ডেটাসেট। ডেটাসেটটি 7টি ভাষা নিয়ে গঠিত: আরবি, জার্মান, স্প্যানিশ, ইংরেজি, হিন্দি, ভিয়েতনামী, চীনা।
সোর্স কোড :
tfds.datasets.mlqa.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
72.21 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বৈশিষ্ট্য গঠন :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উত্তর | ক্রম | |||
উত্তর/উত্তর_শুরু | টেনসর | int32 | ||
উত্তর/পাঠ্য | পাঠ্য | স্ট্রিং | ||
প্রসঙ্গ | পাঠ্য | স্ট্রিং | ||
আইডি | টেনসর | স্ট্রিং | ||
প্রশ্ন | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : MLQA 'ar' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
9.28 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | ৫,৩৩৫ |
'validation' | 517 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/de
কনফিগারেশনের বিবরণ : MLQA 'de' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
5.06 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 4,517 |
'validation' | 512 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/en
কনফিগারেশনের বিবরণ : MLQA 'en' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
15.72 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 11,590 |
'validation' | 1,148 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/es
কনফিগারেশনের বিবরণ : MLQA 'es' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
5.09 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 5,253 |
'validation' | 500 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/hi
কনফিগারেশনের বিবরণ : MLQA 'হাই' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
12.83 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 4,918 |
'validation' | 507 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/vi
কনফিগারেশনের বিবরণ : MLQA 'vi' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
8.77 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | ৫,৪৯৫ |
'validation' | 511 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/zh
কনফিগারেশনের বিবরণ : MLQA 'zh' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
5.13 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 5,137 |
'validation' | 504 |
- উদাহরণ ( tfds.as_dataframe ):