- বর্ণনা :
রেস হল 28,000টিরও বেশি প্যাসেজ এবং প্রায় 100,000টি প্রশ্ন সহ একটি বৃহৎ মাপের রিডিং কম্প্রিহেনশন ডেটাসেট৷ ডেটাসেটটি চীনের ইংরেজি পরীক্ষা থেকে সংগ্রহ করা হয়েছে, যেটি মাধ্যমিক ও উচ্চ বিদ্যালয়ের শিক্ষার্থীদের জন্য ডিজাইন করা হয়েছে। ডেটাসেটটি মেশিন বোঝার জন্য প্রশিক্ষণ এবং পরীক্ষার সেট হিসাবে পরিবেশন করা যেতে পারে।
কনফিগারেশনের বিবরণ : RACE ডেটাসেটের জন্য বিল্ডার কনফিগারেশন।
উত্স কোড :
tfds.datasets.race.Builder
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
2.0.0
(ডিফল্ট): উদাহরণ আইডি যোগ করুন।
-
ডাউনলোড সাইজ :
24.26 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বৈশিষ্ট্য গঠন :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উত্তর | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | |
নিবন্ধ | পাঠ্য | স্ট্রিং | ||
উদাহরণ_আইডি | পাঠ্য | স্ট্রিং | ||
বিকল্প | ক্রম(ক্রম(পাঠ্য)) | (কোনটিই নয়) | স্ট্রিং | |
প্রশ্ন | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
জাতি/উচ্চ (ডিফল্ট কনফিগারেশন)
ডেটাসেটের আকার :
52.39 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- উদাহরণ ( tfds.as_dataframe ):
জাতি/মধ্যম
ডেটাসেটের আকার :
12.51 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- উদাহরণ ( tfds.as_dataframe ):