- বর্ণনা :
BoolQ হল 15942টি উদাহরণ সম্বলিত হ্যাঁ/না প্রশ্নের জন্য একটি প্রশ্নের উত্তর দেওয়ার ডেটাসেট। এই প্রশ্নগুলি স্বাভাবিকভাবেই ঘটছে, এগুলি অপ্রস্তুত এবং অনিয়ন্ত্রিত সেটিংসে তৈরি হয়।
প্রতিটি উদাহরণ হল ঐচ্ছিক অতিরিক্ত প্রসঙ্গ হিসাবে পৃষ্ঠার শিরোনাম সহ (প্রশ্ন, উত্তরণ, উত্তর) এর একটি ট্রিপলেট। পাঠ্য-জোড়া শ্রেণীবিভাগ সেটআপ বিদ্যমান প্রাকৃতিক ভাষা অনুমান কার্যের অনুরূপ।
হোমপেজ : https://github.com/google-research-datasets/boolean-questions
সোর্স কোড :
tfds.datasets.bool_q.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
8.36 MiB
ডেটাসেটের আকার :
8.51 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 9,427 |
'validation' | 3,270 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উত্তর | টেনসর | bool | ||
উত্তরণ | পাঠ্য | স্ট্রিং | ||
প্রশ্ন | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}