- বর্ণনা :
MC-TACO হল 13k প্রশ্ন-উত্তর জোড়ার একটি ডেটাসেট যার জন্য টেম্পোরাল কমনসেন্স বোধগম্যতা প্রয়োজন। ডেটাসেটে পাঁচটি অস্থায়ী বৈশিষ্ট্য রয়েছে:
- সময়কাল (একটি ঘটনা কতক্ষণ নেয়)
- সাময়িক আদেশ (ঘটনার সাধারণ ক্রম)
- সাধারণ সময় (যখন একটি ঘটনা ঘটে)
- ফ্রিকোয়েন্সি (কতবার একটি ঘটনা ঘটে)
- স্থিতিশীলতা (একটি রাষ্ট্র খুব দীর্ঘ সময়ের জন্য বা অনির্দিষ্টকালের জন্য বজায় রাখা হয়)
আমরা আশা করি যে এই ডেটাসেটটি এই বিশেষ শ্রেণীর যুক্তি সমস্যাগুলির ভবিষ্যতের অন্বেষণকে উন্নীত করতে পারে।
হোমপেজ : https://github.com/CogComp/MCTACO
সোর্স কোড :
tfds.datasets.mctaco.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
2.27 MiB
ডেটাসেটের আকার :
3.18 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | ৯,৪৪২ |
'validation' | ৩,৭৮৩ |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উত্তর | পাঠ্য | স্ট্রিং | ||
বিভাগ | ক্লাসলেবেল | int64 | ||
লেবেল | ক্লাসলেবেল | int64 | ||
প্রশ্ন | পাঠ্য | স্ট্রিং | ||
বাক্য | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}