- বর্ণনা :
SciTail ডেটাসেট হল একটি এনটেইলমেন্ট ডেটাসেট যা একাধিক পছন্দের বিজ্ঞান পরীক্ষা এবং ওয়েব বাক্য থেকে তৈরি করা হয়েছে। প্রতিটি প্রশ্ন এবং সঠিক উত্তর পছন্দকে অনুমান গঠনের জন্য একটি দৃঢ় বিবৃতিতে রূপান্তরিত করা হয়। তথ্য পুনরুদ্ধার ব্যবহার করা হয় ওয়েব বাক্যের একটি বৃহৎ টেক্সট কর্পাস থেকে প্রাসঙ্গিক টেক্সট পেতে, এবং এই বাক্যগুলিকে একটি ভিত্তি P হিসাবে ব্যবহার করা হয়। এই ধরনের প্রিমিস-অনুমান জোড়ার টীকা ক্রাউডসোর্স করা হয় সমর্থন (এনটেইল) বা না (নিরপেক্ষ), ক্রমানুসারে। SciTail ডেটাসেট তৈরি করতে। ডেটাসেটে 27,026টি উদাহরণ রয়েছে যার 10,101টি এনটেল লেবেল সহ এবং 16,925টি নিরপেক্ষ লেবেল সহ উদাহরণ রয়েছে৷
হোমপেজ : https://allenai.org/data/scitail
সোর্স কোড :
tfds.datasets.sci_tail.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
13.52 MiB
ডেটাসেটের আকার :
6.01 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,126 |
'train' | 23,097 |
'validation' | 1,304 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
অনুমান | পাঠ্য | স্ট্রিং | ||
লেবেল | ক্লাসলেবেল | int64 | ||
ভিত্তি | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}