- الوصف :
مجموعة بيانات SciTail هي مجموعة بيانات إلزامية تم إنشاؤها من امتحانات علمية متعددة الخيارات وجمل الويب. يتم تحويل كل سؤال واختيار الإجابة الصحيحة إلى بيان حازم لتشكيل الفرضية. يتم استخدام استرجاع المعلومات للحصول على نص ذي صلة من مجموعة نصية كبيرة من جمل الويب ، ويتم استخدام هذه الجمل كمقدمة. لإنشاء مجموعة بيانات SciTail. تحتوي مجموعة البيانات على 27،026 مثالًا مع 10101 مثالًا يتضمن تسمية و 16925 مثالًا مع تسمية محايدة.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://allenai.org/data/scitail
كود المصدر :
tfds.datasets.sci_tail.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
13.52 MiB
حجم مجموعة البيانات :
6.01 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2،126 |
'train' | 23.097 |
'validation' | 1،304 |
- هيكل الميزة :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
فرضية | نص | سلسلة | ||
ضع الكلمة المناسبة | ClassLabel | int64 | ||
فرضية | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}