sci_tail

  • الوصف :

مجموعة بيانات SciTail هي مجموعة بيانات إلزامية تم إنشاؤها من امتحانات علمية متعددة الخيارات وجمل الويب. يتم تحويل كل سؤال واختيار الإجابة الصحيحة إلى بيان حازم لتشكيل الفرضية. يتم استخدام استرجاع المعلومات للحصول على نص ذي صلة من مجموعة نصية كبيرة من جمل الويب ، ويتم استخدام هذه الجمل كمقدمة. لإنشاء مجموعة بيانات SciTail. تحتوي مجموعة البيانات على 27،026 مثالًا مع 10101 مثالًا يتضمن تسمية و 16925 مثالًا مع تسمية محايدة.

انشق، مزق أمثلة
'test' 2،126
'train' 23.097
'validation' 1،304
  • هيكل الميزة :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
فرضية نص سلسلة
ضع الكلمة المناسبة ClassLabel int64
فرضية نص سلسلة
  • الاقتباس :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}