openbookqa

  • الوصف :

تحتوي مجموعة البيانات على 5957 سؤالاً متعدد الخيارات. بالإضافة إلى ذلك ، فإنها توفر 5،167 حقائق معرفية مشتركة من مصادر جماعية ، ونسخة موسعة من أسئلة التدريب / التطوير / الاختبار حيث يرتبط كل سؤال بحقيقته الأساسية الأصلية ، ودرجة الدقة البشرية ، ودرجة الوضوح ، وعامل جماعي مجهول الهوية بطاقة تعريف.

انشق، مزق أمثلة
'test' 500
'train' 4،957
'validation' 500
  • هيكل الميزة :
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'clarity': float32,
    'fact1': Text(shape=(), dtype=string),
    'humanScore': float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=string),
        'choice_B': Text(shape=(), dtype=string),
        'choice_C': Text(shape=(), dtype=string),
        'choice_D': Text(shape=(), dtype=string),
        'stem': Text(shape=(), dtype=string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
مفتاح الحل ClassLabel int64
وضوح موتر تعويم 32
حقيقة 1 نص سلسلة
نقاط بشرية موتر تعويم 32
سؤال الميزات
السؤال / الاختيار نص سلسلة
السؤال / الاختيار_ب نص سلسلة
سؤال / اختيار_ نص سلسلة
سؤال / اختيار د نص سلسلة
السؤال / الجذعية نص سلسلة
مجهول نص سلسلة
  • الاقتباس :
@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}