qasc

  • विवरण :

क्यूएएससी एक प्रश्न-उत्तर डेटासेट है जो वाक्य रचना पर ध्यान केंद्रित करता है। इसमें ग्रेड स्कूल साइंस (8,134 ट्रेन, 926 देव, 920 टेस्ट) के बारे में 9,980 8-वे बहुविकल्पीय प्रश्न शामिल हैं, और यह 17M वाक्यों के संग्रह के साथ आता है।

विभाजित करना उदाहरण
'test' 920
'train' 8,134
'validation' 926
  • फ़ीचर संरचना :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=string),
        'text': Text(shape=(), dtype=string),
    }),
    'combinedfact': Text(shape=(), dtype=string),
    'fact1': Text(shape=(), dtype=string),
    'fact2': Text(shape=(), dtype=string),
    'formatted_question': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
उत्तर कुंजी मूलपाठ डोरी
विकल्प क्रम
विकल्प / लेबल मूलपाठ डोरी
विकल्प / पाठ मूलपाठ डोरी
संयुक्ततथ्य मूलपाठ डोरी
तथ्य1 मूलपाठ डोरी
तथ्य2 मूलपाठ डोरी
formatted_question मूलपाठ डोरी
पहचान मूलपाठ डोरी
प्रश्न मूलपाठ डोरी
  • उद्धरण :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}