इरेज़र_मल्टी_आरसी

  • विवरण :

इरेज़र मल्टी आरसी बहु-पंक्ति मार्ग पर प्रश्नों के लिए एक डेटासेट है, साथ ही उत्तर और एक तर्क। इस डेटासेट के प्रत्येक उदाहरण में निम्नलिखित 5 भाग हैं

  1. एक मुटली-लाइन मार्ग 2. मार्ग के बारे में एक प्रश्न 3. प्रश्न का उत्तर
  2. उत्तर सही है या गलत इसका वर्गीकरण 5. वर्गीकरण को न्यायोचित ठहराने वाला स्पष्टीकरण
विभाजित करना उदाहरण
'test' 4,848
'train' 24,029
'validation' 3,214
  • फ़ीचर संरचना :
FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
सबूत अनुक्रम (पाठ) (कोई भी नहीं,) डोरी
लेबल क्लासलेबल int64
रास्ता मूलपाठ डोरी
query_and_answer मूलपाठ डोरी
  • उद्धरण :
@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}