- विवरण :
इरेज़र मल्टी आरसी बहु-पंक्ति मार्ग पर प्रश्नों के लिए एक डेटासेट है, साथ ही उत्तर और एक तर्क। इस डेटासेट के प्रत्येक उदाहरण में निम्नलिखित 5 भाग हैं
- एक मुटली-लाइन मार्ग 2. मार्ग के बारे में एक प्रश्न 3. प्रश्न का उत्तर
- उत्तर सही है या गलत इसका वर्गीकरण 5. वर्गीकरण को न्यायोचित ठहराने वाला स्पष्टीकरण
मुखपृष्ठ : https://cogcomp.seas.upenn.edu/multirc/
स्रोत कोड :
tfds.text.EraserMultiRc
संस्करण :
-
0.1.1
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
1.59 MiB
डेटासेट का आकार :
62.59 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 4,848 |
'train' | 24,029 |
'validation' | 3,214 |
- फ़ीचर संरचना :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
सबूत | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी | |
लेबल | क्लासलेबल | int64 | ||
रास्ता | मूलपाठ | डोरी | ||
query_and_answer | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}