- Açıklama :
Eraser Multi RC, çok satırlı geçişler üzerinden sorgular, yanıtlar ve gerekçeyle birlikte bir veri kümesidir. Bu veri kümesindeki her örnek aşağıdaki 5 bölümden oluşur
- Çok Satırlı Bir Pasaj 2. Pasajla İlgili Bir Sorgulama 3. Sorguya Bir Cevap
- Cevabın doğru ya da yanlış olduğuna ilişkin bir Sınıflandırma 5. Sınıflandırmayı gerekçelendiren bir Açıklama
Ana sayfa : https://cogcomp.seas.upenn.edu/multirc/
Kaynak kodu :
tfds.text.EraserMultiRc
sürümler :
-
0.1.1
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
1.59 MiB
Veri kümesi boyutu :
62.59 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 4.848 |
'train' | 24.029 |
'validation' | 3.214 |
- Özellik yapısı :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
kanıtlar | Sıra(Metin) | (Hiçbiri,) | sicim | |
etiket | SınıfEtiketi | int64 | ||
geçit | Metin | sicim | ||
sorgu_ve_cevap | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}