- Açıklama :
DocNLI, belge düzeyinde doğal dil çıkarımı (NLI) için büyük ölçekli bir veri kümesidir. DocNLI, çok çeşitli NLP sorunlarından dönüştürülür ve birden çok metin türünü kapsar. Önermeler her zaman belge ayrıntı düzeyinde kalırken, hipotezlerin uzunluğu tek bir cümleden yüzlerce kelimelik pasajlara kadar değişir. Mevcut bazı cümle düzeyinde NLI veri kümelerinin aksine, DocNLI oldukça sınırlı eserlere sahiptir.
Ana Sayfa : https://github.com/salesforce/DocNLI/
Kaynak kodu :
tfds.text.docnli.DocNLI
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
313.89 MiB
Veri kümesi boyutu :
3.07 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 267.086 |
'train' | 942.314 |
'validation' | 234.258 |
- Özellik yapısı :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
hipotez | Metin | sicim | ||
etiket | SınıfEtiketi | int64 | ||
Öncül | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{yin-etal-2021-docnli,
title={DocNLI: A Large-scale Dataset for Document-level Natural Language Inference},
author={Wenpeng Yin and Dragomir Radev and Caiming Xiong},
booktitle = "Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021",
month = aug,
year = "2021",
address = "Bangkok, Thailand",
publisher = "Association for Computational Linguistics",
}