- Açıklama :
Çok Türlü Doğal Dil Çıkarımı (MultiNLI) külliyatı, metinsel gereklilik bilgileriyle açıklama eklenmiş 433.000 cümle çiftinden oluşan kitle kaynaklı bir koleksiyondur. Korpus, SNLI korpusuna göre modellenmiştir, ancak bir dizi sözlü ve yazılı metin türünü kapsaması ve ayırt edici bir türler arası genelleme değerlendirmesini desteklemesi bakımından farklılık gösterir. Korpus, Kopenhag'daki EMNLP'de RepEval 2017 Çalıştayı'nın ortak görevi için temel görevi gördü.
Kaynak kodu :
tfds.text.MultiNLI
sürümler :
-
1.1.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
216.34 MiB
Veri kümesi boyutu :
89.50 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 392.702 |
'validation_matched' | 9.815 |
'validation_mismatched' | 9.832 |
- Özellik yapısı :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
hipotez | Metin | sicim | ||
etiket | SınıfEtiketi | int64 | ||
Öncül | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}