- Açıklama :
SciTail veri seti, çoktan seçmeli bilim sınavları ve web cümlelerinden oluşturulan bir bilgi veri setidir. Her soru ve doğru cevap seçimi, hipotezi oluşturmak için iddialı bir ifadeye dönüştürülür. Bilgi alma, web cümlelerinden oluşan geniş bir metin külliyatından ilgili metni elde etmek için kullanılır ve bu cümleler bir öncül P olarak kullanılır. SciTail veri kümesini oluşturmak için. Veri seti, entails etiketli 10.101 örnek ve nötr etiketli 16.925 örnek olmak üzere 27.026 örnek içermektedir.
Anasayfa : https://allenai.org/data/scitail
Kaynak kodu :
tfds.datasets.sci_tail.Builder
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
13.52 MiB
Veri kümesi boyutu :
6.01 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 2.126 |
'train' | 23.097 |
'validation' | 1.304 |
- Özellik yapısı :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
hipotez | Metin | sicim | ||
etiket | SınıfEtiketi | int64 | ||
Öncül | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}