bilim_kuyruk

  • Açıklama :

SciTail veri seti, çoktan seçmeli bilim sınavları ve web cümlelerinden oluşturulan bir bilgi veri setidir. Her soru ve doğru cevap seçimi, hipotezi oluşturmak için iddialı bir ifadeye dönüştürülür. Bilgi alma, web cümlelerinden oluşan geniş bir metin külliyatından ilgili metni elde etmek için kullanılır ve bu cümleler bir öncül P olarak kullanılır. SciTail veri kümesini oluşturmak için. Veri seti, entails etiketli 10.101 örnek ve nötr etiketli 16.925 örnek olmak üzere 27.026 örnek içermektedir.

Bölmek örnekler
'test' 2.126
'train' 23.097
'validation' 1.304
  • Özellik yapısı :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
hipotez Metin sicim
etiket SınıfEtiketi int64
Öncül Metin sicim
  • Alıntı :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}