mctaco

  • Açıklama :

MC-TACO, zamansal sağduyu anlayışı gerektiren 13 bin soru-cevap çiftinden oluşan bir veri kümesidir. Veri kümesi beş geçici özellik içerir:

  1. süre (bir etkinliğin ne kadar sürdüğü)
  2. zamansal sıralama (tipik olay sırası)
  3. tipik zaman (bir olay meydana geldiğinde)
  4. sıklık (bir olayın meydana gelme sıklığı)
  5. durağanlık (bir durumun çok uzun bir süre veya süresiz olarak sürdürülmesi)

Bu veri setinin, bu özel muhakeme problemleri sınıfının gelecekteki keşfini destekleyebileceğini umuyoruz.

Bölmek örnekler
'test' 9.442
'validation' 3.783
  • Özellik yapısı :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
cevap Metin sicim
kategori SınıfEtiketi int64
etiket SınıfEtiketi int64
soru Metin sicim
cümle Metin sicim
  • Alıntı :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}