mctaco

  • Descrizione :

MC-TACO è un set di dati di 13.000 coppie domanda-risposta che richiedono una comprensione del senso comune temporale. Il set di dati contiene cinque proprietà temporali:

  1. durata (quanto tempo impiega un evento)
  2. ordinamento temporale (ordine tipico degli eventi)
  3. tempo tipico (quando si verifica un evento)
  4. frequenza (quanto spesso si verifica un evento)
  5. stazionarietà (se uno stato viene mantenuto per un tempo molto lungo o indefinitamente)

Speriamo che questo set di dati possa promuovere la futura esplorazione di questa particolare classe di problemi di ragionamento.

Diviso Esempi
'test' 9.442
'validation' 3.783
  • Struttura delle caratteristiche :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
risposta Testo corda
categoria ClassLabel int64
etichetta ClassLabel int64
domanda Testo corda
frase Testo corda
  • Citazione :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}