mctaco

  • opis :

MC-TACO to zestaw danych zawierający 13 000 par pytanie-odpowiedź, które wymagają czasowego zrozumienia zdrowego rozsądku. Zestaw danych zawiera pięć właściwości czasowych:

  1. czas trwania (jak długo trwa wydarzenie)
  2. uporządkowanie czasowe (typowa kolejność wydarzeń)
  3. typowy czas (kiedy ma miejsce zdarzenie)
  4. częstotliwość (jak często występuje zdarzenie)
  5. stacjonarność (czy stan jest utrzymywany przez bardzo długi czas lub w nieskończoność)

Mamy nadzieję, że ten zestaw danych może promować przyszłą eksplorację tej konkretnej klasy problemów rozumowania.

Podział Przykłady
'test' 9442
'validation' 3783
  • Struktura funkcji :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
odpowiedź Tekst strunowy
Kategoria Etykieta klasy int64
etykieta Etykieta klasy int64
pytanie Tekst strunowy
zdanie Tekst strunowy
  • Cytat :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}