- opis :
MC-TACO to zestaw danych zawierający 13 000 par pytanie-odpowiedź, które wymagają czasowego zrozumienia zdrowego rozsądku. Zestaw danych zawiera pięć właściwości czasowych:
- czas trwania (jak długo trwa wydarzenie)
- uporządkowanie czasowe (typowa kolejność wydarzeń)
- typowy czas (kiedy ma miejsce zdarzenie)
- częstotliwość (jak często występuje zdarzenie)
- stacjonarność (czy stan jest utrzymywany przez bardzo długi czas lub w nieskończoność)
Mamy nadzieję, że ten zestaw danych może promować przyszłą eksplorację tej konkretnej klasy problemów rozumowania.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/CogComp/MCTACO
Kod źródłowy :
tfds.datasets.mctaco.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
2.27 MiB
Rozmiar zestawu danych :
3.18 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Podział | Przykłady |
---|---|
'test' | 9442 |
'validation' | 3783 |
- Struktura funkcji :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odpowiedź | Tekst | strunowy | ||
Kategoria | Etykieta klasy | int64 | ||
etykieta | Etykieta klasy | int64 | ||
pytanie | Tekst | strunowy | ||
zdanie | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}