- Descrizione :
MC-TACO è un set di dati di 13.000 coppie domanda-risposta che richiedono una comprensione del senso comune temporale. Il set di dati contiene cinque proprietà temporali:
- durata (quanto tempo impiega un evento)
- ordinamento temporale (ordine tipico degli eventi)
- tempo tipico (quando si verifica un evento)
- frequenza (quanto spesso si verifica un evento)
- stazionarietà (se uno stato viene mantenuto per un tempo molto lungo o indefinitamente)
Speriamo che questo set di dati possa promuovere la futura esplorazione di questa particolare classe di problemi di ragionamento.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://github.com/CogComp/MCTACO
Codice sorgente :
tfds.datasets.mctaco.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
2.27 MiB
Dimensione del set di dati:
3.18 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'test' | 9.442 |
'validation' | 3.783 |
- Struttura delle caratteristiche :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
risposta | Testo | corda | ||
categoria | ClassLabel | int64 | ||
etichetta | ClassLabel | int64 | ||
domanda | Testo | corda | ||
frase | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}