mctaco

  • Descrição :

MC-TACO é um conjunto de dados de 13 mil pares de perguntas e respostas que requerem compreensão de senso comum temporal. O conjunto de dados contém cinco propriedades temporais:

  1. duração (quanto tempo dura um evento)
  2. ordenação temporal (ordem típica de eventos)
  3. tempo típico (quando ocorre um evento)
  4. frequência (com que frequência um evento ocorre)
  5. estacionariedade (se um estado é mantido por muito tempo ou indefinidamente)

Esperamos que este conjunto de dados possa promover a exploração futura desta classe particular de problemas de raciocínio.

Dividir Exemplos
'test' 9.442
'validation' 3.783
  • Estrutura de recursos :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Recurso Aula Forma Tipo D Descrição
RecursosDict
responder Texto corda
categoria ClassLabel int64
rótulo ClassLabel int64
pergunta Texto corda
frase Texto corda
  • Citação :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}