clin_oos

  • Descrizione :

I sistemi di dialogo orientati alle attività devono sapere quando una query non rientra nell'intervallo di intenti supportati, ma gli attuali corpora di classificazione del testo definiscono solo set di etichette che coprono ogni esempio. Introduciamo un nuovo set di dati che include query fuori ambito (OOS), ovvero query che non rientrano in nessuno degli intenti supportati dal sistema. Ciò pone una nuova sfida perché i modelli non possono presumere che ogni query al momento dell'inferenza appartenga a una classe di intenti supportata dal sistema. Il nostro set di dati copre anche 150 classi di intenti su 10 domini, catturando l'ampiezza che un agente orientato alle attività di produzione deve gestire. Offre un modo per valutare in modo più rigoroso e realistico la classificazione del testo nei sistemi di dialogo basati su attività.

Diviso Esempi
'test' 4.500
'test_oos' 1.000
'train' 15.000
'train_oos' 100
'validation' 3.000
'validation_oos' 100
  • Struttura delle caratteristiche :
FeaturesDict({
    'domain': int32,
    'domain_name': Text(shape=(), dtype=string),
    'intent': int32,
    'intent_name': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
dominio Tensore int32
nome del dominio Testo corda
intento Tensore int32
nome_intento Testo corda
testo Testo corda
  • Citazione :
@inproceedings{larson-etal-2019-evaluation,
    title = "An Evaluation Dataset for Intent Classification and Out-of-Scope Prediction",
    author = "Larson, Stefan  and
      Mahendran, Anish  and
      Peper, Joseph J.  and
      Clarke, Christopher  and
      Lee, Andrew  and
      Hill, Parker  and
      Kummerfeld, Jonathan K.  and
      Leach, Kevin  and
      Laurenzano, Michael A.  and
      Tang, Lingjia  and
      Mars, Jason",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D19-1131",
    doi = "10.18653/v1/D19-1131",
    pages = "1311--1316",
}