far cadere

  • Descrizione :

Con le prestazioni del sistema sui benchmark di comprensione della lettura esistenti che si avvicinano o superano le prestazioni umane, abbiamo bisogno di un nuovo set di dati che migliori le capacità dei sistemi di leggere effettivamente i paragrafi di testo. DROP è un benchmark di 96.000 domande in crowdsourcing, creato in modo contraddittorio, in cui un sistema deve risolvere i riferimenti in una domanda, forse a più posizioni di input, ed eseguire operazioni discrete su di esse (come addizione, conteggio o ordinamento). Queste operazioni richiedono una comprensione molto più completa del contenuto dei paragrafi rispetto a quanto era necessario per i set di dati precedenti.

Diviso Esempi
'dev' 9.536
'train' 77.409
  • Struttura delle caratteristiche :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'passage': Text(shape=(), dtype=string),
    'query_id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
    'validated_answers': Sequence(Text(shape=(), dtype=string)),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
Rispondere Testo corda
passaggio Testo corda
query_id Testo corda
domanda Testo corda
risposte_validate Sequenza(Testo) (Nessuno,) corda
  • Citazione :
@inproceedings{Dua2019DROP,
  author={Dheeru Dua and Yizhong Wang and Pradeep Dasigi and Gabriel Stanovsky and Sameer Singh and Matt Gardner},
  title={  {DROP}: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs},
  booktitle={Proc. of NAACL},
  year={2019}
}