- Descrizione :
Con le prestazioni del sistema sui benchmark di comprensione della lettura esistenti che si avvicinano o superano le prestazioni umane, abbiamo bisogno di un nuovo set di dati che migliori le capacità dei sistemi di leggere effettivamente i paragrafi di testo. DROP è un benchmark di 96.000 domande in crowdsourcing, creato in modo contraddittorio, in cui un sistema deve risolvere i riferimenti in una domanda, forse a più posizioni di input, ed eseguire operazioni discrete su di esse (come addizione, conteggio o ordinamento). Queste operazioni richiedono una comprensione molto più completa del contenuto dei paragrafi rispetto a quanto era necessario per i set di dati precedenti.
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://allennlp.org/drop
Codice sorgente :
tfds.text.drop.Drop
Versioni :
-
1.0.0
: Versione iniziale. -
2.0.0
(impostazione predefinita): aggiungi tutte le opzioni per le risposte.
-
Dimensione del download :
7.92 MiB
Dimensione del set di dati:
116.24 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'dev' | 9.536 |
'train' | 77.409 |
- Struttura delle caratteristiche :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'passage': Text(shape=(), dtype=string),
'query_id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'validated_answers': Sequence(Text(shape=(), dtype=string)),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Rispondere | Testo | corda | ||
passaggio | Testo | corda | ||
query_id | Testo | corda | ||
domanda | Testo | corda | ||
risposte_validate | Sequenza(Testo) | (Nessuno,) | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{Dua2019DROP,
author={Dheeru Dua and Yizhong Wang and Pradeep Dasigi and Gabriel Stanovsky and Sameer Singh and Matt Gardner},
title={ {DROP}: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs},
booktitle={Proc. of NAACL},
year={2019}
}