- Descrizione :
Race è un set di dati di comprensione della lettura su larga scala con oltre 28.000 passaggi e quasi 100.000 domande. Il set di dati viene raccolto dagli esami di inglese in Cina, progettati per studenti delle scuole medie e superiori. Il set di dati può essere utilizzato come set di addestramento e test per la comprensione della macchina.
Documentazione aggiuntiva : Esplora documenti con codice
Descrizione della configurazione: configurazione del builder per il set di dati RACE.
Pagina iniziale : https://www.cs.cmu.edu/~glai1/data/race/
Codice sorgente :
tfds.datasets.race.Builder
Versioni :
-
1.0.0
: Versione iniziale. -
2.0.0
(impostazione predefinita): aggiungi l'id di esempio.
-
Dimensione del download :
24.26 MiB
Auto-cache ( documentazione ): Sì
Struttura delle caratteristiche :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
risposte | Sequenza(Testo) | (Nessuno,) | corda | |
articolo | Testo | corda | ||
esempio_id | Testo | corda | ||
opzioni | Sequenza(Sequenza(Testo)) | (Nessuno, nessuno) | corda | |
domande | Sequenza(Testo) | (Nessuno,) | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
razza/alta (configurazione predefinita)
Dimensione del set di dati:
52.39 MiB
Divisioni :
Diviso | Esempi |
---|---|
'dev' | 1.021 |
'test' | 1.045 |
'train' | 18.728 |
- Esempi ( tfds.as_dataframe ):
razza/mezzo
Dimensione del set di dati:
12.51 MiB
Divisioni :
Diviso | Esempi |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6.409 |
- Esempi ( tfds.as_dataframe ):