corsa

  • Descrizione :

Race è un set di dati di comprensione della lettura su larga scala con oltre 28.000 passaggi e quasi 100.000 domande. Il set di dati viene raccolto dagli esami di inglese in Cina, progettati per studenti delle scuole medie e superiori. Il set di dati può essere utilizzato come set di addestramento e test per la comprensione della macchina.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
risposte Sequenza(Testo) (Nessuno,) corda
articolo Testo corda
esempio_id Testo corda
opzioni Sequenza(Sequenza(Testo)) (Nessuno, nessuno) corda
domande Sequenza(Testo) (Nessuno,) corda
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

razza/alta (configurazione predefinita)

  • Dimensione del set di dati: 52.39 MiB

  • Divisioni :

Diviso Esempi
'dev' 1.021
'test' 1.045
'train' 18.728

razza/mezzo

  • Dimensione del set di dati: 12.51 MiB

  • Divisioni :

Diviso Esempi
'dev' 368
'test' 362
'train' 6.409