raza

  • Descripción :

Race es un conjunto de datos de comprensión de lectura a gran escala con más de 28 000 pasajes y casi 100 000 preguntas. El conjunto de datos se recopila de los exámenes de inglés en China, que están diseñados para estudiantes de secundaria y preparatoria. El conjunto de datos se puede servir como conjuntos de entrenamiento y prueba para la comprensión de la máquina.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
respuestas Secuencia (Texto) (Ninguno,) cadena
artículo Texto cadena
ejemplo_id Texto cadena
opciones Secuencia(Secuencia(Texto)) (Ninguno Ninguno) cadena
preguntas Secuencia (Texto) (Ninguno,) cadena
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

carrera/alto (configuración predeterminada)

  • Tamaño del conjunto de datos : 52.39 MiB

  • Divisiones :

Separar Ejemplos
'dev' 1,021
'test' 1,045
'train' 18,728

raza/medio

  • Tamaño del conjunto de datos : 12.51 MiB

  • Divisiones :

Separar Ejemplos
'dev' 368
'test' 362
'train' 6,409