- Descripción :
Race es un conjunto de datos de comprensión de lectura a gran escala con más de 28 000 pasajes y casi 100 000 preguntas. El conjunto de datos se recopila de los exámenes de inglés en China, que están diseñados para estudiantes de secundaria y preparatoria. El conjunto de datos se puede servir como conjuntos de entrenamiento y prueba para la comprensión de la máquina.
Documentación adicional : Explore en Papers With Code
Descripción de la configuración : configuración del constructor para el conjunto de datos RACE.
Página de inicio: https://www.cs.cmu.edu/~glai1/data/race/
Código fuente :
tfds.datasets.race.Builder
Versiones :
-
1.0.0
: Versión inicial. -
2.0.0
(predeterminado): agregue la identificación de ejemplo.
-
Tamaño de la descarga :
24.26 MiB
Almacenamiento automático en caché ( documentación ): Sí
Estructura de características :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
respuestas | Secuencia (Texto) | (Ninguno,) | cadena | |
artículo | Texto | cadena | ||
ejemplo_id | Texto | cadena | ||
opciones | Secuencia(Secuencia(Texto)) | (Ninguno Ninguno) | cadena | |
preguntas | Secuencia (Texto) | (Ninguno,) | cadena |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
carrera/alto (configuración predeterminada)
Tamaño del conjunto de datos :
52.39 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- Ejemplos ( tfds.as_dataframe ):
raza/medio
Tamaño del conjunto de datos :
12.51 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- Ejemplos ( tfds.as_dataframe ):