- Descripción :
El conjunto de datos contiene 5.957 preguntas de opción múltiple de 4 vías. Además, proporcionan 5167 datos de conocimiento común de fuentes múltiples y una versión ampliada de las preguntas de entrenamiento/desarrollo/prueba en las que cada pregunta está asociada con su hecho central de origen, una puntuación de precisión humana, una puntuación de claridad y un trabajador colectivo anónimo. IDENTIFICACIÓN.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://leaderboard.allenai.org/open_book_qa/submissions/get-started
Código fuente :
tfds.datasets.openbookqa.Builder
Versiones :
-
0.1.0
(predeterminado): Sin notas de la versión.
-
Tamaño de descarga :
1.38 MiB
Tamaño del conjunto de datos :
2.40 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 500 |
'train' | 4,957 |
'validation' | 500 |
- Estructura de características :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
'clarity': float32,
'fact1': Text(shape=(), dtype=string),
'humanScore': float32,
'question': FeaturesDict({
'choice_A': Text(shape=(), dtype=string),
'choice_B': Text(shape=(), dtype=string),
'choice_C': Text(shape=(), dtype=string),
'choice_D': Text(shape=(), dtype=string),
'stem': Text(shape=(), dtype=string),
}),
'turkIdAnonymized': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
clave de respuesta | Etiqueta de clase | int64 | ||
claridad | Tensor | flotar32 | ||
hecho1 | Texto | cuerda | ||
puntuación humana | Tensor | flotar32 | ||
pregunta | CaracterísticasDict | |||
pregunta/elección_A | Texto | cuerda | ||
pregunta/elección_B | Texto | cuerda | ||
pregunta/elección_C | Texto | cuerda | ||
pregunta/elección_D | Texto | cuerda | ||
pregunta/raíz | Texto | cuerda | ||
turkIdAnonimizado | Texto | cuerda |
Teclas supervisadas (ver documento
as_supervised
):('question', 'answerKey')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{mihaylov2018can,
title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
journal={arXiv preprint arXiv:1809.02789},
year={2018}
}