- Descripción :
BoolQ es un conjunto de datos de respuesta a preguntas para preguntas de sí/no que contiene 15942 ejemplos. Estas preguntas ocurren de forma natural, se generan en entornos sin restricciones ni indicaciones.
Cada ejemplo es un triplete de (pregunta, pasaje, respuesta), con el título de la página como contexto adicional opcional. La configuración de clasificación de pares de texto es similar a las tareas de inferencia de lenguaje natural existentes.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/google-research-datasets/boolean-questions
Código fuente :
tfds.datasets.bool_q.Builder
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
8.36 MiB
Tamaño del conjunto de datos :
8.51 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 9,427 |
'validation' | 3,270 |
- Estructura de características :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
responder | Tensor | bool | ||
paso | Texto | cuerda | ||
pregunta | Texto | cuerda | ||
título | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}