- Descripción :
La respuesta a preguntas en contexto es un conjunto de datos para modelar, comprender y participar en el diálogo de búsqueda de información. Las instancias de datos consisten en un diálogo interactivo entre dos trabajadores de la multitud: (1) un estudiante que plantea una secuencia de preguntas de forma libre para aprender tanto como sea posible sobre un texto oculto de Wikipedia, y (2) un profesor que responde a las preguntas proporcionando breves extractos (se extiende) del texto. QuAC presenta desafíos que no se encuentran en los conjuntos de datos de comprensión de máquinas existentes: sus preguntas suelen ser más abiertas, sin respuesta o solo significativas dentro del contexto del diálogo.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://quac.ai/
Código fuente :
tfds.datasets.quac.Builder
Versiones :
-
1.0.0
(predeterminado): Versión inicial.
-
Tamaño de la descarga :
73.47 MiB
Tamaño del conjunto de datos :
298.04 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 83,568 |
'validation' | 7,354 |
- Estructura de características :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'background': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'followup': Text(shape=(), dtype=string),
'orig_answer': FeaturesDict({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'section_title': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'yesno': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
respuestas | Secuencia | |||
respuestas/answer_start | Tensor | int32 | ||
respuestas/texto | Texto | cadena | ||
antecedentes | Texto | cadena | ||
contexto | Texto | cadena | ||
seguimiento | Texto | cadena | ||
orig_respuesta | CaracterísticasDict | |||
orig_answer/answer_start | Tensor | int32 | ||
orig_answer/texto | Texto | cadena | ||
pregunta | Texto | cadena | ||
sección de título | Texto | cadena | ||
título | Texto | cadena | ||
sí No | Texto | cadena |
Teclas supervisadas (ver
as_supervised
doc ):('context', 'answers')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{choi2018quac,
title={Quac: Question answering in context},
author={Choi, Eunsol and He, He and Iyyer, Mohit and Yatskar, Mark and Yih, Wen-tau and Choi, Yejin and Liang, Percy and Zettlemoyer, Luke},
journal={arXiv preprint arXiv:1808.07036},
year={2018}
}