- Descripción :
El conjunto de datos contiene pares tabla-pregunta, y la respectiva respuesta. Las preguntas requieren un razonamiento de varios pasos y varias operaciones de datos, como comparación, agregación y cálculo aritmético. Las tablas se seleccionaron aleatoriamente entre las tablas de Wikipedia con al menos 8 filas y 5 columnas.
(Según las notas de uso de la documentación)
Dev: Precisión media en tres (no cinco) divisiones de los datos de entrenamiento. En otras palabras, entrenar en 'split-{1,2,3}-train' y probar en 'split-{1,2,3}-dev', respectivamente, luego promediar la precisión.
Prueba: Entrena en 'tren' y prueba en 'prueba'.
Documentación adicional : Explore en Papers With Code
Página de inicio : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
Código fuente :
tfds.structured.wiki_table_questions.WikiTableQuestions
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de la descarga :
65.36 MiB
Tamaño del conjunto de datos :
237.24 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'split-1-dev' | 2,810 |
'split-1-train' | 11,321 |
'split-2-dev' | 2,838 |
'split-2-train' | 11,312 |
'split-3-dev' | 2,838 |
'split-3-train' | 11,311 |
'test' | 4,344 |
'train' | 14,149 |
- Estructura de características :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
texto de entrada | CaracterísticasDict | |||
entrada_texto/contexto | Tensor | cuerda | ||
entrada_texto/tabla | Secuencia | |||
texto_de_entrada/tabla/encabezado_de_columna | Tensor | cuerda | ||
entrada_texto/tabla/contenido | Tensor | cuerda | ||
texto_de_entrada/tabla/número_de_fila | Tensor | int16 | ||
texto_objetivo | Tensor | cuerda |
Teclas supervisadas (Ver
as_supervised
doc ):('input_text', 'target_text')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}