- Descrizione :
Il dataset contiene le coppie tabella-domanda e la rispettiva risposta. Le domande richiedono un ragionamento in più passaggi e varie operazioni sui dati come il confronto, l'aggregazione e il calcolo aritmetico. Le tabelle sono state selezionate casualmente tra le tabelle di Wikipedia con almeno 8 righe e 5 colonne.
(Secondo le note sull'utilizzo della documentazione)
Dev: precisione media su tre (non cinque) suddivisioni dei dati di addestramento. In altre parole, allenati su 'split-{1,2,3}-train' e prova su 'split-{1,2,3}-dev', rispettivamente, quindi calcola la media dell'accuratezza.
Test: Allenati su 'treno' e prova su 'test'.
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
Codice sorgente :
tfds.structured.wiki_table_questions.WikiTableQuestions
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensione del download :
65.36 MiB
Dimensione del set di dati:
237.24 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'split-1-dev' | 2.810 |
'split-1-train' | 11.321 |
'split-2-dev' | 2.838 |
'split-2-train' | 11.312 |
'split-3-dev' | 2.838 |
'split-3-train' | 11.311 |
'test' | 4.344 |
'train' | 14.149 |
- Struttura delle caratteristiche :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
testo di input | CaratteristicheDict | |||
testo_input/contesto | Tensore | corda | ||
testo_input/tabella | Sequenza | |||
input_text/table/column_header | Tensore | corda | ||
testo_input/tabella/contenuto | Tensore | corda | ||
testo_input/tabella/numero_riga | Tensore | int16 | ||
testo_destinazione | Tensore | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('input_text', 'target_text')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}