- Descriptif :
L'ensemble de données contient des paires table-question, et la réponse respective. Les questions nécessitent un raisonnement en plusieurs étapes et diverses opérations de données telles que la comparaison, l'agrégation et le calcul arithmétique. Les tableaux ont été choisis au hasard parmi les tableaux Wikipédia avec au moins 8 lignes et 5 colonnes.
(Selon les notes d'utilisation de la documentation)
Dev : précision moyenne sur trois (et non cinq) fractionnements des données d'apprentissage. En d'autres termes, entraînez-vous sur 'split-{1,2,3}-train' et testez sur 'split-{1,2,3}-dev', respectivement, puis faites la moyenne de la précision.
Test : Entraînez-vous sur 'train' et testez sur 'test'.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
Code source :
tfds.structured.wiki_table_questions.WikiTableQuestions
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
65.36 MiB
Taille du jeu de données :
237.24 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'split-1-dev' | 2 810 |
'split-1-train' | 11 321 |
'split-2-dev' | 2 838 |
'split-2-train' | 11 312 |
'split-3-dev' | 2 838 |
'split-3-train' | 11 311 |
'test' | 4 344 |
'train' | 14 149 |
- Structure des fonctionnalités :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
Texte de saisie | FonctionnalitésDict | |||
texte_entrée/contexte | Tenseur | chaîne de caractères | ||
input_text/table | Séquence | |||
input_text/table/column_header | Tenseur | chaîne de caractères | ||
input_text/table/contenu | Tenseur | chaîne de caractères | ||
input_text/table/row_number | Tenseur | int16 | ||
texte_cible | Tenseur | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):('input_text', 'target_text')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}