- विवरण :
डेटासेट में जोड़े टेबल-प्रश्न और संबंधित उत्तर होते हैं। प्रश्नों के लिए बहु-चरण तर्क और विभिन्न डेटा संचालन जैसे तुलना, एकत्रीकरण और अंकगणितीय गणना की आवश्यकता होती है। तालिकाओं को कम से कम 8 पंक्तियों और 5 स्तंभों वाली विकिपीडिया तालिकाओं में यादृच्छिक रूप से चुना गया था।
(दस्तावेज़ीकरण उपयोग नोट्स के अनुसार)
देव: प्रशिक्षण डेटा के तीन (पांच नहीं) विभाजन पर औसत सटीकता। दूसरे शब्दों में, क्रमशः 'स्प्लिट-{1,2,3}-ट्रेन' पर प्रशिक्षण और 'स्प्लिट-{1,2,3}-देव' पर परीक्षण करें, फिर सटीकता का औसत करें।
टेस्ट: 'ट्रेन' पर ट्रेन और 'टेस्ट' पर टेस्ट।
मुखपृष्ठ : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
स्रोत कोड :
tfds.structured.wiki_table_questions.WikiTableQuestions
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
65.36 MiB
डेटासेट का आकार :
237.24 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'split-1-dev' | 2,810 |
'split-1-train' | 11,321 |
'split-2-dev' | 2,838 |
'split-2-train' | 11,312 |
'split-3-dev' | 2,838 |
'split-3-train' | 11,311 |
'test' | 4,344 |
'train' | 14,149 |
- फ़ीचर संरचना :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
इनपुट टेक्स्ट | विशेषताएं डिक्ट | |||
input_text/context | टेन्सर | डोरी | ||
इनपुट_टेक्स्ट/टेबल | क्रम | |||
input_text/टेबल/column_header | टेन्सर | डोरी | ||
input_text/तालिका/सामग्री | टेन्सर | डोरी | ||
इनपुट_टेक्स्ट/टेबल/पंक्ति_नंबर | टेन्सर | int16 | ||
target_text | टेन्सर | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('input_text', 'target_text')
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}