- विवरण :
इस डेटासेट में 6,642 प्रश्न/उत्तर जोड़े हैं। माना जाता है कि सवालों का जवाब फ्रीबेस, एक बड़े नॉलेज ग्राफ द्वारा दिया जा सकता है। प्रश्न ज्यादातर एक नामित इकाई के आसपास केंद्रित होते हैं। वेब पर पूछे गए लोकप्रिय प्रश्न हैं (कम से कम 2013 में)।
होमपेज : https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a
स्रोत कोड :
tfds.question_answering.WebQuestions
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
1.21 MiB
डेटासेट का आकार :
983.88 KiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,032 |
'train' | 3,778 |
- फ़ीचर संरचना :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'question': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
जवाब | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी | |
प्रश्न | मूलपाठ | डोरी | ||
यूआरएल | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{berant-etal-2013-semantic,
title = "Semantic Parsing on {F}reebase from Question-Answer Pairs",
author = "Berant, Jonathan and
Chou, Andrew and
Frostig, Roy and
Liang, Percy",
booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
month = oct,
year = "2013",
address = "Seattle, Washington, USA",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D13-1160",
pages = "1533--1544",
}