- विवरण :
स्कीमा-गाइडेड डायलॉग (SGD) डेटासेट में एक मानव और एक आभासी सहायक के बीच 20k से अधिक एनोटेट बहु-डोमेन, कार्य-उन्मुख वार्तालाप शामिल हैं। इन वार्तालापों में बैंकों और घटनाओं से लेकर मीडिया, कैलेंडर, यात्रा और मौसम तक 20 डोमेन में फैली सेवाओं और एपीआई के साथ बातचीत शामिल है। इनमें से अधिकांश डोमेन के लिए, डेटासेट में कई अलग-अलग एपीआई होते हैं, जिनमें से कई में अतिव्यापी कार्यप्रणाली होती है, लेकिन अलग-अलग इंटरफेस होते हैं, जो सामान्य वास्तविक दुनिया के परिदृश्यों को दर्शाता है। बड़े पैमाने पर आभासी सहायकों में अन्य कार्यों के बीच उपलब्ध एनोटेशन की विस्तृत श्रृंखला का उपयोग इरादे की भविष्यवाणी, स्लॉट भरने, संवाद स्थिति ट्रैकिंग, नीति अनुकरण सीखने, भाषा निर्माण, उपयोगकर्ता सिमुलेशन सीखने के लिए किया जा सकता है। इनके अलावा, डेटासेट में शून्य-शॉट या कुछ शॉट सेटिंग्स में प्रदर्शन को मापने के लिए मूल्यांकन सेट में अनदेखा डोमेन और सेवाएं हैं।
होमपेज : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
स्रोत कोड :
tfds.datasets.schema_guided_dialogue.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
35.12 MiB
डेटासेट का आकार :
25.36 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- फ़ीचर संरचना :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
first_speaker | क्लासलेबल | int64 | ||
मेटाडाटा | विशेषताएं डिक्ट | |||
मेटाडेटा/सेवाएं | क्रम | |||
मेटाडेटा/सेवाएं/नाम | टेन्सर | डोरी | ||
उच्चारणों | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}