स्कीमा_गाइडेड_डायलॉग

विवरण :

स्कीमा-गाइडेड डायलॉग (SGD) डेटासेट में एक मानव और एक आभासी सहायक के बीच 20k से अधिक एनोटेट बहु-डोमेन, कार्य-उन्मुख वार्तालाप शामिल हैं। इन वार्तालापों में बैंकों और घटनाओं से लेकर मीडिया, कैलेंडर, यात्रा और मौसम तक 20 डोमेन में फैली सेवाओं और एपीआई के साथ बातचीत शामिल है। इनमें से अधिकांश डोमेन के लिए, डेटासेट में कई अलग-अलग एपीआई होते हैं, जिनमें से कई में अतिव्यापी कार्यप्रणाली होती है, लेकिन अलग-अलग इंटरफेस होते हैं, जो सामान्य वास्तविक दुनिया के परिदृश्यों को दर्शाता है। बड़े पैमाने पर आभासी सहायकों में अन्य कार्यों के बीच उपलब्ध एनोटेशन की विस्तृत श्रृंखला का उपयोग इरादे की भविष्यवाणी, स्लॉट भरने, संवाद स्थिति ट्रैकिंग, नीति अनुकरण सीखने, भाषा निर्माण, उपयोगकर्ता सिमुलेशन सीखने के लिए किया जा सकता है। इनके अलावा, डेटासेट में शून्य-शॉट या कुछ शॉट सेटिंग्स में प्रदर्शन को मापने के लिए मूल्यांकन सेट में अनदेखा डोमेन और सेवाएं हैं।

अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
स्रोत कोड : tfds.datasets.schema_guided_dialogue.Builder
संस्करण :
- 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
डाउनलोड आकार : 35.12 MiB
डेटासेट का आकार : 25.36 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :

विभाजित करना	उदाहरण
`'dev'`	2,482
`'test'`	4,201
`'train'`	16,142

फ़ीचर संरचना :

FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	आकार	डीटाइप
	विशेषताएं डिक्ट
first_speaker	क्लासलेबल		int64
मेटाडाटा	विशेषताएं डिक्ट
मेटाडेटा/सेवाएं	क्रम
मेटाडेटा/सेवाएं/नाम	टेन्सर		डोरी
उच्चारणों	अनुक्रम (पाठ)	(कोई भी नहीं,)	डोरी

पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):

उद्धरण :

@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}