स्कीमा_गाइडेड_डायलॉग

  • विवरण :

स्कीमा-गाइडेड डायलॉग (SGD) डेटासेट में एक मानव और एक आभासी सहायक के बीच 20k से अधिक एनोटेट बहु-डोमेन, कार्य-उन्मुख वार्तालाप शामिल हैं। इन वार्तालापों में बैंकों और घटनाओं से लेकर मीडिया, कैलेंडर, यात्रा और मौसम तक 20 डोमेन में फैली सेवाओं और एपीआई के साथ बातचीत शामिल है। इनमें से अधिकांश डोमेन के लिए, डेटासेट में कई अलग-अलग एपीआई होते हैं, जिनमें से कई में अतिव्यापी कार्यप्रणाली होती है, लेकिन अलग-अलग इंटरफेस होते हैं, जो सामान्य वास्तविक दुनिया के परिदृश्यों को दर्शाता है। बड़े पैमाने पर आभासी सहायकों में अन्य कार्यों के बीच उपलब्ध एनोटेशन की विस्तृत श्रृंखला का उपयोग इरादे की भविष्यवाणी, स्लॉट भरने, संवाद स्थिति ट्रैकिंग, नीति अनुकरण सीखने, भाषा निर्माण, उपयोगकर्ता सिमुलेशन सीखने के लिए किया जा सकता है। इनके अलावा, डेटासेट में शून्य-शॉट या कुछ शॉट सेटिंग्स में प्रदर्शन को मापने के लिए मूल्यांकन सेट में अनदेखा डोमेन और सेवाएं हैं।

विभाजित करना उदाहरण
'dev' 2,482
'test' 4,201
'train' 16,142
  • फ़ीचर संरचना :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
first_speaker क्लासलेबल int64
मेटाडाटा विशेषताएं डिक्ट
मेटाडेटा/सेवाएं क्रम
मेटाडेटा/सेवाएं/नाम टेन्सर डोरी
उच्चारणों अनुक्रम (पाठ) (कोई भी नहीं,) डोरी
  • उद्धरण :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}