- الوصف :
تتكون مجموعة بيانات الحوار الموجه بالمخطط (SGD) من أكثر من 20 ألف محادثات مشروحة متعددة المجالات وموجهة نحو المهام بين مساعد بشري ومساعد افتراضي. تتضمن هذه المحادثات تفاعلات مع الخدمات وواجهات برمجة التطبيقات التي تغطي 20 مجالًا ، بدءًا من البنوك والأحداث إلى الوسائط والتقويم والسفر والطقس. بالنسبة لمعظم هذه المجالات ، تحتوي مجموعة البيانات على العديد من واجهات برمجة التطبيقات المختلفة ، والعديد منها لها وظائف متداخلة ولكن واجهات مختلفة ، مما يعكس سيناريوهات العالم الحقيقي الشائعة. يمكن استخدام المجموعة الواسعة من التعليقات التوضيحية المتاحة للتنبؤ بالهدف ، وملء الفتحات ، وتتبع حالة الحوار ، وتعلم محاكاة السياسة ، وتوليد اللغة ، وتعلم محاكاة المستخدم ، من بين مهام أخرى في المساعدين الظاهريين على نطاق واسع. إلى جانب ذلك ، تحتوي مجموعة البيانات على مجالات وخدمات غير مرئية في مجموعة التقييم لتحديد الأداء في إعدادات اللقطة الصفرية أو عدد قليل من إعدادات اللقطة.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
كود المصدر :
tfds.datasets.schema_guided_dialogue.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
35.12 MiB
حجم مجموعة البيانات :
25.36 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'dev' | 2،482 |
'test' | 4201 |
'train' | 16،142 |
- هيكل الميزة :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
المتحدث الأول | ClassLabel | int64 | ||
البيانات الوصفية | الميزات | |||
البيانات الوصفية / الخدمات | تسلسل | |||
البيانات الوصفية / الخدمات / الاسم | موتر | سلسلة | ||
الأقوال | تسلسل (نص) | (لا أحد،) | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}