- বর্ণনা :
স্কিমা-গাইডেড ডায়ালগ (SGD) ডেটাসেটে 20k টীকাযুক্ত মাল্টি-ডোমেন, একজন মানুষ এবং একজন ভার্চুয়াল সহকারীর মধ্যে টাস্ক-ভিত্তিক কথোপকথন রয়েছে। এই কথোপকথনে ব্যাঙ্ক এবং ইভেন্ট থেকে শুরু করে মিডিয়া, ক্যালেন্ডার, ভ্রমণ এবং আবহাওয়া পর্যন্ত 20টি ডোমেন বিস্তৃত পরিষেবা এবং API-এর সাথে মিথস্ক্রিয়া জড়িত। এই ডোমেনগুলির বেশিরভাগের জন্য, ডেটাসেটে একাধিক ভিন্ন API রয়েছে, যার মধ্যে অনেকের ওভারল্যাপিং কার্যকারিতা রয়েছে কিন্তু ভিন্ন ইন্টারফেস রয়েছে, যা সাধারণ বাস্তব-বিশ্বের পরিস্থিতি প্রতিফলিত করে। উপলভ্য টীকাগুলির বিস্তৃত পরিসর উদ্দেশ্য ভবিষ্যদ্বাণী, স্লট ফিলিং, ডায়ালগ স্টেট ট্র্যাকিং, নীতি অনুকরণ শেখার, ভাষা তৈরি, ব্যবহারকারীর সিমুলেশন শেখার জন্য ব্যবহার করা যেতে পারে, বড় আকারের ভার্চুয়াল সহকারীর অন্যান্য কাজের মধ্যে। এগুলি ছাড়াও, শূন্য-শট বা কয়েকটি শট সেটিংসে কর্মক্ষমতা পরিমাপ করার জন্য মূল্যায়ন সেটে ডেটাসেটের অদেখা ডোমেন এবং পরিষেবা রয়েছে।
হোমপেজ : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
উত্স কোড :
tfds.datasets.schema_guided_dialogue.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
35.12 MiB
ডেটাসেটের আকার :
25.36 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
প্রথম_স্পীকার | ক্লাসলেবেল | int64 | ||
মেটাডেটা | ফিচারসডিক্ট | |||
মেটাডেটা/পরিষেবা | ক্রম | |||
মেটাডেটা/পরিষেবা/নাম | টেনসর | স্ট্রিং | ||
উচ্চারণ | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}