স্কিমা_গাইডেড_ডালগ

  • বর্ণনা :

স্কিমা-গাইডেড ডায়ালগ (SGD) ডেটাসেটে 20k টীকাযুক্ত মাল্টি-ডোমেন, একজন মানুষ এবং একজন ভার্চুয়াল সহকারীর মধ্যে টাস্ক-ভিত্তিক কথোপকথন রয়েছে। এই কথোপকথনে ব্যাঙ্ক এবং ইভেন্ট থেকে শুরু করে মিডিয়া, ক্যালেন্ডার, ভ্রমণ এবং আবহাওয়া পর্যন্ত 20টি ডোমেন বিস্তৃত পরিষেবা এবং API-এর সাথে মিথস্ক্রিয়া জড়িত। এই ডোমেনগুলির বেশিরভাগের জন্য, ডেটাসেটে একাধিক ভিন্ন API রয়েছে, যার মধ্যে অনেকের ওভারল্যাপিং কার্যকারিতা রয়েছে কিন্তু ভিন্ন ইন্টারফেস রয়েছে, যা সাধারণ বাস্তব-বিশ্বের পরিস্থিতি প্রতিফলিত করে। উপলভ্য টীকাগুলির বিস্তৃত পরিসর উদ্দেশ্য ভবিষ্যদ্বাণী, স্লট ফিলিং, ডায়ালগ স্টেট ট্র্যাকিং, নীতি অনুকরণ শেখার, ভাষা তৈরি, ব্যবহারকারীর সিমুলেশন শেখার জন্য ব্যবহার করা যেতে পারে, বড় আকারের ভার্চুয়াল সহকারীর অন্যান্য কাজের মধ্যে। এগুলি ছাড়াও, শূন্য-শট বা কয়েকটি শট সেটিংসে কর্মক্ষমতা পরিমাপ করার জন্য মূল্যায়ন সেটে ডেটাসেটের অদেখা ডোমেন এবং পরিষেবা রয়েছে।

বিভক্ত উদাহরণ
'dev' 2,482
'test' 4,201
'train' 16,142
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
প্রথম_স্পীকার ক্লাসলেবেল int64
মেটাডেটা ফিচারসডিক্ট
মেটাডেটা/পরিষেবা ক্রম
মেটাডেটা/পরিষেবা/নাম টেনসর স্ট্রিং
উচ্চারণ ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং
  • উদ্ধৃতি :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}