- Açıklama :
Şema Kılavuzlu Diyalog (SGD) veri seti, bir insan ve bir sanal asistan arasındaki 20 binden fazla açıklamalı çok alanlı, görev yönelimli konuşmalardan oluşur. Bu konuşmalar, bankalardan etkinliklere, medyadan takvime, seyahate ve hava durumuna kadar uzanan 20 etki alanını kapsayan hizmetler ve API'lerle etkileşimleri içerir. Bu alanların çoğu için, veri kümesi, çoğu örtüşen işlevlere ancak ortak gerçek dünya senaryolarını yansıtan farklı arabirimlere sahip birden çok farklı API içerir. Çok çeşitli ek açıklamalar, büyük ölçekli sanal asistanlardaki diğer görevlerin yanı sıra amaç tahmini, alan doldurma, diyalog durumu izleme, politika taklit öğrenimi, dil oluşturma, kullanıcı simülasyonu öğrenimi için kullanılabilir. Bunların yanı sıra, sıfır atış veya az atış ayarlarındaki performansı ölçmek için veri setinde değerlendirme setinde görünmeyen etki alanları ve hizmetler bulunur.
Ana sayfa : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
Kaynak kodu :
tfds.datasets.schema_guided_dialogue.Builder
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
35.12 MiB
Veri kümesi boyutu :
25.36 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'dev' | 2.482 |
'test' | 4.201 |
'train' | 16.142 |
- Özellik yapısı :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
ilk_konuşmacı | SınıfEtiketi | int64 | ||
meta veri | ÖzelliklerDict | |||
meta veriler/hizmetler | Sıra | |||
meta veri/hizmetler/ad | tensör | sicim | ||
sözler | Sıra(Metin) | (Hiçbiri,) | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}