schema_guided_dialog

  • opis :

Zbiór danych dialogu sterowanego schematem (SGD) składa się z ponad 20 000 wielodomenowych, zorientowanych na zadania konwersacji między człowiekiem a wirtualnym asystentem z adnotacjami. Rozmowy te obejmują interakcje z usługami i interfejsami API obejmującymi 20 domen, od banków i wydarzeń po media, kalendarz, podróże i pogodę. W przypadku większości tych domen zestaw danych zawiera wiele różnych interfejsów API, z których wiele ma nakładające się funkcje, ale różne interfejsy, co odzwierciedla typowe scenariusze z życia wzięte. Szeroka gama dostępnych adnotacji może być wykorzystana do przewidywania intencji, wypełniania slotów, śledzenia stanu dialogu, uczenia się naśladowania zasad, generowania języka, uczenia się symulacji użytkownika, a także innych zadań w wielkoskalowych wirtualnych asystentach. Poza tym zestaw danych zawiera niewidoczne domeny i usługi w zestawie ewaluacyjnym do ilościowego określania wydajności w ustawieniach zero-shot lub kilka ustawień.

Podział Przykłady
'dev' 2482
'test' 4201
'train' 16142
  • Struktura funkcji :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
pierwszy_mówca Etykieta klasy int64
metadane FunkcjeDict
metadane/usługi Sekwencja
metadane/usługi/nazwa Napinacz strunowy
wypowiedzi Sekwencja (tekst) (Nic,) strunowy
  • Cytat :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}