- opis :
Zbiór danych dialogu sterowanego schematem (SGD) składa się z ponad 20 000 wielodomenowych, zorientowanych na zadania konwersacji między człowiekiem a wirtualnym asystentem z adnotacjami. Rozmowy te obejmują interakcje z usługami i interfejsami API obejmującymi 20 domen, od banków i wydarzeń po media, kalendarz, podróże i pogodę. W przypadku większości tych domen zestaw danych zawiera wiele różnych interfejsów API, z których wiele ma nakładające się funkcje, ale różne interfejsy, co odzwierciedla typowe scenariusze z życia wzięte. Szeroka gama dostępnych adnotacji może być wykorzystana do przewidywania intencji, wypełniania slotów, śledzenia stanu dialogu, uczenia się naśladowania zasad, generowania języka, uczenia się symulacji użytkownika, a także innych zadań w wielkoskalowych wirtualnych asystentach. Poza tym zestaw danych zawiera niewidoczne domeny i usługi w zestawie ewaluacyjnym do ilościowego określania wydajności w ustawieniach zero-shot lub kilka ustawień.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
Kod źródłowy :
tfds.datasets.schema_guided_dialogue.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
35.12 MiB
Rozmiar zestawu danych :
25.36 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Podział | Przykłady |
---|---|
'dev' | 2482 |
'test' | 4201 |
'train' | 16142 |
- Struktura funkcji :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
pierwszy_mówca | Etykieta klasy | int64 | ||
metadane | FunkcjeDict | |||
metadane/usługi | Sekwencja | |||
metadane/usługi/nazwa | Napinacz | strunowy | ||
wypowiedzi | Sekwencja (tekst) | (Nic,) | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}