- Описание :
Набор данных Schema-Guided Dialogue (SGD) состоит из более чем 20 тысяч аннотированных многодоменных, ориентированных на задачи диалогов между человеком и виртуальным помощником. Эти разговоры включают взаимодействие со службами и API, охватывающими 20 доменов, от банков и событий до средств массовой информации, календаря, путешествий и погоды. Для большинства этих доменов набор данных содержит несколько различных API, многие из которых имеют дублирующие функции, но разные интерфейсы, что отражает распространенные сценарии реального мира. Широкий спектр доступных аннотаций можно использовать для прогнозирования намерений, заполнения слотов, отслеживания состояния диалога, изучения имитации политики, генерации языка, обучения имитации пользователя и других задач в крупномасштабных виртуальных помощниках. Помимо этого, в наборе данных есть неизвестные домены и службы в оценочном наборе для количественной оценки производительности в условиях нулевого выстрела или нескольких выстрелов.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
Исходный код :
tfds.datasets.schema_guided_dialogue.Builder
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
35.12 MiB
Размер набора данных :
25.36 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'dev' | 2482 |
'test' | 4201 |
'train' | 16 142 |
- Структура функции :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
первый_спикер | Метка класса | int64 | ||
метаданные | ОсобенностиDict | |||
метаданные/услуги | Последовательность | |||
метаданные/услуги/имя | Тензор | нить | ||
высказывания | Последовательность (текст) | (Никто,) | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}