schema_guided_dialogue

  • Описание :

Набор данных Schema-Guided Dialogue (SGD) состоит из более чем 20 тысяч аннотированных многодоменных, ориентированных на задачи диалогов между человеком и виртуальным помощником. Эти разговоры включают взаимодействие со службами и API, охватывающими 20 доменов, от банков и событий до средств массовой информации, календаря, путешествий и погоды. Для большинства этих доменов набор данных содержит несколько различных API, многие из которых имеют дублирующие функции, но разные интерфейсы, что отражает распространенные сценарии реального мира. Широкий спектр доступных аннотаций можно использовать для прогнозирования намерений, заполнения слотов, отслеживания состояния диалога, изучения имитации политики, генерации языка, обучения имитации пользователя и других задач в крупномасштабных виртуальных помощниках. Помимо этого, в наборе данных есть неизвестные домены и службы в оценочном наборе для количественной оценки производительности в условиях нулевого выстрела или нескольких выстрелов.

Расколоть Примеры
'dev' 2482
'test' 4201
'train' 16 142
  • Структура функции :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
первый_спикер Метка класса int64
метаданные ОсобенностиDict
метаданные/услуги Последовательность
метаданные/услуги/имя Тензор нить
высказывания Последовательность (текст) (Никто,) нить
  • Цитата :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}