esquema_diálogo_guiado

  • Descripción :

El conjunto de datos del diálogo guiado por esquemas (SGD) consta de más de 20 000 conversaciones multidominio anotadas y orientadas a tareas entre un ser humano y un asistente virtual. Estas conversaciones involucran interacciones con servicios y API que abarcan 20 dominios, desde bancos y eventos hasta medios, calendario, viajes y clima. Para la mayoría de estos dominios, el conjunto de datos contiene múltiples API diferentes, muchas de las cuales tienen funcionalidades superpuestas pero diferentes interfaces, lo que refleja escenarios comunes del mundo real. La amplia gama de anotaciones disponibles se puede utilizar para la predicción de intenciones, el llenado de ranuras, el seguimiento del estado del diálogo, el aprendizaje de imitación de políticas, la generación de idiomas, el aprendizaje de simulación de usuarios, entre otras tareas en asistentes virtuales a gran escala. Además de estos, el conjunto de datos tiene dominios y servicios no vistos en el conjunto de evaluación para cuantificar el rendimiento en configuraciones de disparo cero o pocos disparos.

Separar Ejemplos
'dev' 2,482
'test' 4,201
'train' 16,142
  • Estructura de características :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
primer_hablante Etiqueta de clase int64
metadatos CaracterísticasDict
metadatos/servicios Secuencia
metadatos/servicios/nombre Tensor cadena
declaraciones Secuencia (Texto) (Ninguno,) cadena
  • Cita :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}