- Descripción :
El conjunto de datos del diálogo guiado por esquemas (SGD) consta de más de 20 000 conversaciones multidominio anotadas y orientadas a tareas entre un ser humano y un asistente virtual. Estas conversaciones involucran interacciones con servicios y API que abarcan 20 dominios, desde bancos y eventos hasta medios, calendario, viajes y clima. Para la mayoría de estos dominios, el conjunto de datos contiene múltiples API diferentes, muchas de las cuales tienen funcionalidades superpuestas pero diferentes interfaces, lo que refleja escenarios comunes del mundo real. La amplia gama de anotaciones disponibles se puede utilizar para la predicción de intenciones, el llenado de ranuras, el seguimiento del estado del diálogo, el aprendizaje de imitación de políticas, la generación de idiomas, el aprendizaje de simulación de usuarios, entre otras tareas en asistentes virtuales a gran escala. Además de estos, el conjunto de datos tiene dominios y servicios no vistos en el conjunto de evaluación para cuantificar el rendimiento en configuraciones de disparo cero o pocos disparos.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
Código fuente :
tfds.datasets.schema_guided_dialogue.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de la descarga :
35.12 MiB
Tamaño del conjunto de datos :
25.36 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- Estructura de características :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
primer_hablante | Etiqueta de clase | int64 | ||
metadatos | CaracterísticasDict | |||
metadatos/servicios | Secuencia | |||
metadatos/servicios/nombre | Tensor | cadena | ||
declaraciones | Secuencia (Texto) | (Ninguno,) | cadena |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}