Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

bot_adversarial_dialogue

Descrição :

Conjunto de dados de diálogo adversário de bot.

Conjuntos de dados de diálogo rotulados com ofensiva da tarefa Bot Adversarial Dialogue. Os diálogos foram coletados pedindo aos humanos que conversassem de forma adversária com os bots.

Mais detalhes no artigo .

Página inicial : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
Código fonte : tfds.datasets.bot_adversarial_dialogue.Builder
Versões :
- 1.0.0 (padrão): versão inicial.
Armazenado em cache automaticamente ( documentação ): Sim
Chaves supervisionadas (consulte o documento as_supervised ): None
Figura ( tfds.show_examples ): Não suportado.
Citação :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (configuração padrão)

Descrição da configuração : os conjuntos de dados de diálogo, divididos em divisões de treinamento, validação e teste.
Tamanho do download : 3.06 MiB
Tamanho do conjunto de dados : 23.38 MiB
Divisões :

Dividir	Exemplos
`'test'`	2.598
`'train'`	69.274
`'valid'`	7.002

Estrutura de recursos :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

Documentação de recursos :

Recurso	Aula	Forma	Tipo D	Descrição
	RecursosDict
bot_persona	Sequência (Texto)	(Nenhum,)	corda	A persona personificada pelo bot.
dialog_id	Tensor		float32
episódio_feito	Tensor		bool
eu ia	Texto		corda	O ID da amostra.
rótulos	ClassLabel		int64
round_id	Tensor		float32
alto-falante_para_eval	Texto		corda	O locutor dos enunciados rotulados.
texto	Texto		corda	A expressão a ser classificada.

Exemplos ( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

Descrição da configuração : um conjunto de avaliação de segurança humana avaliado por trabalhadores de crowdsourcing quanto à ofensiva.
Tamanho do download : 10.57 KiB
Tamanho do conjunto de dados : 34.55 KiB
Divisões :

Dividir	Exemplos
`'test'`	180

Estrutura de recursos :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

Documentação de recursos :

Recurso	Aula	Tipo D	Descrição
	RecursosDict
episódio_feito	Tensor	bool
eu ia	Texto	corda	O ID da amostra.
rótulos	ClassLabel	int64
texto	Texto	corda	A expressão a ser classificada.

Exemplos ( tfds.as_dataframe ):