bot_adversarial_dialogue

Açıklama :

Bot Çelişkili Diyalog Veri Kümesi.

Bot Çekişmeli Diyalog görevinden saldırganlıkla etiketlenen diyalog veri kümeleri. Diyaloglar, insanlardan botlarla düşmanca konuşmaları istenerek toplandı.

Makalede daha fazla ayrıntı.

Ana sayfa : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
Kaynak kodu : tfds.datasets.bot_adversarial_dialogue.Builder
Sürümler :
- 1.0.0 (varsayılan): İlk sürüm.
Otomatik önbelleğe alınmış ( belgeler ): Evet
Denetlenen anahtarlar ( as_supervised belgesine bakın): None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (varsayılan yapılandırma)

Yapılandırma açıklaması : Eğitim, doğrulama ve test bölümlerine bölünmüş diyalog veri kümeleri.
İndirme boyutu : 3.06 MiB
Veri kümesi boyutu : 23.38 MiB
Bölünmeler :

Bölmek	Örnekler
`'test'`	2.598
`'train'`	69.274
`'valid'`	7.002

Özellik yapısı :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi	Tanım
	ÖzelliklerDict
bot_persona	Sıra(Metin)	(Hiçbiri,)	sicim	Bot tarafından taklit edilen kişi.
diyalog_id	Tensör		kayan nokta32
bölüm_done	Tensör		bool
İD	Metin		sicim	Numunenin kimliği.
etiketler	SınıfEtiketi		int64
round_id	Tensör		kayan nokta32
Speaker_to_eval	Metin		sicim	Etiketli ifadelerin konuşmacısı.
metin	Metin		sicim	Sınıflandırılacak ifade.

Örnekler ( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

Yapılandırma açıklaması : Kalabalık kaynaklı çalışanlar tarafından saldırganlık açısından değerlendirilen bir insan güvenliği değerlendirme seti.
İndirme boyutu : 10.57 KiB
Veri kümesi boyutu : 34.55 KiB
Bölünmeler :

Bölmek	Örnekler
`'test'`	180

Özellik yapısı :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

Özellik belgeleri :

Özellik	Sınıf	Dtipi	Tanım
	ÖzelliklerDict
bölüm_done	Tensör	bool
İD	Metin	sicim	Numunenin kimliği.
etiketler	SınıfEtiketi	int64
metin	Metin	sicim	Sınıflandırılacak ifade.

Örnekler ( tfds.as_dataframe ):

bot_adversarial_dialogue Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

Bot Çelişkili Diyalog Veri Kümesi.

bot_adversarial_dialogue/dialogue_datasets (varsayılan yapılandırma)

bot_adversarial_dialogue/human_nonadv_safety_eval

bot_adversarial_dialogue