bot_adversarial_dialogue

विवरण :

बॉट एडवरसैरियल डायलॉग डेटासेट।

बॉट एडवरसैरियल डायलॉग कार्य से संवाद डेटासेट को आक्रामकता के साथ लेबल किया गया। संवादों को मनुष्यों से बॉट्स से प्रतिकूल रूप से बात करने के लिए कहकर एकत्र किया गया था।

पेपर में अधिक विवरण।

मुखपृष्ठ : https://github.com/facebookresearch/ParlAI/tree/main/parrai/tasks/bot_adversarial_dialogue
स्रोत कोड : tfds.datasets.bot_adversarial_dialogue.Builder
संस्करण :
- 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialog_datasets (डिफ़ॉल्ट कॉन्फ़िगरेशन)

कॉन्फ़िगरेशन विवरण : संवाद डेटासेट, ट्रेन, सत्यापन और परीक्षण विभाजन में विभाजित।
डाउनलोड आकार : 3.06 MiB
डेटासेट का आकार : 23.38 MiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	2,598
`'train'`	69,274
`'valid'`	7,002

फ़ीचर संरचना :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	आकार	डीप्रकार	विवरण
	फीचर्सडिक्ट
bot_persona	अनुक्रम(पाठ)	(कोई नहीं,)	डोरी	बॉट द्वारा प्रतिरूपित व्यक्तित्व।
संवाद_आईडी	टेन्सर		फ्लोट32
एपिसोड_हो गया	टेन्सर		बूल
पहचान	मूलपाठ		डोरी	नमूने की आईडी.
लेबल	क्लास लेबल		int64
राउंड_आईडी	टेन्सर		फ्लोट32
स्पीकर_टू_इवल	मूलपाठ		डोरी	कथनों के वक्ता को लेबल किया गया।
मूलपाठ	मूलपाठ		डोरी	वर्गीकरण करने का कथन।

उदाहरण ( tfds.as_dataframe ):

bot_adversarial_dialog/ human_nonadv_safety_eval

कॉन्फ़िगरेशन विवरण : एक मानव सुरक्षा मूल्यांकन सेट जिसका आक्रामकता के लिए क्राउडसोर्स्ड कार्यकर्ताओं द्वारा मूल्यांकन किया गया।
डाउनलोड आकार : 10.57 KiB
डेटासेट का आकार : 34.55 KiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	180

फ़ीचर संरचना :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीप्रकार	विवरण
	फीचर्सडिक्ट
एपिसोड_हो गया	टेन्सर	बूल
पहचान	मूलपाठ	डोरी	नमूने की आईडी.
लेबल	क्लास लेबल	int64
मूलपाठ	मूलपाठ	डोरी	वर्गीकरण करने का कथन।

उदाहरण ( tfds.as_dataframe ):

bot_adversarial_dialogue संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

बॉट एडवरसैरियल डायलॉग डेटासेट।

bot_adversarial_dialogue/dialog_datasets (डिफ़ॉल्ट कॉन्फ़िगरेशन)

bot_adversarial_dialog/ human_nonadv_safety_eval

bot_adversarial_dialogue