- विवरण :
बॉट एडवरसैरियल डायलॉग डेटासेट।
बॉट एडवरसैरियल डायलॉग कार्य से संवाद डेटासेट को आक्रामकता के साथ लेबल किया गया। संवादों को मनुष्यों से बॉट्स से प्रतिकूल रूप से बात करने के लिए कहकर एकत्र किया गया था।
पेपर में अधिक विवरण।
मुखपृष्ठ : https://github.com/facebookresearch/ParlAI/tree/main/parrai/tasks/bot_adversarial_dialogue
स्रोत कोड :
tfds.datasets.bot_adversarial_dialogue.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialog_datasets (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फ़िगरेशन विवरण : संवाद डेटासेट, ट्रेन, सत्यापन और परीक्षण विभाजन में विभाजित।
डाउनलोड आकार :
3.06 MiB
डेटासेट का आकार :
23.38 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,598 |
'train' | 69,274 |
'valid' | 7,002 |
- फ़ीचर संरचना :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
bot_persona | अनुक्रम(पाठ) | (कोई नहीं,) | डोरी | बॉट द्वारा प्रतिरूपित व्यक्तित्व। |
संवाद_आईडी | टेन्सर | फ्लोट32 | ||
एपिसोड_हो गया | टेन्सर | बूल | ||
पहचान | मूलपाठ | डोरी | नमूने की आईडी. | |
लेबल | क्लास लेबल | int64 | ||
राउंड_आईडी | टेन्सर | फ्लोट32 | ||
स्पीकर_टू_इवल | मूलपाठ | डोरी | कथनों के वक्ता को लेबल किया गया। | |
मूलपाठ | मूलपाठ | डोरी | वर्गीकरण करने का कथन। |
- उदाहरण ( tfds.as_dataframe ):
bot_adversarial_dialog/ human_nonadv_safety_eval
कॉन्फ़िगरेशन विवरण : एक मानव सुरक्षा मूल्यांकन सेट जिसका आक्रामकता के लिए क्राउडसोर्स्ड कार्यकर्ताओं द्वारा मूल्यांकन किया गया।
डाउनलोड आकार :
10.57 KiB
डेटासेट का आकार :
34.55 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 180 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
एपिसोड_हो गया | टेन्सर | बूल | ||
पहचान | मूलपाठ | डोरी | नमूने की आईडी. | |
लेबल | क्लास लेबल | int64 | ||
मूलपाठ | मूलपाठ | डोरी | वर्गीकरण करने का कथन। |
- उदाहरण ( tfds.as_dataframe ):