- विवरण :
databricks-dolly-15k
प्रशिक्षण डेटाब्रिक्स/डॉली-वी2-12बी में उपयोग किए जाने वाले अनुदेश-अनुसरण रिकॉर्ड का एक खुला स्रोत डेटासेट है, जिसे ब्रेनस्टॉर्मिंग, वर्गीकरण सहित इंस्ट्रक्टजीपीटी पेपर में उल्लिखित कई व्यवहार श्रेणियों में हजारों डेटाब्रिक्स कर्मचारियों द्वारा तैयार किया गया था। बंद क्यूए, पीढ़ी, सूचना निष्कर्षण, खुला क्यूए, और सारांश।
क्रिएटिव कॉमन्स एट्रिब्यूशन-शेयरअलाइक 3.0 अनपोर्टेड लाइसेंस की शर्तों के तहत इस डेटासेट का उपयोग किसी भी उद्देश्य के लिए किया जा सकता है, चाहे शैक्षणिक हो या व्यावसायिक।
मुखपृष्ठ : https://github.com/databrickslabs/dolly
स्रोत कोड :
tfds.datasets.databricks_dolly.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
12.60 MiB
डेटासेट का आकार :
12.69 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 15,014 |
- फ़ीचर संरचना :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
वर्ग | मूलपाठ | डोरी | ||
प्रसंग | मूलपाठ | डोरी | ||
अनुदेश | मूलपाठ | डोरी | ||
प्रतिक्रिया | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :