- বর্ণনা :
databricks-dolly-15k
হল ডাটাব্রিক্স/ডলি-ভি2-12b প্রশিক্ষণে ব্যবহৃত নির্দেশনা-নিম্নলিখিত রেকর্ডগুলির একটি ওপেন সোর্স ডেটাসেট যা ইনস্ট্রাক্টজিপিটি পেপারে বর্ণিত আচরণগত বিভাগে হাজার হাজার ডেটাব্রিক্স কর্মচারী দ্বারা তৈরি করা হয়েছে, যার মধ্যে ব্রেনস্টর্মিং, শ্রেণিবিন্যাস, বন্ধ QA, প্রজন্ম, তথ্য নিষ্কাশন, খোলা QA, এবং সংক্ষিপ্তকরণ।
এই ডেটাসেটটি ক্রিয়েটিভ কমন্স অ্যাট্রিবিউশন-শেয়ারঅ্যালাইক 3.0 আনপোর্টেড লাইসেন্সের শর্তাবলীর অধীনে, একাডেমিক বা বাণিজ্যিক যে কোনও উদ্দেশ্যে ব্যবহার করা যেতে পারে।
উত্স কোড :
tfds.datasets.databricks_dolly.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
12.60 MiB
ডেটাসেটের আকার :
12.69 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 15,014 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
বিভাগ | পাঠ্য | স্ট্রিং | ||
প্রসঙ্গ | পাঠ্য | স্ট্রিং | ||
নির্দেশ | পাঠ্য | স্ট্রিং | ||
প্রতিক্রিয়া | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :