stl10

  • বর্ণনা :

STL-10 ডেটাসেট হল একটি ইমেজ রিকগনিশন ডেটাসেট যা তত্ত্বাবধানহীন ফিচার লার্নিং, ডিপ লার্নিং, স্ব-শিক্ষিত লার্নিং অ্যালগরিদম তৈরি করার জন্য। এটি CIFAR-10 ডেটাসেট দ্বারা অনুপ্রাণিত কিন্তু কিছু পরিবর্তন সহ। বিশেষ করে, প্রতিটি ক্লাসে CIFAR-10-এর তুলনায় কম লেবেলযুক্ত প্রশিক্ষণ উদাহরণ রয়েছে, তবে তত্ত্বাবধানে প্রশিক্ষণের আগে চিত্রের মডেল শেখার জন্য লেবেলবিহীন উদাহরণগুলির একটি খুব বড় সেট প্রদান করা হয়। প্রাথমিক চ্যালেঞ্জ হল লেবেলবিহীন ডেটা ব্যবহার করা (যা লেবেলযুক্ত ডেটা থেকে একই রকম কিন্তু ভিন্ন ডিস্ট্রিবিউশন থেকে আসে) একটি দরকারী পূর্ব তৈরি করতে। সমস্ত ছবি ইমেজনেটের লেবেলযুক্ত উদাহরণ থেকে অর্জিত হয়েছিল।

বিভক্ত উদাহরণ
'test' 8,000
'train' 5,000
'unlabelled' 100,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ইমেজ ছবি (৯৬, ৯৬, ৩) uint8
লেবেল ক্লাসলেবেল int64

ভিজ্যুয়ালাইজেশন

  • উদ্ধৃতি :
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}