एसटीएल10

  • विवरण :

STL-10 डेटासेट एक इमेज रिकग्निशन डेटासेट है, जो बिना सुपरवाइज्ड फीचर लर्निंग, डीप लर्निंग, सेल्फ-टीचिंग लर्निंग एल्गोरिदम को विकसित करने के लिए है। यह CIFAR-10 डेटासेट से प्रेरित है लेकिन कुछ संशोधनों के साथ। विशेष रूप से, प्रत्येक वर्ग में CIFAR-10 की तुलना में कम लेबल वाले प्रशिक्षण उदाहरण हैं, लेकिन पर्यवेक्षित प्रशिक्षण से पहले छवि मॉडल सीखने के लिए बिना लेबल वाले उदाहरणों का एक बहुत बड़ा सेट प्रदान किया जाता है। एक उपयोगी प्रायर बनाने के लिए लेबल रहित डेटा (जो लेबल किए गए डेटा से समान लेकिन भिन्न वितरण से आता है) का उपयोग करना प्राथमिक चुनौती है। इमेजनेट पर लेबल किए गए उदाहरणों से सभी छवियां प्राप्त की गईं।

विभाजित करना उदाहरण
'test' 8,000
'train' 5,000
'unlabelled' 100,000
  • फ़ीचर संरचना :
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
छवि छवि (96, 96, 3) uint8
लेबल क्लासलेबल int64

VISUALIZATION

  • उद्धरण :
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}