stl10

  • 説明:

STL-10 データセットは、教師なし特徴学習、深層学習、独学学習アルゴリズムを開発するための画像認識データセットです。 CIFAR-10 データセットに触発されていますが、いくつかの変更が加えられています。特に、各クラスのラベル付きトレーニング例は CIFAR-10 よりも少なくなりますが、教師ありトレーニングの前に画像モデルを学習するために、ラベルなしサンプルの非常に大きなセットが提供されます。主な課題は、ラベル付けされていないデータ (ラベル付けされたデータと類似しているが異なる分布に由来する) を利用して、有用な事前確率を構築することです。すべての画像は、ImageNet のラベル付きの例から取得されました。

スプリット
'test' 8,000
'train' 5,000
'unlabelled' 100,000
  • 機能構造:
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
画像画像(96, 96, 3) uint8
ラベルクラスラベルint64

視覚化

  • 引用
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}