stl10

  • Mô tả :

Bộ dữ liệu STL-10 là bộ dữ liệu nhận dạng hình ảnh để phát triển các thuật toán học tính năng, học sâu, học tự học không giám sát. Nó được lấy cảm hứng từ bộ dữ liệu CIFAR-10 nhưng có một số sửa đổi. Đặc biệt, mỗi lớp có ít ví dụ đào tạo được gắn nhãn hơn trong CIFAR-10, nhưng một tập hợp rất lớn các ví dụ không được gắn nhãn được cung cấp để tìm hiểu các mô hình hình ảnh trước khi đào tạo có giám sát. Thách thức chính là tận dụng dữ liệu chưa được gắn nhãn (xuất phát từ một bản phân phối tương tự nhưng khác với dữ liệu được gắn nhãn) để xây dựng một ưu tiên hữu ích. Tất cả các hình ảnh được lấy từ các ví dụ được dán nhãn trên ImageNet.

Tách ra ví dụ
'test' 8.000
'train' 5.000
'unlabelled' 100.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Tài liệu tính năng :
Đặc tính Tầng lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
hình ảnh Hình ảnh (96, 96, 3) uint8
nhãn LớpNhãn int64

Hình dung

  • trích dẫn :
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}