caltech101

  • Sự miêu tả :

Caltech-101 bao gồm các hình ảnh của các đối tượng thuộc 101 lớp, cộng với một lớp background clutter . Mỗi hình ảnh được dán nhãn bằng một đối tượng duy nhất. Mỗi lớp chứa khoảng 40 đến 800 hình ảnh, tổng cộng khoảng 9k hình ảnh. Hình ảnh có kích thước thay đổi, với độ dài cạnh điển hình là 200-300 pixel. Phiên bản này chỉ chứa nhãn cấp độ hình ảnh. Tập dữ liệu gốc cũng chứa các hộp giới hạn.

Tách ra Ví dụ
'test' 6.084
'train' 3.060
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=102),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không, 3) uint8
hình ảnh/tên_tệp Chữ sợi dây
nhãn Nhãn lớp int64

Hình dung

  • Trích dẫn :
@article{FeiFei2004LearningGV,
  title={Learning Generative Visual Models from Few Training Examples: An Incremental Bayesian Approach Tested on 101 Object Categories},
  author={Li Fei-Fei and Rob Fergus and Pietro Perona},
  journal={Computer Vision and Pattern Recognition Workshop},
  year={2004},
}