nhỏ

  • Sự miêu tả :

Cơ sở dữ liệu này dành cho các thử nghiệm về nhận dạng đối tượng 3D từ hình dạng. Nó chứa hình ảnh của 50 đồ chơi thuộc 5 loại chung: động vật bốn chân, hình người, máy bay, xe tải và ô tô. Các vật thể được chụp bằng hai camera trong 6 điều kiện ánh sáng, 9 độ cao (30 đến 70 độ mỗi 5 độ) và 18 góc phương vị (0 đến 340 mỗi 20 độ).

Tập huấn luyện bao gồm 5 phiên bản của mỗi loại (phiên bản 4, 6, 7, 8 và 9) và tập kiểm tra của 5 phiên bản còn lại (phiên bản 0, 1, 2, 3 và 5).

Tách ra Ví dụ
'test' 24.300
'train' 24.300
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
hình ảnh Hình ảnh (96, 96, 1) uint8
hình ảnh2 Hình ảnh (96, 96, 1) uint8
ví dụ Nhãn lớp int64
nhãn_góc phương vị Nhãn lớp int64
nhãn_category Nhãn lớp int64
nhãn_độ cao Nhãn lớp int64
nhãn_chiếu sáng Nhãn lớp int64
  • Trích dẫn :
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}