معهد كاليفورنيا للتكنولوجيا101

  • وصف :

يتكون Caltech-101 من صور لأشياء تنتمي إلى 101 فئة، بالإضافة إلى فئة background clutter واحدة. يتم تصنيف كل صورة بكائن واحد. يحتوي كل فصل على ما يقرب من 40 إلى 800 صورة، بإجمالي حوالي 9 آلاف صورة. تكون الصور بأحجام مختلفة، ويبلغ طول حوافها النموذجي 200-300 بكسل. يحتوي هذا الإصدار على تسميات على مستوى الصورة فقط. تحتوي مجموعة البيانات الأصلية أيضًا على مربعات محيطة.

ينقسم أمثلة
'test' 6,084
'train' 3,060
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=102),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (لا شيء، لا شيء، 3) uint8
الصورة/اسم_الملف نص خيط
ملصق ClassLabel int64

التصور

  • الاقتباس :
@article{FeiFei2004LearningGV,
  title={Learning Generative Visual Models from Few Training Examples: An Incremental Bayesian Approach Tested on 101 Object Categories},
  author={Li Fei-Fei and Rob Fergus and Pietro Perona},
  journal={Computer Vision and Pattern Recognition Workshop},
  year={2004},
}