imagenet_lt

  • الوصف :

ImageNet-LT هي مجموعة فرعية من مجموعة بيانات ImageNet ILSVRC 2012 الأصلية. مجموعة التدريب مقسمة إلى عينات فرعية بحيث يتبع عدد الصور لكل فصل توزيعًا طويل الذيل. يحتوي الفصل الذي يحتوي على أقصى عدد من الصور على 1280 مثالًا ، بينما يحتوي الفصل الذي يحتوي على الحد الأدنى من الصور على 5 أمثلة فقط. تحتوي مجموعة البيانات أيضًا على مجموعة تحقق متوازنة ، وهي أيضًا مجموعة فرعية من مجموعة تدريب ImageNet ILSVRC 2012 وتحتوي على 20 صورة لكل فصل. مجموعة الاختبار لمجموعة البيانات هذه هي نفسها مجموعة التحقق من مجموعة بيانات ImageNet ILSVRC 2012 الأصلية.

يجب تنزيل مجموعة بيانات ImageNet ILSVRC 2012 الأصلية يدويًا ، ويجب تعيين مسارها باستخدام --manual_dir لإنشاء مجموعة البيانات هذه.

انشق، مزق أمثلة
'test' 50000
'train' 115846
'validation' 20000
  • هيكل الميزة :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
اسم الملف نص سلسلة
صورة صورة (لا شيء ، لا شيء ، 3) uint8
ضع الكلمة المناسبة ClassLabel int64

التصور

  • الاقتباس :
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}