صوت

  • الوصف :

تحتوي مجموعة البيانات هذه على بيانات من PASCAL Visual Object Classes Challenge ، المقابلة لمسابقات التصنيف والكشف.

في مسابقة التصنيف ، الهدف هو التنبؤ بمجموعة الملصقات الموجودة في الصورة ، بينما في مسابقة الكشف ، يكون الهدف هو التنبؤ بالمربع المحيط وتسمية كل كائن على حدة. تحذير: وفقًا لمجموعة البيانات الرسمية ، لا تحتوي مجموعة اختبار VOC2012 على تعليقات توضيحية.

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_difficult': bool,
        'is_truncated': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صورة صورة (لا شيء ، لا شيء ، 3) uint8
الصورة / اسم الملف نص سلسلة
ملصقات تسلسل (ClassLabel) (لا أحد،) int64
labels_no_def صعب تسلسل (ClassLabel) (لا أحد،) int64
أشياء تسلسل
كائنات / bbox ميزة BBox (4 ،) تعويم 32
الأشياء / صعب موتر منطقي
كائنات / غير مقطوعة موتر منطقي
الكائنات / التسمية ClassLabel int64
كائنات / تشكل ClassLabel int64

voc / 2007 (التكوين الافتراضي)

  • وصف التكوين : تحتوي مجموعة البيانات هذه على البيانات من PASCAL Visual Object Classes Challenge 2007 ، المعروف أيضًا باسم VOC2007.

تم تضمين ما مجموعه 9963 صورة في مجموعة البيانات هذه ، حيث تحتوي كل صورة على مجموعة من الكائنات ، من بين 20 فئة مختلفة ، مما يجعل إجمالي 24640 كائنًا مشروحًا.

انشق، مزق أمثلة
'test' 4،952
'train' 2،501
'validation' 2،510

التصور

  • الاقتباس :
@misc{pascal-voc-2007,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}

voc / 2012

  • وصف التكوين : تحتوي مجموعة البيانات هذه على البيانات من PASCAL Visual Object Classes Challenge 2012 ، المعروف أيضًا باسم VOC2012.

يتم تضمين ما مجموعه 11540 صورة في مجموعة البيانات هذه ، حيث تحتوي كل صورة على مجموعة من الكائنات ، من بين 20 فئة مختلفة ، مما يجعل إجمالي 27450 عنصرًا مشروحًا.

انشق، مزق أمثلة
'test' 10991
'train' 5717
'validation' 5823

التصور

  • الاقتباس :
@misc{pascal-voc-2012,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}