oxford_iiit_pet

  • Описание :

Набор данных о домашних животных Oxford-IIIT представляет собой набор данных изображений домашних животных из 37 категорий, содержащий примерно 200 изображений для каждого класса. Изображения имеют большие различия в масштабе, позе и освещении. Все изображения имеют соответствующую аннотацию о породе и виде. Кроме того, для обучающего разделения предусмотрены ограничивающие рамки головы, что позволяет использовать этот набор данных для простых задач обнаружения объектов. В тестовом разделении ограничивающие рамки пусты.

Расколоть Примеры
'test' 3669
'train' 3680
  • Структура функции :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
имя файла Текст нить
head_bbox BBoxFeature (4,) поплавок32
изображение Изображение (Нет, Нет, 3) uint8
этикетка Класслейбл int64
сегментация_маска Изображение (Нет, Нет, 1) uint8
разновидность Класслейбл int64
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}