oxford_iiit_pet

  • Sự miêu tả :

Bộ dữ liệu thú cưng Oxford-IIIT là bộ dữ liệu hình ảnh thú cưng gồm 37 loại với khoảng 200 hình ảnh cho mỗi lớp. Các hình ảnh có sự khác biệt lớn về tỷ lệ, tư thế và ánh sáng. Tất cả các hình ảnh đều có chú thích cơ bản liên quan đến giống và loài. Ngoài ra, các hộp giới hạn phần đầu được cung cấp cho phần phân chia huấn luyện, cho phép sử dụng tập dữ liệu này cho các tác vụ phát hiện đối tượng đơn giản. Trong phần tách thử nghiệm, các hộp giới hạn trống.

Tách ra Ví dụ
'test' 3.669
'train' 3.680
  • Cấu trúc tính năng :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
tên_tệp Chữ sợi dây
head_bbox Tính năng BBox (4,) phao32
hình ảnh Hình ảnh (Không, Không, 3) uint8
nhãn Nhãn lớp int64
phân khúc_mask Hình ảnh (Không có, Không có, 1) uint8
giống loài Nhãn lớp int64
  • Trích dẫn :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}