- Açıklama :
Bu veri seti, Sınıflandırma ve Saptama yarışmalarına karşılık gelen PASCAL Görsel Nesne Sınıfları Yarışmasından alınan verileri içerir.
Sınıflandırma yarışmasında amaç, görüntüde yer alan etiket setini tahmin etmekken, Saptama yarışmasında amaç, her bir nesnenin sınırlayıcı kutusunu ve etiketini tahmin etmektir. UYARI: Resmi veri setine göre, VOC2012'nin test seti ek açıklama içermez.
Kaynak kodu :
tfds.object_detection.Voc
sürümler :
-
4.0.0
(varsayılan): Sürüm notu yok.
-
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
Özellik yapısı :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
görüntü | resim | (Yok, Yok, 3) | uint8 | |
resim/dosya adı | Metin | sicim | ||
etiketler | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
tags_no_zor | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
nesneler | Sekans | |||
nesneler/bbox | BBoxÖzelliği | (4,) | şamandıra32 | |
nesneler/zordur | tensör | bool | ||
nesneler/kesilmiş | tensör | bool | ||
nesneler/etiket | SınıfEtiketi | int64 | ||
nesneler/poz | SınıfEtiketi | int64 |
- Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
voc/2007 (varsayılan yapılandırma)
- Yapılandırma açıklaması : Bu veri kümesi, PASCAL Visual Object Classes Challenge 2007, diğer adıyla VOC2007'den alınan verileri içerir.
Bu veri kümesine toplam 9963 görüntü dahil edilmiştir, burada her görüntü 20 farklı sınıftan bir dizi nesne içerir ve toplam 24640 açıklamalı nesne oluşturur.
Ana Sayfa : http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
İndirme boyutu :
868.85 MiB
Veri kümesi boyutu :
837.73 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2.510 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
cilt/2012
- Yapılandırma açıklaması : Bu veri kümesi, PASCAL Visual Object Classes Challenge 2012, diğer adıyla VOC2012'den alınan verileri içerir.
Bu veri kümesine toplam 11540 görüntü dahil edilmiştir, burada her görüntü 20 farklı sınıftan bir dizi nesne içerir ve toplam 27450 açıklamalı nesne oluşturur.
Ana Sayfa : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
İndirme boyutu :
3.59 GiB
Veri kümesi boyutu :
2.44 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 10.991 |
'train' | 5.717 |
'validation' | 5.823 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}