- Tanım :
Open Images, görüntü düzeyindeki etiketler, nesne sınırlama kutuları, nesne segmentasyon maskeleri ve görsel ilişkilerle açıklamalı yaklaşık 9 milyon görüntünün ortak bir sürümüdür. Bu benzersiz derecede büyük ve çeşitli veri kümesi, görüntülerin analiz edilmesi ve anlaşılmasında son teknoloji gelişmeleri teşvik etmek için tasarlanmıştır.
Bu, yarışmanın Nesne Algılama parkurundaki verileri içerir. Bu yoldaki amaç, 500 sınıfın tüm nesne örneklerinin etrafında sıkı bir sınırlayıcı kutu öngörmektir.
Görüntüler, belirli nesne sınıflarının mevcut olduğunu belirten pozitif görüntü düzeyi etiketleriyle ve belirli sınıfların bulunmadığını gösteren negatif görüntü düzeyi etiketleriyle açıklanmıştır. Yarışmada, o görseldeki diğer tüm açıklamasız sınıflar değerlendirme dışı bırakılır. Bir görüntüdeki her pozitif görüntü düzeyindeki etiket için, o nesne sınıfının görüntüdeki her örneğine açıklama eklenmiştir.
Ana sayfa : https://storage.googleapis.com/openimages/web/challenge2019.html
Kaynak kodu :
tfds.datasets.open_images_challenge2019_detection.Builder
Sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
534.63 GiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 99.999 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Özellik yapısı :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_group_of': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
}),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'confidence': float32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
'source': Text(shape=(), dtype=string),
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
bobject'ler | Sekans | |||
bobjects/bbox | BBoxÖzelliği | (4,) | kayan nokta32 | |
bobjects/is_group_of | Tensör | bool | ||
bobjects/etiket | SınıfEtiketi | int64 | ||
İD | Metin | sicim | ||
görüntü | Resim | (Yok, Yok, 3) | uint8 | |
nesneler | Sekans | |||
nesneler/güven | Tensör | kayan nokta32 | ||
nesneler/etiket | SınıfEtiketi | int64 | ||
nesneler/kaynak | Metin | sicim |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Alıntı :
open_images_challenge2019_detection/200k (varsayılan yapılandırma)
Yapılandırma açıklaması : Görüntüler 72 JPEG kalitesinde en fazla 200.000 piksele sahiptir.
Veri kümesi boyutu :
59.06 GiB
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
open_images_challenge2019_detection/300k
Yapılandırma açıklaması : Görüntüler 72 JPEG kalitesinde en fazla 300.000 piksele sahiptir.
Veri kümesi boyutu :
80.10 GiB
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):