- Descrizione :
Open Images è un set di dati di circa 9 milioni di immagini che sono state annotate con etichette a livello di immagine e riquadri di delimitazione degli oggetti.
Il set di addestramento della V4 contiene 14,6 milioni di riquadri di delimitazione per 600 classi di oggetti su 1,74 milioni di immagini, rendendolo il set di dati esistente più grande con annotazioni sulla posizione degli oggetti. Le scatole sono state in gran parte disegnate manualmente da annotatori professionisti per garantire accuratezza e coerenza. Le immagini sono molto diverse e spesso contengono scene complesse con diversi oggetti (in media 8,4 per immagine). Inoltre, il set di dati è annotato con etichette a livello di immagine che abbracciano migliaia di classi.
Documentazione aggiuntiva : esplora documenti con codice
Pagina iniziale : https://storage.googleapis.com/openimages/web/index.html
Codice sorgente :
tfds.datasets.open_images_v4.Builder
Versioni :
-
2.0.0
(impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )
-
Dimensioni download :
565.11 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'test' | 125.436 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Struttura delle caratteristiche :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_depiction': int8,
'is_group_of': int8,
'is_inside': int8,
'is_occluded': int8,
'is_truncated': int8,
'label': ClassLabel(shape=(), dtype=int64, num_classes=601),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=19995),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'objects_trainable': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=7186),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
oggetti | Sequenza | |||
booggetti/bbox | Funzione BBox | (4,) | float32 | |
bobjects/is_depiction | Tensore | int8 | ||
bobjects/is_group_of | Tensore | int8 | ||
bobjects/is_inside | Tensore | int8 | ||
bobjects/is_occluded | Tensore | int8 | ||
bobjects/is_troncato | Tensore | int8 | ||
oggetti/etichetta | ClassLabel | int64 | ||
oggetti/fonte | ClassLabel | int64 | ||
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
immagine/nome file | Testo | corda | ||
oggetti | Sequenza | |||
oggetti/fiducia | Tensore | int32 | ||
oggetti/etichetta | ClassLabel | int64 | ||
oggetti/fonte | ClassLabel | int64 | ||
oggetti_trainabili | Sequenza | |||
oggetti_trainabili/confidenza | Tensore | int32 | ||
oggetti_trainabili/etichetta | ClassLabel | int64 | ||
oggetti_trainabili/fonte | ClassLabel | int64 |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Citazione :
@article{OpenImages,
author = {Alina Kuznetsova and
Hassan Rom and
Neil Alldrin and
Jasper Uijlings and
Ivan Krasin and
Jordi Pont-Tuset and
Shahab Kamali and
Stefan Popov and
Matteo Malloci and
Tom Duerig and
Vittorio Ferrari},
title = {The Open Images Dataset V4: Unified image classification,
object detection, and visual relationship detection at scale},
year = {2018},
journal = {arXiv:1811.00982}
}
@article{OpenImages2,
author = {Krasin, Ivan and
Duerig, Tom and
Alldrin, Neil and
Ferrari, Vittorio
and Abu-El-Haija, Sami and
Kuznetsova, Alina and
Rom, Hassan and
Uijlings, Jasper and
Popov, Stefan and
Kamali, Shahab and
Malloci, Matteo and
Pont-Tuset, Jordi and
Veit, Andreas and
Belongie, Serge and
Gomes, Victor and
Gupta, Abhinav and
Sun, Chen and
Chechik, Gal and
Cai, David and
Feng, Zheyun and
Narayanan, Dhyanesh and
Murphy, Kevin},
title = {OpenImages: A public dataset for large-scale multi-label and
multi-class image classification.},
journal = {Dataset available from
https://storage.googleapis.com/openimages/web/index.html},
year={2017}
}
open_images_v4/original (configurazione predefinita)
Descrizione configurazione : immagini con risoluzione e qualità originali.
Dimensione del set di dati :
562.42 GiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
open_images_v4/300k
Descrizione della configurazione : le immagini hanno circa 300.000 pixel, con qualità JPEG 72.
Dimensione del set di dati :
81.92 GiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
open_images_v4/200k
Descrizione della configurazione : le immagini hanno circa 200.000 pixel, con qualità JPEG 72.
Dimensione del set di dati :
60.70 GiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):