- Description :
Open Images est un ensemble de données d'environ 9 millions d'images qui ont été annotées avec des étiquettes au niveau de l'image et des cadres de délimitation d'objets.
L'ensemble d'entraînement de la V4 contient 14,6 millions de cadres de délimitation pour 600 classes d'objets sur 1,74 million d'images, ce qui en fait le plus grand ensemble de données existant avec des annotations d'emplacement d'objet. Les cases ont été en grande partie dessinées manuellement par des annotateurs professionnels pour garantir l'exactitude et la cohérence. Les images sont très diverses et contiennent souvent des scènes complexes avec plusieurs objets (8,4 par image en moyenne). De plus, l’ensemble de données est annoté avec des étiquettes au niveau de l’image couvrant des milliers de classes.
Documentation supplémentaire : Explorer sur les articles avec le code
Page d'accueil : https://storage.googleapis.com/openimages/web/index.html
Code source :
tfds.datasets.open_images_v4.Builder
Versions :
-
2.0.0
(par défaut) : nouvelle API fractionnée ( https://tensorflow.org/datasets/splits )
-
Taille du téléchargement :
565.11 GiB
Mise en cache automatique ( documentation ) : Non
Divisions :
Diviser | Exemples |
---|---|
'test' | 125 436 |
'train' | 1 743 042 |
'validation' | 41 620 |
- Structure des fonctionnalités :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_depiction': int8,
'is_group_of': int8,
'is_inside': int8,
'is_occluded': int8,
'is_truncated': int8,
'label': ClassLabel(shape=(), dtype=int64, num_classes=601),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=19995),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'objects_trainable': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=7186),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
bobjets | Séquence | |||
bobjets/bbox | Fonctionnalité BBox | (4,) | flotteur32 | |
bobjects/is_depiction | Tenseur | int8 | ||
bobjects/is_group_of | Tenseur | int8 | ||
bobjects/is_inside | Tenseur | int8 | ||
bobjects/is_occlus | Tenseur | int8 | ||
bobjects/is_truncated | Tenseur | int8 | ||
bobjets/étiquette | Étiquette de classe | int64 | ||
bobjets/source | Étiquette de classe | int64 | ||
image | Image | (Aucun, Aucun, 3) | uint8 | |
image/nom de fichier | Texte | chaîne | ||
objets | Séquence | |||
objets/confiance | Tenseur | int32 | ||
objets/étiquette | Étiquette de classe | int64 | ||
objets/source | Étiquette de classe | int64 | ||
objets_trainable | Séquence | |||
objets_trainable/confiance | Tenseur | int32 | ||
objets_trainable/étiquette | Étiquette de classe | int64 | ||
objets_trainable/source | Étiquette de classe | int64 |
Clés supervisées (Voir doc
as_supervised
) :None
Citation :
@article{OpenImages,
author = {Alina Kuznetsova and
Hassan Rom and
Neil Alldrin and
Jasper Uijlings and
Ivan Krasin and
Jordi Pont-Tuset and
Shahab Kamali and
Stefan Popov and
Matteo Malloci and
Tom Duerig and
Vittorio Ferrari},
title = {The Open Images Dataset V4: Unified image classification,
object detection, and visual relationship detection at scale},
year = {2018},
journal = {arXiv:1811.00982}
}
@article{OpenImages2,
author = {Krasin, Ivan and
Duerig, Tom and
Alldrin, Neil and
Ferrari, Vittorio
and Abu-El-Haija, Sami and
Kuznetsova, Alina and
Rom, Hassan and
Uijlings, Jasper and
Popov, Stefan and
Kamali, Shahab and
Malloci, Matteo and
Pont-Tuset, Jordi and
Veit, Andreas and
Belongie, Serge and
Gomes, Victor and
Gupta, Abhinav and
Sun, Chen and
Chechik, Gal and
Cai, David and
Feng, Zheyun and
Narayanan, Dhyanesh and
Murphy, Kevin},
title = {OpenImages: A public dataset for large-scale multi-label and
multi-class image classification.},
journal = {Dataset available from
https://storage.googleapis.com/openimages/web/index.html},
year={2017}
}
open_images_v4/original (configuration par défaut)
Description de la configuration : Images dans leur résolution et qualité d'origine.
Taille de l'ensemble de données :
562.42 GiB
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
open_images_v4/300k
Description de la configuration : Les images ont environ 300 000 pixels, en qualité JPEG 72.
Taille de l'ensemble de données :
81.92 GiB
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
open_images_v4/200k
Description de la configuration : Les images ont environ 200 000 pixels, en qualité JPEG 72.
Taille du jeu de données :
60.70 GiB
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :