- Description :
3dshapes est un ensemble de données de formes 3D générées de manière procédurale à partir de 6 facteurs latents indépendants de la vérité terrain. Ces facteurs sont la couleur du sol , la couleur des murs , la couleur de l'objet , l'échelle , la forme et l'orientation .
Toutes les combinaisons possibles de ces latents sont présentes exactement une fois, générant N = 480 000 images au total.
Valeurs des facteurs latents
- teinte du sol : 10 valeurs espacées linéairement dans [0, 1]
- teinte du mur : 10 valeurs espacées linéairement dans [0, 1]
- teinte de l'objet : 10 valeurs espacées linéairement dans [0, 1]
- échelle : 8 valeurs espacées linéairement en [0, 1]
- forme : 4 valeurs dans [0, 1, 2, 3]
- orientation : 15 valeurs espacées linéairement dans [-30, 30]
Nous avons fait varier une latente à la fois (en commençant par l'orientation, puis la forme, etc.) et avons stocké séquentiellement les images dans un ordre fixe dans le tableau images
. Les valeurs correspondantes des facteurs sont stockées dans le même ordre dans le tableau labels
.
Documentation supplémentaire : Explorer sur les articles avec le code
Page d'accueil : https://github.com/deepmind/3d-shapes
Code source :
tfds.datasets.shapes3d.Builder
Versions :
-
2.0.0
(par défaut) : nouvelle API fractionnée ( https://tensorflow.org/datasets/splits )
-
Taille du téléchargement :
255.18 MiB
Taille du jeu de données :
1.68 GiB
Mise en cache automatique ( documentation ) : Non
Divisions :
Diviser | Exemples |
---|---|
'train' | 480 000 |
- Structure des fonctionnalités :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image | Image | (64, 64, 3) | uint8 | |
label_floor_hue | Étiquette de classe | int64 | ||
label_object_hue | Étiquette de classe | int64 | ||
étiquette_orientation | Étiquette de classe | int64 | ||
étiquette_scale | Étiquette de classe | int64 | ||
forme_étiquette | Étiquette de classe | int64 | ||
label_wall_hue | Étiquette de classe | int64 | ||
value_floor_hue | Tenseur | flotteur32 | ||
valeur_objet_hue | Tenseur | flotteur32 | ||
valeur_orientation | Tenseur | flotteur32 | ||
valeur_échelle | Tenseur | flotteur32 | ||
forme_valeur | Tenseur | flotteur32 | ||
valeur_wall_hue | Tenseur | flotteur32 |
Clés supervisées (Voir doc
as_supervised
) :None
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
- Citation :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}