- Descrizione :
3dshapes è un set di dati di forme 3D generate proceduralmente da 6 fattori latenti indipendenti dalla verità reale. Questi fattori sono il colore del pavimento , il colore della parete , il colore dell'oggetto , la scala , la forma e l'orientamento .
Tutte le possibili combinazioni di questi latenti sono presenti esattamente una volta, generando N = 480000 immagini totali.
Valori dei fattori latenti
- tonalità del pavimento: 10 valori spaziati linearmente in [0, 1]
- tonalità della parete: 10 valori spaziati linearmente in [0, 1]
- tonalità oggetto: 10 valori spaziati linearmente in [0, 1]
- scala: 8 valori spaziati linearmente in [0, 1]
- forma: 4 valori in [0, 1, 2, 3]
- orientamento: 15 valori spaziati linearmente in [-30, 30]
Abbiamo variato un latente alla volta (iniziando dall'orientamento, poi dalla forma, ecc.) e memorizzato sequenzialmente le immagini in ordine fisso nell'array images
. I valori corrispondenti dei fattori vengono memorizzati nello stesso ordine nell'array labels
.
Documentazione aggiuntiva : esplora documenti con codice
Home page : https://github.com/deepmind/3d-shapes
Codice sorgente :
tfds.datasets.shapes3d.Builder
Versioni :
-
2.0.0
(impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )
-
Dimensione download :
255.18 MiB
Dimensione del set di dati :
1.68 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'train' | 480.000 |
- Struttura delle caratteristiche :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Immagine | Immagine | (64, 64, 3) | uint8 | |
label_floor_hue | ClassLabel | int64 | ||
etichetta_oggetto_tonalità | ClassLabel | int64 | ||
orientamento_etichetta | ClassLabel | int64 | ||
etichetta_scala | ClassLabel | int64 | ||
etichetta_forma | ClassLabel | int64 | ||
label_wall_hue | ClassLabel | int64 | ||
value_floor_hue | Tensore | float32 | ||
valore_oggetto_tonalità | Tensore | float32 | ||
orientamento_valore | Tensore | float32 | ||
valore_scala | Tensore | float32 | ||
valore_forma | Tensore | float32 | ||
value_wall_hue | Tensore | float32 |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}