forme3d

  • Descrizione :

3dshapes è un set di dati di forme 3D generate proceduralmente da 6 fattori latenti indipendenti dalla verità reale. Questi fattori sono il colore del pavimento , il colore della parete , il colore dell'oggetto , la scala , la forma e l'orientamento .

Tutte le possibili combinazioni di questi latenti sono presenti esattamente una volta, generando N = 480000 immagini totali.

Valori dei fattori latenti

  • tonalità del pavimento: 10 valori spaziati linearmente in [0, 1]
  • tonalità della parete: 10 valori spaziati linearmente in [0, 1]
  • tonalità oggetto: 10 valori spaziati linearmente in [0, 1]
  • scala: 8 valori spaziati linearmente in [0, 1]
  • forma: 4 valori in [0, 1, 2, 3]
  • orientamento: 15 valori spaziati linearmente in [-30, 30]

Abbiamo variato un latente alla volta (iniziando dall'orientamento, poi dalla forma, ecc.) e memorizzato sequenzialmente le immagini in ordine fisso nell'array images . I valori corrispondenti dei fattori vengono memorizzati nello stesso ordine nell'array labels .

Diviso Esempi
'train' 480.000
  • Struttura delle caratteristiche :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
Immagine Immagine (64, 64, 3) uint8
label_floor_hue ClassLabel int64
etichetta_oggetto_tonalità ClassLabel int64
orientamento_etichetta ClassLabel int64
etichetta_scala ClassLabel int64
etichetta_forma ClassLabel int64
label_wall_hue ClassLabel int64
value_floor_hue Tensore float32
valore_oggetto_tonalità Tensore float32
orientamento_valore Tensore float32
valore_scala Tensore float32
valore_forma Tensore float32
value_wall_hue Tensore float32

Visualizzazione

  • Citazione :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}