形状3D

  • 説明

3dshapes は、6 つのグラウンド トゥルースの独立した潜在要素から手続き的に生成された 3D 形状のデータセットです。これらの要素は、床の色壁の色オブジェクトの色スケール形状向きです

これらの潜在的な組み合わせはすべて 1 回だけ存在し、合計 N = 480000 の画像が生成されます。

潜在因子の値

  • 床の色相: [0, 1] で直線的に配置された 10 個の値
  • 壁の色相: [0, 1] で直線的に配置された 10 個の値
  • オブジェクトの色相: [0, 1] で直線的に配置された 10 個の値
  • スケール: [0, 1] で直線的に配置された 8 つの値
  • 形状: [0、1、2、3] の 4 つの値
  • 方向: [-30, 30] で直線的に配置された 15 個の値

一度に 1 つの潜在要素を変更し (方向から始めて、次に形状など)、画像を固定順序でimages配列に順次保存しました。因子の対応する値は、 labels配列に同じ順序で格納されます。

スプリット
'train' 480,000
  • 機能の構造:
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
画像画像(64、64、3) uint8
ラベルフロア_色相クラスラベルint64
label_object_hueクラスラベルint64
ラベルの向きクラスラベルint64
ラベルスケールクラスラベルint64
ラベルの形状クラスラベルint64
label_wall_hueクラスラベルint64
値の床の色相テンソルfloat32
値オブジェクトの色相テンソルfloat32
値の方向テンソルfloat32
値のスケールテンソルfloat32
値の形状テンソルfloat32
値の壁の色相テンソルfloat32

視覚化

  • 引用
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}