3d

  • وصف :

3dshapes عبارة عن مجموعة بيانات من الأشكال ثلاثية الأبعاد التي تم إنشاؤها من الناحية الإجرائية من 6 عوامل كامنة مستقلة عن الحقيقة الأساسية. هذه العوامل هي لون الأرضية ، ولون الجدار ، ولون الجسم ، والحجم ، والشكل ، والاتجاه .

جميع المجموعات الممكنة من هذه العناصر الكامنة موجودة مرة واحدة بالضبط، مما يؤدي إلى توليد N = 480000 إجمالي الصور.

قيم العوامل الكامنة

  • تدرج اللون الأرضي: 10 قيم متباعدة خطيًا في [0، 1]
  • تدرج لون الجدار: 10 قيم متباعدة خطيًا في [0، 1]
  • لون الكائن: 10 قيم متباعدة خطيًا في [0، 1]
  • المقياس: 8 قيم متباعدة خطيًا في [0، 1]
  • الشكل: 4 قيم في [0، 1، 2، 3]
  • الاتجاه: 15 قيمة متباعدة خطيًا في [-30، 30]

لقد قمنا بتنويع صورة كامنة واحدة في كل مرة (بدءًا من الاتجاه، ثم الشكل، وما إلى ذلك)، وقمنا بتخزين الصور بشكل تسلسلي بترتيب ثابت في مصفوفة images . يتم تخزين القيم المقابلة للعوامل بنفس الترتيب في مصفوفة labels .

ينقسم أمثلة
'train' 480.000
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (64، 64، 3) uint8
label_floor_hue ClassLabel int64
label_object_hue ClassLabel int64
label_orientation ClassLabel int64
label_scale ClassLabel int64
label_shape ClassLabel int64
label_wall_hue ClassLabel int64
value_floor_hue الموتر float32
value_object_hue الموتر float32
التوجه قيمة الموتر float32
value_scale الموتر float32
value_shape الموتر float32
value_wall_hue الموتر float32

التصور

  • الاقتباس :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}