com.dsprites

  • وصف :

dSprites عبارة عن مجموعة بيانات من الأشكال ثنائية الأبعاد التي تم إنشاؤها من الناحية الإجرائية من 6 عوامل كامنة مستقلة عن الحقيقة الأساسية. هذه العوامل هي اللون والشكل والمقياس والدوران ومواضع x و y للكائن.

جميع المجموعات الممكنة من هذه العناصر الكامنة موجودة مرة واحدة بالضبط، مما يؤدي إلى توليد إجمالي N = 737280 صورة.

قيم العوامل الكامنة

  • اللون الابيض
  • الشكل: مربع، بيضاوي، قلب
  • المقياس: 6 قيم متباعدة خطيًا في [0.5، 1]
  • الاتجاه: 40 قيمة في [0، 2 بي]
  • الموضع X: 32 قيمة في [0، 1]
  • الموضع ص: 32 قيمة في [0، 1]

قمنا بتنويع صورة كامنة واحدة في كل مرة (بدءًا من الموضع Y، ثم الموضع X، وما إلى ذلك)، وقمنا بتخزين الصور بالتسلسل بترتيب ثابت. ومن ثم فإن الترتيب على طول البعد الأول ثابت ويسمح لك بالعودة إلى قيمة العناصر الكامنة المقابلة لتلك الصورة.

لقد اخترنا القيم الكامنة بشكل متعمد لإجراء أصغر التغييرات مع ضمان اختلاف جميع مخرجات البكسل. لم تتم إضافة أي ضجيج.

ينقسم أمثلة
'train' 737,280
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (64، 64، 1) uint8
label_orientation ClassLabel int64
label_scale ClassLabel int64
label_shape ClassLabel int64
label_x_position ClassLabel int64
label_y_position ClassLabel int64
التوجه قيمة الموتر float32
value_scale الموتر float32
value_shape الموتر float32
value_x_position الموتر float32
value_y_position الموتر float32

التصور

  • الاقتباس :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}