- وصف :
dSprites عبارة عن مجموعة بيانات من الأشكال ثنائية الأبعاد التي تم إنشاؤها من الناحية الإجرائية من 6 عوامل كامنة مستقلة عن الحقيقة الأساسية. هذه العوامل هي اللون والشكل والمقياس والدوران ومواضع x و y للكائن.
جميع المجموعات الممكنة من هذه العناصر الكامنة موجودة مرة واحدة بالضبط، مما يؤدي إلى توليد إجمالي N = 737280 صورة.
قيم العوامل الكامنة
- اللون الابيض
- الشكل: مربع، بيضاوي، قلب
- المقياس: 6 قيم متباعدة خطيًا في [0.5، 1]
- الاتجاه: 40 قيمة في [0، 2 بي]
- الموضع X: 32 قيمة في [0، 1]
- الموضع ص: 32 قيمة في [0، 1]
قمنا بتنويع صورة كامنة واحدة في كل مرة (بدءًا من الموضع Y، ثم الموضع X، وما إلى ذلك)، وقمنا بتخزين الصور بالتسلسل بترتيب ثابت. ومن ثم فإن الترتيب على طول البعد الأول ثابت ويسمح لك بالعودة إلى قيمة العناصر الكامنة المقابلة لتلك الصورة.
لقد اخترنا القيم الكامنة بشكل متعمد لإجراء أصغر التغييرات مع ضمان اختلاف جميع مخرجات البكسل. لم تتم إضافة أي ضجيج.
وثائق إضافية : استكشف الأوراق ذات الكود
الصفحة الرئيسية : https://github.com/deepmind/dsprites-dataset
كود المصدر :
tfds.datasets.dsprites.Builder
الإصدارات :
-
2.0.0
(افتراضي): واجهة برمجة تطبيقات مقسمة جديدة ( https://tensorflow.org/datasets/splits ) -
2.1.0
: لا توجد ملاحظات الإصدار.
-
حجم التحميل :
26.73 MiB
حجم مجموعة البيانات :
Unknown size
التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 737,280 |
- هيكل الميزة :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
صورة | صورة | (64، 64، 1) | uint8 | |
label_orientation | ClassLabel | int64 | ||
label_scale | ClassLabel | int64 | ||
label_shape | ClassLabel | int64 | ||
label_x_position | ClassLabel | int64 | ||
label_y_position | ClassLabel | int64 | ||
التوجه قيمة | الموتر | float32 | ||
value_scale | الموتر | float32 | ||
value_shape | الموتر | float32 | ||
value_x_position | الموتر | float32 | ||
value_y_position | الموتر | float32 |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}