- الوصف :
مجموعة البيانات التي تم وصفها لأول مرة في قسم "كائنات ستانفورد ثلاثية الأبعاد" من الورقة Disentangling by Subspace Diffusion . تتكون البيانات من 100000 عرض لكل من كائنات الأرنب والتنين من مستودع ستانفورد للمسح الضوئي ثلاثي الأبعاد . يمكن إضافة المزيد من العناصر في المستقبل ، ولكن يتم استخدام الأرنب والتنين فقط في الورق. يتم تقديم كل كائن بإضاءة ذات عينات موحدة من نقطة على 2-sphere ، ودوران ثلاثي الأبعاد بشكل موحد. يتم توفير الحالات الكامنة الحقيقية كمصفوفات NumPy جنبًا إلى جنب مع الصور. يتم إعطاء الإضاءة كمتجه ثلاثي مع معيار الوحدة ، بينما يتم توفير الدوران على شكل رباعي ومصفوفة متعامدة 3 × 3.
هناك العديد من أوجه التشابه بين S3O4D ومجموعات البيانات المعيارية الحالية لـ ML مثل NORB ، والكراسي ثلاثية الأبعاد ، والأشكال ثلاثية الأبعاد وغيرها الكثير ، والتي تتضمن أيضًا عروض لمجموعة من الكائنات في ظروف مختلفة وظروف الإضاءة. ومع ذلك ، لا تتضمن أي من مجموعات البيانات الحالية هذه المجموعة الكاملة من التدويرات ثلاثية الأبعاد - معظمها لا يتضمن سوى مجموعة فرعية من التغييرات في الارتفاع والسمت. يتم أخذ عينات من صور S3O4D بشكل موحد ومستقل عن المساحة الكاملة للتدوير والإضاءة ، مما يعني أن مجموعة البيانات تحتوي على كائنات مقلوبة ومضاءة من الخلف أو من أسفل. نعتقد أن هذا يجعل S3O4D مناسبًا بشكل فريد للبحث في النماذج التوليدية حيث يكون للفضاء الكامن طوبولوجيا غير تافهة ، وكذلك لطرق التعلم العامة المتنوعة حيث يكون انحناء المنوع مهمًا.
الصفحة الرئيسية : https://github.com/deepmind/deepmind-research/tree/master/geomancer#stanford-3d-objects-for-disentangling-s3o4d
كود المصدر :
tfds.image.s3o4d.S3O4D
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
911.68 MiB
حجم مجموعة البيانات :
1.01 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'bunny_test' | 20000 |
'bunny_train' | 80000 |
'dragon_test' | 20000 |
'dragon_train' | 80000 |
- الميزات :
FeaturesDict({
'illumination': Tensor(shape=(3,), dtype=tf.float32),
'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الاقتباس :
@article{pfau2020disentangling,
title={Disentangling by Subspace Diffusion},
author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
S{\'e}bastian},
journal={Advances in Neural Information Processing Systems (NeurIPS)},
year={2020}
}
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):