dsprites

  • विवरण :

dSprites 6 जमीनी सत्य स्वतंत्र अव्यक्त कारकों से प्रक्रियात्मक रूप से उत्पन्न 2D आकृतियों का एक डेटासेट है। ये कारक हैं रंग , आकार , स्केल , घुमाव , स्प्राइट की x और y स्थिति।

इन अव्यक्त तत्वों के सभी संभावित संयोजन ठीक एक बार मौजूद होते हैं, जिससे N = 737280 कुल छवियां उत्पन्न होती हैं।

अव्यक्त कारक मान

  • रंग सफेद
  • आकार: चौकोर, दीर्घवृत्त, हृदय
  • स्केल: 6 मान रैखिक रूप से दूरी पर हैं [0.5, 1]
  • अभिविन्यास: [0, 2 पीआई] में 40 मान
  • स्थिति X: [0, 1] में 32 मान
  • स्थिति Y: [0, 1] में 32 मान

हमने एक समय में एक अव्यक्त को अलग किया (स्थिति वाई से शुरू, फिर स्थिति एक्स, आदि), और क्रमिक रूप से छवियों को निश्चित क्रम में संग्रहीत किया। इसलिए पहले आयाम के साथ क्रम निश्चित है और आपको उस छवि के अनुरूप अव्यक्त मूल्य पर वापस मैप करने की अनुमति देता है।

हमने यह सुनिश्चित करते हुए कि सभी पिक्सेल आउटपुट अलग-अलग थे, जानबूझकर सबसे छोटे चरण में बदलाव के लिए अव्यक्त मानों को चुना। कोई शोर नहीं जोड़ा गया.

विभाजित करना उदाहरण
'train' 737,280
  • फ़ीचर संरचना :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
छवि छवि (64, 64, 1) uint8
लेबल_ओरिएंटेशन क्लास लेबल int64
लेबल_स्केल क्लास लेबल int64
लेबल_आकार क्लास लेबल int64
लेबल_x_स्थिति क्लास लेबल int64
लेबल_y_स्थिति क्लास लेबल int64
मूल्य_अभिविन्यास टेन्सर फ्लोट32
वैल्यू_स्केल टेन्सर फ्लोट32
मूल्य_आकार टेन्सर फ्लोट32
मूल्य_x_स्थिति टेन्सर फ्लोट32
value_y_position टेन्सर फ्लोट32

VISUALIZATION

  • उद्धरण :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}