- คำอธิบาย :
dSprites คือชุดข้อมูลของรูปร่าง 2 มิติที่สร้างขึ้นตามขั้นตอนจากปัจจัยแฝงที่เป็นอิสระจากความจริงภาคพื้นดิน 6 ปัจจัย ปัจจัยเหล่านี้ ได้แก่ สี รูปร่าง ขนาด การหมุน ตำแหน่ง x และ y ของสไปรท์
การรวมกันที่เป็นไปได้ทั้งหมดของค่าแฝงเหล่านี้จะแสดงเพียงครั้งเดียว ทำให้เกิดภาพทั้งหมด N = 737280
ค่าปัจจัยแฝง
- สี: ขาว
- รูปร่าง: สี่เหลี่ยม วงรี หัวใจ
- สเกล: 6 ค่าโดยเว้นระยะห่างเชิงเส้นใน [0.5, 1]
- การวางแนว: 40 ค่าใน [0, 2 pi]
- ตำแหน่ง X: 32 ค่าใน [0, 1]
- ตำแหน่ง Y: 32 ค่าใน [0, 1]
เราเปลี่ยนแปลงค่าแฝงในแต่ละครั้ง (เริ่มจากตำแหน่ง Y จากนั้นตำแหน่ง X เป็นต้น) และจัดเก็บรูปภาพตามลำดับตามลำดับคงที่ ดังนั้นลำดับตามมิติแรกจึงได้รับการแก้ไข และช่วยให้คุณสามารถแมปกลับไปยังค่าของค่าแฝงที่สอดคล้องกับรูปภาพนั้นได้
เราเลือกค่าแฝงโดยเจตนาเพื่อให้มีการเปลี่ยนแปลงขั้นตอนที่น้อยที่สุด ในขณะเดียวกันก็ทำให้มั่นใจได้ว่าเอาต์พุตพิกเซลทั้งหมดจะแตกต่างกัน ไม่มีเสียงรบกวนเพิ่ม
เอกสารประกอบเพิ่มเติม : สำรวจในเอกสารด้วยรหัส
ซอร์สโค้ด :
tfds.datasets.dsprites.Builder
รุ่น :
-
2.0.0
(ค่าเริ่มต้น): API แยกใหม่ ( https://tensorflow.org/datasets/splits ) -
2.1.0
: ไม่มีบันทึกประจำรุ่น
-
ขนาดดาวน์โหลด :
26.73 MiB
ขนาดชุดข้อมูล :
Unknown size
แคชอัตโนมัติ ( เอกสาร ): ไม่ทราบ
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 737,280 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ภาพ | ภาพ | (64, 64, 1) | uint8 | |
label_orientation | ClassLabel | int64 | ||
label_scale | ClassLabel | int64 | ||
label_shape | ClassLabel | int64 | ||
label_x_position | ClassLabel | int64 | ||
label_y_position | ClassLabel | int64 | ||
ค่า_การวางแนว | เทนเซอร์ | ลอย32 | ||
ค่า_ขนาด | เทนเซอร์ | ลอย32 | ||
ค่า_รูปร่าง | เทนเซอร์ | ลอย32 | ||
ค่า_x_ตำแหน่ง | เทนเซอร์ | ลอย32 | ||
ค่า_y_ตำแหน่ง | เทนเซอร์ | ลอย32 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}