- คำอธิบาย :
ชุดข้อมูลที่อธิบายไว้ในส่วน "Stanford 3D Objects" ของกระดาษ Disentangling by Subspace Diffusion ข้อมูลประกอบด้วยการเรนเดอร์ 100,000 ครั้งของวัตถุ Bunny และ Dragon จาก Stanford 3D Scanning Repository อาจมีการเพิ่มวัตถุอื่นๆ อีกในอนาคต แต่จะใช้เฉพาะกระต่ายกับมังกรเท่านั้นในกระดาษ วัตถุแต่ละชิ้นจะแสดงด้วยแสงตัวอย่างที่สม่ำเสมอจากจุดบน 2 ทรงกลม และการหมุน 3 มิติที่สุ่มตัวอย่างอย่างสม่ำเสมอ สถานะแฝงที่แท้จริงมีให้ในรูปแบบอาร์เรย์ NumPy พร้อมกับรูปภาพ การให้แสงเป็นเวกเตอร์ 3 ตัวพร้อมบรรทัดฐานหน่วย ในขณะที่การหมุนมีให้ทั้งแบบควอเทอร์เนียนและเมทริกซ์มุมฉาก 3x3
มีความคล้ายคลึงกันหลายอย่างระหว่าง S3O4D และชุดข้อมูลเกณฑ์มาตรฐาน ML ที่มีอยู่ เช่น NORB , เก้าอี้ 3 มิติ , รูปร่าง 3 มิติ และอื่นๆ อีกมากมาย ซึ่งรวมถึงการแสดงชุดของวัตถุภายใต้ท่าทางและสภาพแสงที่แตกต่างกัน อย่างไรก็ตาม ชุดข้อมูลที่มีอยู่เหล่านี้ไม่มีชุดการหมุนทั้งหมดในรูปแบบ 3 มิติ ส่วนใหญ่มีเพียงชุดย่อยของการเปลี่ยนแปลงระดับความสูงและแนวราบ ภาพ S3O4D ได้รับการสุ่มตัวอย่างอย่างสม่ำเสมอและเป็นอิสระจากพื้นที่เต็มของการหมุนและการส่องสว่าง หมายความว่าชุดข้อมูลประกอบด้วยวัตถุที่กลับหัวและส่องสว่างจากด้านหลังหรือด้านล่าง เราเชื่อว่าสิ่งนี้ทำให้ S3O4D เหมาะอย่างยิ่งสำหรับการวิจัยเกี่ยวกับแบบจำลองเชิงกำเนิดที่พื้นที่แฝงมีโทโพโลยีที่ไม่สำคัญ เช่นเดียวกับวิธีการเรียนรู้ที่หลากหลายทั่วไปที่ความโค้งของท่อร่วมมีความสำคัญ
รหัสที่มา :
tfds.image.s3o4d.S3O4D
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
911.68 MiB
ขนาดชุดข้อมูล :
1.01 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'bunny_test' | 20,000 |
'bunny_train' | 80,000 |
'dragon_test' | 20,000 |
'dragon_train' | 80,000 |
- คุณสมบัติ :
FeaturesDict({
'illumination': Tensor(shape=(3,), dtype=tf.float32),
'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
การอ้างอิง :
@article{pfau2020disentangling,
title={Disentangling by Subspace Diffusion},
author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
S{\'e}bastian},
journal={Advances in Neural Information Processing Systems (NeurIPS)},
year={2020}
}
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):