s3_o4_d
bookmark_border จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ

คำอธิบาย :

ชุดข้อมูลที่อธิบายไว้ในส่วน "Stanford 3D Objects" ของกระดาษ Disentangling by Subspace Diffusion ข้อมูลประกอบด้วยการเรนเดอร์ 100,000 ครั้งของวัตถุ Bunny และ Dragon จาก Stanford 3D Scanning Repository อาจมีการเพิ่มวัตถุอื่นๆ อีกในอนาคต แต่จะใช้เฉพาะกระต่ายกับมังกรเท่านั้นในกระดาษ วัตถุแต่ละชิ้นจะแสดงด้วยแสงตัวอย่างที่สม่ำเสมอจากจุดบน 2 ทรงกลม และการหมุน 3 มิติที่สุ่มตัวอย่างอย่างสม่ำเสมอ สถานะแฝงที่แท้จริงมีให้ในรูปแบบอาร์เรย์ NumPy พร้อมกับรูปภาพ การให้แสงเป็นเวกเตอร์ 3 ตัวพร้อมบรรทัดฐานหน่วย ในขณะที่การหมุนมีให้ทั้งแบบควอเทอร์เนียนและเมทริกซ์มุมฉาก 3x3

มีความคล้ายคลึงกันหลายอย่างระหว่าง S3O4D และชุดข้อมูลเกณฑ์มาตรฐาน ML ที่มีอยู่ เช่น NORB , เก้าอี้ 3 มิติ , รูปร่าง 3 มิติ และอื่นๆ อีกมากมาย ซึ่งรวมถึงการแสดงชุดของวัตถุภายใต้ท่าทางและสภาพแสงที่แตกต่างกัน อย่างไรก็ตาม ชุดข้อมูลที่มีอยู่เหล่านี้ไม่มีชุดการหมุนทั้งหมดในรูปแบบ 3 มิติ ส่วนใหญ่มีเพียงชุดย่อยของการเปลี่ยนแปลงระดับความสูงและแนวราบ ภาพ S3O4D ได้รับการสุ่มตัวอย่างอย่างสม่ำเสมอและเป็นอิสระจากพื้นที่เต็มของการหมุนและการส่องสว่าง หมายความว่าชุดข้อมูลประกอบด้วยวัตถุที่กลับหัวและส่องสว่างจากด้านหลังหรือด้านล่าง เราเชื่อว่าสิ่งนี้ทำให้ S3O4D เหมาะอย่างยิ่งสำหรับการวิจัยเกี่ยวกับแบบจำลองเชิงกำเนิดที่พื้นที่แฝงมีโทโพโลยีที่ไม่สำคัญ เช่นเดียวกับวิธีการเรียนรู้ที่หลากหลายทั่วไปที่ความโค้งของท่อร่วมมีความสำคัญ

หน้าแรก : https://github.com/deepmind/deepmind-research/tree/master/geomancer#stanford-3d-objects-for-disentangling-s3o4d
รหัสที่มา : tfds.image.s3o4d.S3O4D
รุ่น :
- 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
ขนาดการดาวน์โหลด : 911.68 MiB
ขนาดชุดข้อมูล : 1.01 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :

แยก	ตัวอย่าง
`'bunny_test'`	20,000
`'bunny_train'`	80,000
`'dragon_test'`	20,000
`'dragon_train'`	80,000

คุณสมบัติ :

FeaturesDict({
    'illumination': Tensor(shape=(3,), dtype=tf.float32),
    'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
    'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})

คีย์ภายใต้การดูแล (ดู as_supervised doc ): None
การอ้างอิง :

@article{pfau2020disentangling,
  title={Disentangling by Subspace Diffusion},
  author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
  S{\'e}bastian},
  journal={Advances in Neural Information Processing Systems (NeurIPS)},
  year={2020}
}

รูป ( tfds.show_examples ):

การสร้างภาพ

ตัวอย่าง ( tfds.as_dataframe ):