- Sự miêu tả :
3dshapes là tập dữ liệu gồm các hình dạng 3D được tạo theo thủ tục từ 6 yếu tố tiềm ẩn độc lập với sự thật cơ bản. Những yếu tố này là màu sàn , màu tường , màu vật thể , tỷ lệ , hình dạng và hướng .
Tất cả các kết hợp có thể có của các tiềm ẩn này xuất hiện chính xác một lần, tạo ra tổng số N = 480000 hình ảnh.
Giá trị yếu tố tiềm ẩn
- màu sàn: 10 giá trị cách đều nhau trong [0, 1]
- màu tường: 10 giá trị cách đều nhau trong [0, 1]
- đối tượng màu sắc: 10 giá trị cách đều nhau trong [0, 1]
- tỷ lệ: 8 giá trị cách đều nhau trong [0, 1]
- hình dạng: 4 giá trị trong [0, 1, 2, 3]
- hướng: 15 giá trị cách đều nhau trong [-30, 30]
Chúng tôi thay đổi từng mức tiềm ẩn một lần (bắt đầu từ hướng, sau đó là hình dạng, v.v.) và lưu trữ tuần tự các hình ảnh theo thứ tự cố định trong mảng images
. Các giá trị tương ứng của các thừa số được lưu trữ theo cùng thứ tự trong mảng labels
.
Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : https://github.com/deepmind/3d-shapes
Mã nguồn :
tfds.datasets.shapes3d.Builder
Phiên bản :
-
2.0.0
(mặc định): API phân chia mới ( https://tensorflow.org/datasets/splits )
-
Kích thước tải xuống :
255.18 MiB
Kích thước tập dữ liệu :
1.68 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 480.000 |
- Cấu trúc tính năng :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
hình ảnh | Hình ảnh | (64, 64, 3) | uint8 | |
nhãn_sàn_hue | Nhãn lớp | int64 | ||
nhãn_object_hue | Nhãn lớp | int64 | ||
nhãn_định hướng | Nhãn lớp | int64 | ||
nhãn_scale | Nhãn lớp | int64 | ||
nhãn_hình dạng | Nhãn lớp | int64 | ||
nhãn_wall_hue | Nhãn lớp | int64 | ||
value_floor_hue | Tenxơ | phao32 | ||
giá trị_object_hue | Tenxơ | phao32 | ||
giá trị_định hướng | Tenxơ | phao32 | ||
giá trị_scale | Tenxơ | phao32 | ||
giá trị_hình dạng | Tenxơ | phao32 | ||
value_wall_hue | Tenxơ | phao32 |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}