Visualización : Explore en Know Your Data
Descripción :
3dshapes es un conjunto de datos de formas 3D generadas por procedimientos a partir de 6 factores latentes independientes de la realidad del terreno. Estos factores son el color del suelo, el color de la pared, el color del objeto , la escala , la forma y la orientación .
Todas las combinaciones posibles de estas latentes están presentes exactamente una vez, generando N = 480000 imágenes totales.
Valores de factores latentes
- tono de piso: 10 valores espaciados linealmente en [0, 1]
- tono de pared: 10 valores espaciados linealmente en [0, 1]
- tono del objeto: 10 valores espaciados linealmente en [0, 1]
- escala: 8 valores espaciados linealmente en [0, 1]
- forma: 4 valores en [0, 1, 2, 3]
- orientación: 15 valores espaciados linealmente en [-30, 30]
Variamos una latente a la vez (empezando por la orientación, luego la forma, etc.) y almacenamos secuencialmente las imágenes en un orden fijo en la matriz de images
. Los valores correspondientes de los factores se almacenan en el mismo orden en la matriz de labels
.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/deepmind/3d-shapes
Código fuente :
tfds.datasets.shapes3d.Builder
Versiones :
-
2.0.0
(predeterminado): nueva API dividida ( https://tensorflow.org/datasets/splits )
-
Tamaño de la descarga :
255.18 MiB
Tamaño del conjunto de datos :
1.68 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 480.000 |
- Estructura de características :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
imagen | Imagen | (64, 64, 3) | uint8 | |
etiqueta_piso_tono | Etiqueta de clase | int64 | ||
etiqueta_objeto_tono | Etiqueta de clase | int64 | ||
etiqueta_orientación | Etiqueta de clase | int64 | ||
etiqueta_escala | Etiqueta de clase | int64 | ||
etiqueta_forma | Etiqueta de clase | int64 | ||
etiqueta_pared_hue | Etiqueta de clase | int64 | ||
valor_piso_tono | Tensor | flotar32 | ||
valor_objeto_tono | Tensor | flotar32 | ||
orientación de valores | Tensor | flotar32 | ||
valor_escala | Tensor | flotar32 | ||
valor_forma | Tensor | flotar32 | ||
valor_pared_tono | Tensor | flotar32 |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}