- Описание :
dSprites — это набор данных двумерных фигур, процедурно сгенерированных из шести независимых скрытых факторов. Этими факторами являются цвет , форма , масштаб , вращение , положения спрайта по осям x и y .
Все возможные комбинации этих латентных изображений присутствуют ровно один раз, что дает общее количество N = 737280 изображений.
Значения скрытого фактора
- Белый цвет
- Форма: квадрат, эллипс, сердце.
- Масштаб: 6 значений, линейно расположенных в [0,5, 1]
- Ориентация: 40 значений в [0, 2 pi]
- Позиция X: 32 значения в [0, 1]
- Позиция Y: 32 значения в [0, 1]
Мы меняли один латент за раз (начиная с позиции Y, затем позиции X и т. д.) и последовательно сохраняли изображения в фиксированном порядке. Следовательно, порядок по первому измерению фиксирован и позволяет вам сопоставить обратное значение скрытых значений, соответствующих этому изображению.
Мы намеренно выбрали скрытые значения, чтобы изменения были наименьшими, но при этом гарантировали, что все выходные данные пикселей будут разными. Никакого шума не добавилось.
Дополнительная документация : Изучите статьи с кодом
Домашняя страница : https://github.com/deepmind/dsprites-dataset .
Исходный код :
tfds.datasets.dsprites.Builder
Версии :
-
2.0.0
(по умолчанию): новый API разделения ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Нет примечаний к выпуску.
-
Размер загрузки :
26.73 MiB
Размер набора данных :
Unknown size
Автокэширование ( документация ): неизвестно.
Расколы :
Расколоть | Примеры |
---|---|
'train' | 737 280 |
- Структура функции :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Функциональная документация :
Особенность | Сорт | Форма | Дтип | Описание |
---|---|---|---|---|
ВозможностиDict | ||||
изображение | Изображение | (64, 64, 1) | uint8 | |
label_orientation | Класслейбл | int64 | ||
label_scale | Класслейбл | int64 | ||
label_shape | Класслейбл | int64 | ||
label_x_position | Класслейбл | int64 | ||
label_y_position | Класслейбл | int64 | ||
значение_ориентация | Тензор | поплавок32 | ||
шкала_значения | Тензор | поплавок32 | ||
value_shape | Тензор | поплавок32 | ||
value_x_position | Тензор | поплавок32 | ||
value_y_position | Тензор | поплавок32 |
Контролируемые ключи (см. документ
as_supervised
):None
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}