- opis :
Zbiór danych opisany po raz pierwszy w sekcji „Obiekty 3D Stanforda” w artykule Disentangling by Subspace Diffusion . Dane składają się ze 100 000 renderowań każdego z obiektów Króliczka i Smoka z Repozytorium Skanowania 3D Stanforda . W przyszłości może zostać dodanych więcej obiektów, ale w artykule wykorzystano tylko Zajączka i Smoka. Każdy obiekt jest renderowany z jednolicie próbkowanym oświetleniem z punktu na 2-sferze i jednolicie próbkowanym obrotem 3D. Prawdziwe stany utajone są dostarczane jako tablice NumPy wraz z obrazami. Oświetlenie jest podane jako 3-wektor z normą jednostkową, podczas gdy obrót jest podany zarówno jako kwaterniona, jak i macierz ortogonalna 3x3.
Istnieje wiele podobieństw między S3O4D a istniejącymi zestawami danych porównawczych ML, takimi jak NORB , 3D Chairs , 3D Shapes i wiele innych, które obejmują również renderowanie zestawu obiektów w różnych pozach i warunkach oświetlenia. Jednak żaden z tych istniejących zestawów danych nie obejmuje pełnej różnorodności obrotów w 3D – większość zawiera tylko podzbiór zmian wysokości i azymutu. Obrazy S3O4D są próbkowane równomiernie i niezależnie od pełnej przestrzeni obrotów i oświetlenia, co oznacza, że zestaw danych zawiera obiekty, które są odwrócone i oświetlone od tyłu lub od dołu. Uważamy, że to sprawia, że S3O4D wyjątkowo nadaje się do badań nad modelami generatywnymi, w których ukryta przestrzeń ma nietrywialną topologię, a także do ogólnych metod uczenia rozmaitości, w których ważna jest krzywizna rozmaitości.
Strona główna : https://github.com/deepmind/deepmind-research/tree/master/geomancer#stanford-3d-objects-for-disentangling-s3o4d
Kod źródłowy :
tfds.image.s3o4d.S3O4D
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
911.68 MiB
Rozmiar zestawu danych :
1.01 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'bunny_test' | 20 000 |
'bunny_train' | 80 000 |
'dragon_test' | 20 000 |
'dragon_train' | 80 000 |
- Cechy :
FeaturesDict({
'illumination': Tensor(shape=(3,), dtype=tf.float32),
'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Cytat :
@article{pfau2020disentangling,
title={Disentangling by Subspace Diffusion},
author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
S{\'e}bastian},
journal={Advances in Neural Information Processing Systems (NeurIPS)},
year={2020}
}
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):