- תיאור :
מערך הנתונים המתואר לראשונה בסעיף "אובייקטים תלת מימדיים של סטנפורד" במאמר Disentangling by Subspace Diffusion . הנתונים מורכבים מ-100,000 עיבודים של כל אחד מהאובייקטים של באני ודרקון ממאגר הסריקה התלת-ממדית של סטנפורד . ייתכן שעוד חפצים יתווספו בעתיד, אבל רק הארנב והדרקון משמשים בנייר. כל אובייקט מוצג עם תאורה מדוגמת אחידה מנקודה על 2-הכדור, וסיבוב תלת מימדי מדוגם אחיד. המצבים הסמויים האמיתיים מסופקים כמערכי NumPy יחד עם התמונות. התאורה ניתנת כ-3 וקטור עם נורמה יחידה, בעוד שהסיבוב מסופק הן כקווטרניון והן כמטריצה אורתוגונלית 3x3.
יש קווי דמיון רבים בין S3O4D לבין מערכי נתונים קיימים של ML benchmark כמו NORB , 3D Chairs , 3D Shapes ורבים אחרים, הכוללים גם עיבודים של קבוצה של אובייקטים בתנאי תנוחה והארה שונים. עם זאת, אף אחד ממערכי הנתונים הקיימים הללו לא כולל את מגוון הסיבובים המלא בתלת-ממד - רובם כוללים רק תת-קבוצה של שינויים בגובה ובאזימוט. תמונות S3O4D נדגמות באופן אחיד ובלתי תלוי מהמרחב המלא של סיבובים והארות, כלומר מערך הנתונים מכיל אובייקטים הפוכים ומוארים מאחור או מתחת. אנו מאמינים שזה הופך את S3O4D למתאים באופן ייחודי למחקר על מודלים גנרטיביים שבהם למרחב הסמוי יש טופולוגיה לא טריוויאלית, כמו גם לשיטות למידה מגוונות כלליות שבהן העקמומיות של הסעפת חשובה.
תיעוד נוסף : חקור על ניירות עם קוד
קוד מקור :
tfds.datasets.s3o4d.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
911.68 MiB
גודל מערך נתונים :
1.01 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'bunny_test' | 20,000 |
'bunny_train' | 80,000 |
'dragon_test' | 20,000 |
'dragon_train' | 80,000 |
- מבנה תכונה :
FeaturesDict({
'illumination': Tensor(shape=(3,), dtype=float32),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'pose_mat': Tensor(shape=(3, 3), dtype=float32),
'pose_quat': Tensor(shape=(4,), dtype=float32),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תְאוּרָה | מוֹתֵחַ | (3,) | לצוף32 | |
תמונה | תמונה | (256, 256, 3) | uint8 | |
תווית | ClassLabel | int64 | ||
מחצלת_פוזה | מוֹתֵחַ | (3, 3) | לצוף32 | |
pose_quat | מוֹתֵחַ | (4,) | לצוף32 |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{pfau2020disentangling,
title={Disentangling by Subspace Diffusion},
author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
S{\'e}bastian},
journal={Advances in Neural Information Processing Systems (NeurIPS)},
year={2020}
}