- 説明:
このデータベースは、形状からの三次元物体認識の実験を目的としています。これには、4 本足の動物、人物、飛行機、トラック、車の 5 つの一般的なカテゴリに属する 50 個のおもちゃの画像が含まれています。対象物は、6 つの照明条件、9 つの仰角 (5 度ごとに 30 ~ 70 度)、および 18 の方位角 (20 度ごとに 0 ~ 340 度) の下で 2 台のカメラで撮影されました。
トレーニング セットは、各カテゴリの 5 つのインスタンス (インスタンス 4、6、7、8、および 9) と、残りの 5 つのインスタンス (インスタンス 0、1、2、3、および 5) のテスト セットで構成されます。
追加ドキュメント:コード付きの論文について調べる
ソースコード:
tfds.datasets.smallnorb.Builder
バージョン:
-
2.0.0
(デフォルト): 新しい分割 API ( https://tensorflow.org/datasets/splits ) -
2.1.0
: リリースノートはありません。
-
ダウンロードサイズ:
250.60 MiB
データセットのサイズ:
Unknown size
自動キャッシュ(ドキュメント): 不明
分割:
スプリット | 例 |
---|---|
'test' | 24,300 |
'train' | 24,300 |
- 機能の構造:
FeaturesDict({
'image': Image(shape=(96, 96, 1), dtype=uint8),
'image2': Image(shape=(96, 96, 1), dtype=uint8),
'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
画像 | 画像 | (96、96、1) | uint8 | |
画像2 | 画像 | (96、96、1) | uint8 | |
実例 | クラスラベル | int64 | ||
ラベルの方位角 | クラスラベル | int64 | ||
ラベルカテゴリー | クラスラベル | int64 | ||
ラベル_標高 | クラスラベル | int64 | ||
ラベル_照明 | クラスラベル | int64 |
監視キー(
as_supervised
docを参照):('image', 'label_category')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@article{LeCun2004LearningMF,
title={Learning methods for generic object recognition with invariance to pose and lighting},
author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
year={2004},
volume={2},
pages={II-104 Vol.2}
}