サン397

  • 説明

データベースには、Scene UNderstanding (SUN) ベンチマークで使用される、397 カテゴリの 108,753 枚の画像が含まれています。画像の数はカテゴリによって異なりますが、カテゴリごとに少なくとも 100 枚の画像があります。

データセットのいくつかの構成は、TFDS を通じて利用可能です。

  • 76,128 個のトレーニング画像、10,875 個の検証画像、21,750 個のテスト画像を含むデータセット全体のカスタム (ランダム) パーティション。画像は最大 120,000 ピクセルにサイズ変更され、品質 72 の JPEG としてエンコードされています。

  • "standard-part1-120k"、"standard-part2-120k"、...、"standard-part10-120k": 10 個の公式トレーニング/テスト パーティションのそれぞれに、各スプリットのクラスごとに 50 個のイメージが含まれます。画像は最大 120,000 ピクセルにサイズ変更され、品質 72 の JPEG としてエンコードされています。

  • 追加ドキュメント:コード付きの論文について調べる

  • ホームページ: https://vision.princeton.edu/projects/2010/SUN/

  • ソースコード: tfds.datasets.sun397.Builder

  • バージョン:

    • 4.0.0 (デフォルト): リリース ノートはありません。
  • ダウンロードサイズ: 36.41 GiB

  • データセットのサイズ: Unknown size

  • 自動キャッシュ(ドキュメント): 不明

  • 機能の構造:

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=397),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
ファイル名文章
画像画像(なし、なし、3) uint8
ラベルクラスラベルint64
@INPROCEEDINGS{Xiao:2010,
author={J. {Xiao} and J. {Hays} and K. A. {Ehinger} and A. {Oliva} and A. {Torralba} },
booktitle={2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
title={SUN database: Large-scale scene recognition from abbey to zoo},
year={2010},
volume={},
number={},
pages={3485-3492},
keywords={computer vision;human factors;image classification;object recognition;visual databases;SUN database;large-scale scene recognition;abbey;zoo;scene categorization;computer vision;scene understanding research;scene category;object categorization;scene understanding database;state-of-the-art algorithms;human scene classification performance;finer-grained scene representation;Sun;Large-scale systems;Layout;Humans;Image databases;Computer vision;Anthropometry;Bridges;Legged locomotion;Spatial databases},
doi={10.1109/CVPR.2010.5539970},
ISSN={1063-6919},
month={June},}

sun397/tfds (デフォルト構成)

  • 構成の説明: イメージのそれぞれ 70%/10%/20% を含むランダムなトレーニング/検証/テスト分割を含む TFDS パーティション。画像は最大 120,000 ピクセルにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 21,750
'train' 76,128
'validation' 10,875

視覚化

sun397/standard-part1-120k

  • 構成の説明: 公式パーティション番号 1 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part2-120k

  • 構成の説明: 公式パーティション番号 2 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part3-120k

  • 構成の説明: 公式パーティション番号 3 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part4-120k

  • 構成の説明: 公式パーティション番号 4 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part5-120k

  • 構成の説明: 公式パーティション番号 5 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part6-120k

  • 構成の説明: 公式パーティション番号 6 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part7-120k

  • 構成の説明: 公式パーティション番号 7 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part8-120k

  • 構成の説明: 公式パーティション番号 8 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part9-120k

  • 構成の説明: 公式パーティション番号 9 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part10-120k

  • 構成の説明: 公式パーティション番号 10 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • 分割:

スプリット
'test' 19,850
'train' 19,850

視覚化