imagenet2012_fewshot

  • 説明:

Imagenet2012Fewshot は、元の ImageNet ILSVRC 2012 データセットのサブセットです。データセットは、元の ImageNet ILSVRC 2012 データセットと同じ検証セットを共有します。ただし、トレーニング セットはラベル バランス方式でサブサンプリングされます。 5shot構成では、ラベルごとに 5 つの画像、または 5000 の画像がサンプリングされます。 10shot構成では、ラベルごとに 10 枚の画像、つまり 10000 枚の画像がサンプリングされます。

  • ホームページ: http://image-net.org/

  • ソース コード: tfds.datasets.imagenet2012_fewshot.Builder

  • バージョン:

    • 2.0.0 : 検証ラベルを修正しました。
    • 2.0.1 : エンコーディングの修正。ユーザーの観点からは変更はありません。
    • 3.0.0 : 12 個までの画像のカラー化を修正 (CMYK -> RGB)。一貫性を保つために形式を修正します (単一の png 画像を Jpeg に変換します)。アーカイブから直接世代を読み取る高速化。

    • 4.0.0 : (非公開)

    • 5.0.0 : 新しい分割 API ( https://tensorflow.org/datasets/splits )

    • 5.0.1 (デフォルト): リリース ノートはありません。

    • 5.1.0 : テスト分割を追加。

  • ダウンロードサイズ: Unknown size

  • 手動ダウンロードの手順: このデータセットでは、ソース データを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするためのリンクを取得するには、 https://image-net.org/download-imagesに登録する必要があります。

  • 自動キャッシュ(ドキュメント): いいえ

  • 機能構造:

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファイル名文章ストリング
画像画像(なし、なし、3) uint8
ラベルクラスラベルint64
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_fewshot/1shot (デフォルト設定)

  • 構成の説明: ImageNet トレーニング セット全体の 1 ショット。

  • データセットサイズ: 6.46 GiB

  • スプリット:

スプリット
'train' 1,000
'tune' 1,000
'validation' 50,000

視覚化

imagenet2012_fewshot/5shot

  • 構成の説明: ImageNet トレーニング セット全体の 5 ショット。

  • データセットサイズ: 6.88 GiB

  • スプリット:

スプリット
'train' 5,000
'tune' 1,000
'validation' 50,000

視覚化

imagenet2012_fewshot/10shot

  • 構成の説明: 合計 ImageNet トレーニング セットの 10 ショット。

  • データセットサイズ: 7.42 GiB

  • スプリット:

スプリット
'train' 10,000
'tune' 1,000
'validation' 50,000

視覚化