- 説明:
Imagenet2012Subset は、元の ImageNet ILSVRC 2012 データセットのサブセットです。データセットは、元の ImageNet ILSVRC 2012 データセットと同じ検証セットを共有します。ただし、トレーニング セットはラベルのバランスを保った方法でサブサンプリングされます。 1pct
構成では、1%、つまり 12811 個のイメージがサンプリングされ、ほとんどのクラスは同じ数のイメージ (平均 12.8) を持ち、一部のクラスには他のクラスよりもランダムに 1 つ多いサンプルが含まれます。 10pct
構成 (~10%、つまり 128116) では、ほとんどのクラスに同じ数のイメージ (平均 128) があり、一部のクラスには他のクラスよりもランダムに 1 つ多いサンプルが含まれます。
これは半教師あり学習のベンチマークとして使用されることを想定しており、元々は SimCLR の論文 ( https://arxiv.org/abs/2002.05709 ) で使用されていました。
ホームページ: http://image-net.org/
バージョン:
-
2.0.0
: 検証ラベルを修正しました。 -
2.0.1
: エンコーディングを修正しました。ユーザーの観点からは何も変わりません。 3.0.0
: 〜 12 個の画像の色付けを修正 (CMYK -> RGB)。一貫性を保つために形式を修正しました (単一の PNG 画像を Jpeg に変換します)。アーカイブから直接生成を読み取る方が高速になります。4.0.0
: (未公開)5.0.0
(デフォルト): 新しい分割 API ( https://tensorflow.org/datasets/splits )5.1.0
: テスト分割を追加しました。
-
手動ダウンロード手順: このデータセットでは、ソース データを
download_config.manual_dir
に手動でダウンロードする必要があります (デフォルトは~/tensorflow_datasets/downloads/manual/
)。
Manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするリンクを取得するには、 https://image-net.org/download-imagesに登録する必要があります。自動キャッシュ(ドキュメント): いいえ
機能の構造:
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ファイル名 | 文章 | 弦 | ||
画像 | 画像 | (なし、なし、3) | uint8 | |
ラベル | クラスラベル | int64 |
監視キー(
as_supervised
doc を参照):('image', 'label')
引用:
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (デフォルト設定)
構成の説明: ImageNet トレーニング セット全体の 1 パーセント。
ダウンロードサイズ:
254.22 KiB
データセットのサイズ:
7.61 GiB
分割:
スプリット | 例 |
---|---|
'train' | 12,811 |
'validation' | 50,000 |
- 図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
imagenet2012_subset/10pct
構成の説明: ImageNet トレーニング セット全体の 10%。
ダウンロードサイズ:
2.48 MiB
データセットのサイズ:
19.91 GiB
分割:
スプリット | 例 |
---|---|
'train' | 128,116 |
'validation' | 50,000 |
- 図( tfds.show_examples ):
- 例( tfds.as_dataframe ):