- 説明:
ImageNet-LT は、元の ImageNet ILSVRC 2012 データセットのサブセットです。トレーニング セットは、クラスごとの画像数がロングテール分布に従うようにサブサンプリングされます。画像の最大数を持つクラスには 1,280 の例が含まれますが、画像の最小数を持つクラスには 5 つの例しか含まれません。このデータセットには、ImageNet ILSVRC 2012 トレーニング セットのサブセットでもあり、クラスごとに 20 枚の画像を含む、バランスの取れた検証セットもあります。このデータセットのテスト セットは、元の ImageNet ILSVRC 2012 データセットの検証セットと同じです。
元の ImageNet ILSVRC 2012 データセットは手動でダウンロードする必要があり、このデータセットを生成するには、そのパスを --manual_dir で設定する必要があります。
追加のドキュメント:コード を使用したペーパーの探索
ホームページ: https://github.com/zhmiao/OpenLongTailRecognition-OLTR
ソース コード:
tfds.datasets.imagenet_lt.Builder
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
5.21 MiB
データセットサイズ:
20.92 GiB
手動ダウンロードの手順: このデータセットでは、ソース データを手動で
download_config.manual_dir
(デフォルトは~/tensorflow_datasets/downloads/manual/
) にダウンロードする必要があります。
manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするためのリンクを取得するには、 http://www.image-net.org/download-imagesに登録する必要があります。自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 50,000 |
'train' | 115,846 |
'validation' | 20,000 |
- 機能構造:
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ファイル名 | 文章 | ストリング | ||
画像 | 画像 | (なし、なし、3) | uint8 | |
ラベル | クラスラベル | int64 |
監視されたキー(
as_supervised
docを参照):('image', 'label')
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
\
@inproceedings{openlongtailrecognition,
title={Large-Scale Long-Tailed Recognition in an Open World},
author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2019},
url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}