imagenet_lt

  • 説明:

ImageNet-LT は、元の ImageNet ILSVRC 2012 データセットのサブセットです。トレーニング セットは、クラスごとの画像数がロングテール分布に従うようにサブサンプリングされます。画像の最大数を持つクラスには 1,280 の例が含まれますが、画像の最小数を持つクラスには 5 つの例しか含まれません。このデータセットには、ImageNet ILSVRC 2012 トレーニング セットのサブセットでもあり、クラスごとに 20 枚の画像を含む、バランスの取れた検証セットもあります。このデータセットのテスト セットは、元の ImageNet ILSVRC 2012 データセットの検証セットと同じです。

元の ImageNet ILSVRC 2012 データセットは手動でダウンロードする必要があり、このデータセットを生成するには、そのパスを --manual_dir で設定する必要があります。

スプリット
'test' 50,000
'train' 115,846
'validation' 20,000
  • 機能構造:
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファイル名文章ストリング
画像画像(なし、なし、3) uint8
ラベルクラスラベルint64

視覚化

  • 引用
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}