imagenet_lt

  • Descriptif :

ImageNet-LT est un sous-ensemble de l'ensemble de données original ImageNet ILSVRC 2012. L'ensemble d'apprentissage est sous-échantillonné de sorte que le nombre d'images par classe suive une distribution à longue queue. La classe avec le nombre maximum d'images contient 1 280 exemples, alors que la classe avec le nombre minimum d'images ne contient que 5 exemples. L'ensemble de données comporte également un ensemble de validation équilibré, qui est également un sous-ensemble de l'ensemble de formation ImageNet ILSVRC 2012 et contient 20 images par classe. L'ensemble de test de cet ensemble de données est le même que l'ensemble de validation de l'ensemble de données original ImageNet ILSVRC 2012.

Le jeu de données ImageNet ILSVRC 2012 d'origine doit être téléchargé manuellement et son chemin doit être défini avec --manual_dir afin de générer ce jeu de données.

Diviser Exemples
'test' 50 000
'train' 115 846
'validation' 20 000
  • Structure des fonctionnalités :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
nom de fichier Texte chaîne de caractères
image Image (Aucun, Aucun, 3) uint8
étiquette Étiquette de classe int64

Visualisation

  • Citation :
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}