- Descriptif :
ImageNet-LT est un sous-ensemble de l'ensemble de données original ImageNet ILSVRC 2012. L'ensemble d'apprentissage est sous-échantillonné de sorte que le nombre d'images par classe suive une distribution à longue queue. La classe avec le nombre maximum d'images contient 1 280 exemples, alors que la classe avec le nombre minimum d'images ne contient que 5 exemples. L'ensemble de données comporte également un ensemble de validation équilibré, qui est également un sous-ensemble de l'ensemble de formation ImageNet ILSVRC 2012 et contient 20 images par classe. L'ensemble de test de cet ensemble de données est le même que l'ensemble de validation de l'ensemble de données original ImageNet ILSVRC 2012.
Le jeu de données ImageNet ILSVRC 2012 d'origine doit être téléchargé manuellement et son chemin doit être défini avec --manual_dir afin de générer ce jeu de données.
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : https://github.com/zhmiao/OpenLongTailRecognition-OLTR
Code source :
tfds.datasets.imagenet_lt.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
5.21 MiB
Taille du jeu de données :
20.92 GiB
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans
download_config.manual_dir
(par défaut,~/tensorflow_datasets/downloads/manual/
) :
manual_dir doit contenir deux fichiers : ILSVRC2012_img_train.tar et ILSVRC2012_img_val.tar. Vous devez vous inscrire sur http://www.image-net.org/download-images afin d'obtenir le lien pour télécharger l'ensemble de données.Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 50 000 |
'train' | 115 846 |
'validation' | 20 000 |
- Structure des fonctionnalités :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
nom de fichier | Texte | chaîne de caractères | ||
image | Image | (Aucun, Aucun, 3) | uint8 | |
étiquette | Étiquette de classe | int64 |
Clés supervisées (Voir
as_supervised
doc ):('image', 'label')
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
- Citation :
\
@inproceedings{openlongtailrecognition,
title={Large-Scale Long-Tailed Recognition in an Open World},
author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2019},
url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}