- Descriptif :
Imagenet2012Fewshot est un sous-ensemble de l'ensemble de données original ImageNet ILSVRC 2012. Le jeu de données partage le même jeu de validation que le jeu de données ImageNet ILSVRC 2012 d'origine. Cependant, l'ensemble d'apprentissage est sous-échantillonné de manière équilibrée par étiquette. Dans la configuration 5shot
, 5 images par étiquette ou 5000 images sont échantillonnées ; et dans la configuration 10shot
, 10 images par étiquette ou 10 000 images sont échantillonnées.
Page d'accueil : http://image-net.org/
Code source :
tfds.datasets.imagenet2012_fewshot.Builder
Versions :
-
2.0.0
: Correction des étiquettes de validation. -
2.0.1
: Correction de l'encodage. Aucun changement du point de vue de l'utilisateur. 3.0.0
: Correction de la colorisation sur ~12 images (CMJN -> RVB). Correction du format pour plus de cohérence (convertir l'image png unique en Jpeg). Génération plus rapide en lisant directement à partir de l'archive.4.0.0
: (inédit)5.0.0
: Nouvelle API fractionnée ( https://tensorflow.org/datasets/splits )5.0.1
(par défaut) : aucune note de version.5.1.0
: Ajout de la division de test.
-
Taille du téléchargement :
Unknown size
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données source dans
download_config.manual_dir
(par défaut,~/tensorflow_datasets/downloads/manual/
) :
manual_dir doit contenir deux fichiers : ILSVRC2012_img_train.tar et ILSVRC2012_img_val.tar. Vous devez vous inscrire sur https://image-net.org/download-images afin d'obtenir le lien pour télécharger l'ensemble de données.Mise en cache automatique ( documentation ): Non
Structure des fonctionnalités :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
nom de fichier | Texte | chaîne de caractères | ||
image | Image | (Aucun, Aucun, 3) | uint8 | |
étiquette | Étiquette de classe | int64 |
Clés supervisées (Voir
as_supervised
doc ):('image', 'label')
Citation :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_fewshot/1shot (configuration par défaut)
Description de la configuration : 1 coup de l'ensemble de formation ImageNet total.
Taille du jeu de données :
6.46 GiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
'tune' | 1 000 |
'validation' | 50 000 |
- Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
imagenet2012_fewshot/5shot
Description de la configuration : 5 coups de l'ensemble de formation ImageNet total.
Taille du jeu de données :
6.88 GiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 5 000 |
'tune' | 1 000 |
'validation' | 50 000 |
- Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
imagenet2012_fewshot/10shot
Description de la configuration : 10 coups de l'ensemble de formation ImageNet total.
Taille du jeu de données :
7.42 GiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 10 000 |
'tune' | 1 000 |
'validation' | 50 000 |
- Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):