- Descrizione :
Imagenet2012Subset è un sottoinsieme del set di dati ImageNet ILSVRC 2012 originale. Il set di dati condivide lo stesso set di convalida del set di dati ImageNet ILSVRC 2012 originale. Tuttavia, il set di addestramento viene sottocampionato in modo bilanciato con l'etichetta. Nella configurazione 1pct
, vengono campionate 1% o 12811 immagini, la maggior parte delle classi ha lo stesso numero di immagini (in media 12,8), alcune classi hanno casualmente 1 esempio in più rispetto ad altre; e nella configurazione 10pct
, ~10%, o 128116, la maggior parte delle classi ha lo stesso numero di immagini (in media 128) e alcune classi hanno casualmente 1 esempio in più rispetto ad altre.
Questo dovrebbe essere utilizzato come punto di riferimento per l'apprendimento semi-supervisionato ed è stato originariamente utilizzato nel documento SimCLR ( https://arxiv.org/abs/2002.05709 ).
Pagina iniziale : http://image-net.org/
Codice sorgente :
tfds.datasets.imagenet2012_subset.Builder
Versioni :
-
2.0.0
: corrette le etichette di convalida. -
2.0.1
: correzione della codifica. Nessun cambiamento dal punto di vista dell'utente. 3.0.0
: corretta la colorazione su ~12 immagini (CMYK -> RGB). Correggi il formato per coerenza (converti la singola immagine PNG in Jpeg). Lettura di generazione più rapida direttamente dall'archivio.4.0.0
: (non pubblicato)5.0.0
(impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )5.1.0
: Aggiunta la suddivisione del test.
-
Istruzioni per il download manuale : questo set di dati richiede il download manuale dei dati di origine in
download_config.manual_dir
(il valore predefinito è~/tensorflow_datasets/downloads/manual/
):
manual_dir deve contenere due file: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. È necessario registrarsi su https://image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.Memorizzazione nella cache automatica ( documentazione ): No
Struttura delle caratteristiche :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
nome del file | Testo | corda | ||
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
etichetta | ClassLabel | int64 |
Chiavi supervisionate (vedi il documento
as_supervised
):('image', 'label')
Citazione :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (configurazione predefinita)
Descrizione della configurazione : 1% del set di training ImageNet totale.
Dimensione del download :
254.22 KiB
Dimensione del set di dati :
7.61 GiB
Divide :
Diviso | Esempi |
---|---|
'train' | 12.811 |
'validation' | 50.000 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
imagenet2012_subset/10pct
Descrizione della configurazione : 10% del set di training ImageNet totale.
Dimensione download :
2.48 MiB
Dimensione del set di dati :
19.91 GiB
Divide :
Diviso | Esempi |
---|---|
'train' | 128.116 |
'validation' | 50.000 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):