imagenet2012_subset

  • Descrizione :

Imagenet2012Subset è un sottoinsieme del set di dati ImageNet ILSVRC 2012 originale. Il set di dati condivide lo stesso set di convalida del set di dati ImageNet ILSVRC 2012 originale. Tuttavia, il set di addestramento viene sottocampionato in modo bilanciato con l'etichetta. Nella configurazione 1pct , vengono campionate 1% o 12811 immagini, la maggior parte delle classi ha lo stesso numero di immagini (in media 12,8), alcune classi hanno casualmente 1 esempio in più rispetto ad altre; e nella configurazione 10pct , ~10%, o 128116, la maggior parte delle classi ha lo stesso numero di immagini (in media 128) e alcune classi hanno casualmente 1 esempio in più rispetto ad altre.

Questo dovrebbe essere utilizzato come punto di riferimento per l'apprendimento semi-supervisionato ed è stato originariamente utilizzato nel documento SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Pagina iniziale : http://image-net.org/

  • Codice sorgente : tfds.datasets.imagenet2012_subset.Builder

  • Versioni :

    • 2.0.0 : corrette le etichette di convalida.
    • 2.0.1 : correzione della codifica. Nessun cambiamento dal punto di vista dell'utente.
    • 3.0.0 : corretta la colorazione su ~12 immagini (CMYK -> RGB). Correggi il formato per coerenza (converti la singola immagine PNG in Jpeg). Lettura di generazione più rapida direttamente dall'archivio.

    • 4.0.0 : (non pubblicato)

    • 5.0.0 (impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Aggiunta la suddivisione del test.

  • Istruzioni per il download manuale : questo set di dati richiede il download manuale dei dati di origine in download_config.manual_dir (il valore predefinito è ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir deve contenere due file: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. È necessario registrarsi su https://image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.

  • Memorizzazione nella cache automatica ( documentazione ): No

  • Struttura delle caratteristiche :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
nome del file Testo corda
Immagine Immagine (Nessuno, Nessuno, 3) uint8
etichetta ClassLabel int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (configurazione predefinita)

  • Descrizione della configurazione : 1% del set di training ImageNet totale.

  • Dimensione del download : 254.22 KiB

  • Dimensione del set di dati : 7.61 GiB

  • Divide :

Diviso Esempi
'train' 12.811
'validation' 50.000

Visualizzazione

imagenet2012_subset/10pct

  • Descrizione della configurazione : 10% del set di training ImageNet totale.

  • Dimensione download : 2.48 MiB

  • Dimensione del set di dati : 19.91 GiB

  • Divide :

Diviso Esempi
'train' 128.116
'validation' 50.000

Visualizzazione