- Descrizione :
Questo set di dati contiene immagini di convalida ILSVRC-2012 (ImageNet) aumentate con un nuovo set di etichette "Re-Assessed" (ReaL) dal documento "Are we done with ImageNet", vedere https://arxiv.org/abs/2006.07159 Questi le etichette vengono raccolte utilizzando il protocollo avanzato, risultando in annotazioni multi-etichetta e più accurate.
Nota importante: circa 3500 esempi non contengono etichetta, questi dovrebbero essere esclusi dalla media quando si calcola l'accuratezza . Un modo possibile per farlo è con il seguente codice NumPy:
is_correct = [pred in real_labels[i] for i, pred in enumerate(predictions) if real_labels[i]]
real_accuracy = np.mean(is_correct)
Home page : https://github.com/google-research/reassessed-imagenet
Codice sorgente :
tfds.datasets.imagenet2012_real.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale
-
Dimensione del download :
379.37 KiB
Dimensioni del set di dati :
6.25 GiB
Istruzioni per il download manuale : questo set di dati richiede il download manuale dei dati di origine in
download_config.manual_dir
(il valore predefinito è~/tensorflow_datasets/downloads/manual/
):
manual_dir deve contenere il fileILSVRC2012_img_val.tar
. È necessario registrarsi su http://www.image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'validation' | 50.000 |
- Struttura delle caratteristiche :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'original_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
'real_label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
nome del file | Testo | corda | ||
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
etichetta_originale | ClassLabel | int64 | ||
etichetta_real | Sequenza(ClassLabel) | (Nessuno,) | int64 |
Chiavi supervisionate (vedi il documento
as_supervised
):('image', 'real_label')
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@article{beyer2020imagenet,
title={Are we done with ImageNet?},
author={Lucas Beyer and Olivier J. Henaff and Alexander Kolesnikov and Xiaohua Zhai and Aaron van den Oord},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title={ {ImageNet Large Scale Visual Recognition Challenge} },
Year={2015},
journal={International Journal of Computer Vision (IJCV)},
doi={10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}