- Descripción :
ImageNet-PI es una versión reetiquetada del conjunto de datos estándar ILSVRC2012 ImageNet en el que las etiquetas las proporciona una colección de 16 redes neuronales profundas con diferentes arquitecturas preentrenadas en el estándar ILSVRC2012. En concreto, los modelos preentrenados se descargan desde tf.keras.applications.
Además de las nuevas etiquetas, ImageNet-PI también proporciona metadatos sobre el proceso de anotación en forma de confianzas de los modelos en sus etiquetas e información adicional sobre cada modelo.
Para obtener más información, consulte: ImageNet-PI
Página de inicio : https://github.com/google-research-datasets/imagenet_pi/
Código fuente :
tfds.datasets.imagenet_pi.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de descarga :
Unknown size
Tamaño del conjunto de datos :
Unknown size
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en http://www.image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.Auto-caché ( documentación ): Desconocido
Divisiones :
Dividir | Ejemplos |
---|
- Estructura de características :
FeaturesDict({
'annotator_confidences': Tensor(shape=(16,), dtype=float32),
'annotator_labels': Tensor(shape=(16,), dtype=int64),
'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
})
- Documentación de características :
Característica | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
anotador_confidencias | Tensor | (dieciséis,) | flotar32 | |
anotador_etiquetas | Tensor | (dieciséis,) | int64 | |
etiqueta_limpia | Etiqueta de clase | int64 | ||
Nombre del archivo | Texto | cadena | ||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 |
Claves supervisadas (ver
as_supervised
doc ):('image', 'annotator_labels')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ): Falta.
Cita :
@inproceedings{tram,
author = {Mark Collier and
Rodolphe Jenatton and
Effrosyni Kokiopoulou and
Jesse Berent},
editor = {Kamalika Chaudhuri and
Stefanie Jegelka and
Le Song and
Csaba Szepesv{\'{a} }ri and
Gang Niu and
Sivan Sabato},
title = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
Information},
booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
2022, Baltimore, Maryland, {USA} },
series = {Proceedings of Machine Learning Research},
volume = {162},
pages = {4219--4237},
publisher = { {PMLR} },
year = {2022},
url = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
, - Descripción :
ImageNet-PI es una versión reetiquetada del conjunto de datos estándar ILSVRC2012 ImageNet en el que las etiquetas las proporciona una colección de 16 redes neuronales profundas con diferentes arquitecturas preentrenadas en el estándar ILSVRC2012. En concreto, los modelos preentrenados se descargan desde tf.keras.applications.
Además de las nuevas etiquetas, ImageNet-PI también proporciona metadatos sobre el proceso de anotación en forma de confianzas de los modelos en sus etiquetas e información adicional sobre cada modelo.
Para obtener más información, consulte: ImageNet-PI
Página de inicio : https://github.com/google-research-datasets/imagenet_pi/
Código fuente :
tfds.datasets.imagenet_pi.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de descarga :
Unknown size
Tamaño del conjunto de datos :
Unknown size
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en http://www.image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.Auto-caché ( documentación ): Desconocido
Divisiones :
Dividir | Ejemplos |
---|
- Estructura de características :
FeaturesDict({
'annotator_confidences': Tensor(shape=(16,), dtype=float32),
'annotator_labels': Tensor(shape=(16,), dtype=int64),
'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
})
- Documentación de características :
Característica | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
anotador_confidencias | Tensor | (dieciséis,) | flotar32 | |
anotador_etiquetas | Tensor | (dieciséis,) | int64 | |
etiqueta_limpia | Etiqueta de clase | int64 | ||
Nombre del archivo | Texto | cadena | ||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 |
Claves supervisadas (ver
as_supervised
doc ):('image', 'annotator_labels')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ): Falta.
Cita :
@inproceedings{tram,
author = {Mark Collier and
Rodolphe Jenatton and
Effrosyni Kokiopoulou and
Jesse Berent},
editor = {Kamalika Chaudhuri and
Stefanie Jegelka and
Le Song and
Csaba Szepesv{\'{a} }ri and
Gang Niu and
Sivan Sabato},
title = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
Information},
booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
2022, Baltimore, Maryland, {USA} },
series = {Proceedings of Machine Learning Research},
volume = {162},
pages = {4219--4237},
publisher = { {PMLR} },
year = {2022},
url = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}