imagenet_pi

  • Descripción :

ImageNet-PI es una versión reetiquetada del conjunto de datos estándar ILSVRC2012 ImageNet en el que las etiquetas las proporciona una colección de 16 redes neuronales profundas con diferentes arquitecturas preentrenadas en el estándar ILSVRC2012. En concreto, los modelos preentrenados se descargan desde tf.keras.applications.

Además de las nuevas etiquetas, ImageNet-PI también proporciona metadatos sobre el proceso de anotación en forma de confianzas de los modelos en sus etiquetas e información adicional sobre cada modelo.

Para obtener más información, consulte: ImageNet-PI

  • Página de inicio : https://github.com/google-research-datasets/imagenet_pi/

  • Código fuente : tfds.datasets.imagenet_pi.Builder

  • Versiones :

    • 1.0.0 (predeterminado): versión inicial.
  • Tamaño de descarga : Unknown size

  • Tamaño del conjunto de datos : Unknown size

  • Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en http://www.image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.

  • Auto-caché ( documentación ): Desconocido

  • Divisiones :

Dividir Ejemplos
  • Estructura de características :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Documentación de características :
Característica Clase Forma Tipo D Descripción
CaracterísticasDict
anotador_confidencias Tensor (dieciséis,) flotar32
anotador_etiquetas Tensor (dieciséis,) int64
etiqueta_limpia Etiqueta de clase int64
Nombre del archivo Texto cadena
imagen Imagen (Ninguno, Ninguno, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
,

  • Descripción :

ImageNet-PI es una versión reetiquetada del conjunto de datos estándar ILSVRC2012 ImageNet en el que las etiquetas las proporciona una colección de 16 redes neuronales profundas con diferentes arquitecturas preentrenadas en el estándar ILSVRC2012. En concreto, los modelos preentrenados se descargan desde tf.keras.applications.

Además de las nuevas etiquetas, ImageNet-PI también proporciona metadatos sobre el proceso de anotación en forma de confianzas de los modelos en sus etiquetas e información adicional sobre cada modelo.

Para obtener más información, consulte: ImageNet-PI

  • Página de inicio : https://github.com/google-research-datasets/imagenet_pi/

  • Código fuente : tfds.datasets.imagenet_pi.Builder

  • Versiones :

    • 1.0.0 (predeterminado): versión inicial.
  • Tamaño de descarga : Unknown size

  • Tamaño del conjunto de datos : Unknown size

  • Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en http://www.image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.

  • Auto-caché ( documentación ): Desconocido

  • Divisiones :

Dividir Ejemplos
  • Estructura de características :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Documentación de características :
Característica Clase Forma Tipo D Descripción
CaracterísticasDict
anotador_confidencias Tensor (dieciséis,) flotar32
anotador_etiquetas Tensor (dieciséis,) int64
etiqueta_limpia Etiqueta de clase int64
Nombre del archivo Texto cadena
imagen Imagen (Ninguno, Ninguno, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}