imagenet_v2

ImageNet-v2 es un conjunto de pruebas de ImageNet (10 por clase) recopilado siguiendo de cerca el protocolo de etiquetado original. Cada imagen ha sido etiquetada por al menos 10 trabajadores de MTurk, posiblemente más, y dependiendo de la estrategia utilizada para seleccionar qué imágenes incluir entre las 10 elegidas para la clase dada, hay tres versiones diferentes del conjunto de datos. Consulte la sección cuatro del documento para obtener más detalles sobre cómo se compilaron las diferentes variantes.

El espacio de la etiqueta es el mismo que el de ImageNet2012. Cada ejemplo se representa como un diccionario con las siguientes claves:

  • 'imagen': La imagen, un tensor (H, W, 3).
  • 'etiqueta': un número entero en el rango [0, 1000).
  • 'file_name': una picadura única que identifica el ejemplo dentro del conjunto de datos.

  • Página de inicio : https://github.com/modestyachts/ImageNetV2

  • Código fuente : tfds.datasets.imagenet_v2.Builder

  • Versiones :

    • 1.0.0 : Versión inicial.
    • 2.0.0 : Archivos actualizados.
    • 3.0.0 (predeterminado): Corrija el nombre del archivo, desde la ruta absoluta a la ruta relativa al directorio de datos, es decir: "class_id/filename.jpg".
    • 3.1.0 : Nuevas URL para recursos de Hugging Face.
  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Dividir Ejemplos
'test' 10,000
  • Estructura de características :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentación de características :
Característica Clase Forma Tipo D Descripción
CaracterísticasDict
Nombre del archivo Texto cadena
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
@inproceedings{recht2019imagenet,
  title={Do ImageNet Classifiers Generalize to ImageNet?},
  author={Recht, Benjamin and Roelofs, Rebecca and Schmidt, Ludwig and Shankar, Vaishaal},
  booktitle={International Conference on Machine Learning},
  pages={5389--5400},
  year={2019}
}

imagenet_v2/matched-frequency (configuración predeterminada)

  • Tamaño de descarga : 1.18 GiB

  • Tamaño del conjunto de datos : 1.16 GiB

  • Figura ( tfds.show_examples ):

Visualización

imagenet_v2/umbral-0.7

  • Tamaño de descarga : 1.16 GiB

  • Tamaño del conjunto de datos : 1.15 GiB

  • Figura ( tfds.show_examples ):

Visualización

imagenet_v2/topimages

  • Tamaño de descarga : 1.16 GiB

  • Tamaño del conjunto de datos : 1.14 GiB

  • Figura ( tfds.show_examples ):

Visualización