imagenet_v2

  • Descripción :

ImageNet-v2 es un conjunto de pruebas de ImageNet (10 por clase) recopilado siguiendo de cerca el protocolo de etiquetado original. Cada imagen ha sido etiquetada por al menos 10 trabajadores de MTurk, posiblemente más, y dependiendo de la estrategia utilizada para seleccionar qué imágenes incluir entre las 10 elegidas para la clase dada, hay tres versiones diferentes del conjunto de datos. Consulte la sección cuatro del documento para obtener más detalles sobre cómo se compilaron las diferentes variantes.

El espacio de etiquetas es el mismo que el de ImageNet2012. Cada ejemplo se representa como un diccionario con las siguientes claves:

  • 'imagen': La imagen, un tensor (H, W, 3).
  • 'etiqueta': un número entero en el rango [0, 1000).
  • 'nombre_archivo': un código único que identifica el ejemplo dentro del conjunto de datos.

  • Página de inicio : https://github.com/modestyachts/ImageNetV2

  • Código fuente : tfds.datasets.imagenet_v2.Builder

  • Versiones :

    • 1.0.0 : Versión inicial.
    • 2.0.0 : Archivos actualizados.
    • 3.0.0 (predeterminado): corrige el nombre del archivo, de la ruta absoluta a la ruta relativa al directorio de datos, es decir: "class_id/filename.jpg".
    • 3.1.0 : Nuevas URL para recursos de Hugging Face.
  • Almacenamiento en caché automático ( documentación ): No

  • Divisiones :

Dividir Ejemplos
'test' 10.000
  • Estructura de características :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
Nombre del archivo Texto cadena
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
@inproceedings{recht2019imagenet,
  title={Do ImageNet Classifiers Generalize to ImageNet?},
  author={Recht, Benjamin and Roelofs, Rebecca and Schmidt, Ludwig and Shankar, Vaishaal},
  booktitle={International Conference on Machine Learning},
  pages={5389--5400},
  year={2019}
}

imagenet_v2/matched-frequency (configuración predeterminada)

  • Tamaño de descarga : 1.18 GiB

  • Tamaño del conjunto de datos : 1.16 GiB

  • Figura ( tfds.show_examples ):

Visualización

imagenet_v2/umbral-0.7

  • Tamaño de descarga : 1.16 GiB

  • Tamaño del conjunto de datos : 1.15 GiB

  • Figura ( tfds.show_examples ):

Visualización

imagenet_v2/topimages

  • Tamaño de descarga : 1.16 GiB

  • Tamaño del conjunto de datos : 1.14 GiB

  • Figura ( tfds.show_examples ):

Visualización