cifar10_1

  • Descripción :

El conjunto de datos CIFAR-10.1 es un nuevo conjunto de pruebas para CIFAR-10. CIFAR-10.1 contiene aproximadamente 2000 nuevas imágenes de prueba que se tomaron como muestra después de varios años de investigación sobre el conjunto de datos original de CIFAR-10. La recopilación de datos para CIFAR-10.1 se diseñó para minimizar el cambio de distribución en relación con el conjunto de datos original. Describimos la creación de CIFAR-10.1 en el artículo "¿Se generalizan los clasificadores CIFAR-10 a CIFAR-10?". Las imágenes de CIFAR-10.1 son un subconjunto del conjunto de datos TinyImages. Actualmente existen dos versiones del conjunto de datos CIFAR-10.1: v4 y v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
imagen Imagen (32, 32, 3) uint8
etiqueta Etiqueta de clase int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (configuración predeterminada)

  • Descripción de la configuración : es la primera versión de nuestro conjunto de datos en la que probamos cualquier clasificador. Como se mencionó anteriormente, esto hace que el conjunto de datos v4 sea independiente de los clasificadores que evaluamos. Las cifras informadas en las secciones principales de nuestro artículo utilizan esta versión del conjunto de datos. Se creó a partir de las 25 palabras clave principales de TinyImages para cada clase, lo que provocó un ligero desequilibrio de clases. La mayor diferencia es que los barcos representan sólo el 8% del conjunto de pruebas en lugar del 10%. v4 contiene 2.021 imágenes.

  • Tamaño de descarga : 5.93 MiB

  • Tamaño del conjunto de datos : 4.46 MiB

  • Divisiones :

Dividir Ejemplos
'test' 2,021

Visualización

cifar10_1/v6

  • Descripción de la configuración : se deriva de una asignación de palabras clave ligeramente mejorada que tiene exactamente equilibrio de clases. Esta versión del conjunto de datos corresponde a los resultados del Apéndice D de nuestro artículo. v6 contiene 2000 imágenes.

  • Tamaño de descarga : 5.87 MiB

  • Tamaño del conjunto de datos : 4.40 MiB

  • Divisiones :

Dividir Ejemplos
'test' 2.000

Visualización