imagenet_lt

  • Descripción :

ImageNet-LT es un subconjunto del conjunto de datos original de ImageNet ILSVRC 2012. El conjunto de entrenamiento se submuestrea de manera que el número de imágenes por clase sigue una distribución de cola larga. La clase con el número máximo de imágenes contiene 1280 ejemplos, mientras que la clase con el número mínimo de imágenes contiene solo 5 ejemplos. El conjunto de datos también tiene un conjunto de validación balanceado, que también es un subconjunto del conjunto de entrenamiento ImageNet ILSVRC 2012 y contiene 20 imágenes por clase. El conjunto de prueba de este conjunto de datos es el mismo que el conjunto de validación del conjunto de datos original de ImageNet ILSVRC 2012.

El conjunto de datos original de ImageNet ILSVRC 2012 debe descargarse manualmente y su ruta debe configurarse con --manual_dir para generar este conjunto de datos.

Separar Ejemplos
'test' 50,000
'train' 115,846
'validation' 20,000
  • Estructura de características :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
Nombre del archivo Texto cuerda
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64

Visualización

  • Cita :
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}