- Descripción :
ImageNet-LT es un subconjunto del conjunto de datos original de ImageNet ILSVRC 2012. El conjunto de entrenamiento se submuestrea de manera que el número de imágenes por clase sigue una distribución de cola larga. La clase con el número máximo de imágenes contiene 1280 ejemplos, mientras que la clase con el número mínimo de imágenes contiene solo 5 ejemplos. El conjunto de datos también tiene un conjunto de validación balanceado, que también es un subconjunto del conjunto de entrenamiento ImageNet ILSVRC 2012 y contiene 20 imágenes por clase. El conjunto de prueba de este conjunto de datos es el mismo que el conjunto de validación del conjunto de datos original de ImageNet ILSVRC 2012.
El conjunto de datos original de ImageNet ILSVRC 2012 debe descargarse manualmente y su ruta debe configurarse con --manual_dir para generar este conjunto de datos.
Documentación adicional : Explore en Papers With Code
Página de inicio : https://github.com/zhmiao/OpenLongTailRecognition-OLTR
Código fuente :
tfds.datasets.imagenet_lt.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de la descarga :
5.21 MiB
Tamaño del conjunto de datos :
20.92 GiB
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en http://www.image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 50,000 |
'train' | 115,846 |
'validation' | 20,000 |
- Estructura de características :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
Nombre del archivo | Texto | cuerda | ||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
etiqueta | Etiqueta de clase | int64 |
Claves supervisadas (Ver como_documento
as_supervised
):('image', 'label')
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
\
@inproceedings{openlongtailrecognition,
title={Large-Scale Long-Tailed Recognition in an Open World},
author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2019},
url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}