- Descripción :
Imagenet2012Fewshot es un subconjunto del conjunto de datos original de ImageNet ILSVRC 2012. El conjunto de datos comparte el mismo conjunto de validación que el conjunto de datos original de ImageNet ILSVRC 2012. Sin embargo, el conjunto de entrenamiento se submuestrea de forma equilibrada por etiquetas. En la configuración 5shot
, se muestrean 5 imágenes por etiqueta o 5000 imágenes; y en la configuración 10shot
, se muestrean 10 imágenes por etiqueta o 10000 imágenes.
Página de inicio : http://image-net.org/
Código fuente :
tfds.datasets.imagenet2012_fewshot.Builder
Versiones :
-
2.0.0
: Corregir etiquetas de validación. -
2.0.1
: Corrección de codificación. Sin cambios desde el punto de vista del usuario. 3.0.0
: corrige la coloración en ~12 imágenes (CMYK -> RGB). Corrija el formato para mantener la coherencia (convierta la imagen png única a Jpeg). Lectura de generación más rápida directamente desde el archivo.4.0.0
: (inédito)5.0.0
: nueva API dividida ( https://tensorflow.org/datasets/splits )5.0.1
(predeterminado): Sin notas de la versión.5.1.0
: división de prueba agregada.
-
Tamaño de descarga :
Unknown size
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en https://image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.Almacenamiento automático en caché ( documentación ): No
Estructura de características :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
Nombre del archivo | Texto | cuerda | ||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
etiqueta | Etiqueta de clase | int64 |
Claves supervisadas (Ver como_documento
as_supervised
):('image', 'label')
Cita :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_fewshot/1shot (configuración predeterminada)
Descripción de la configuración : 1 disparo del conjunto total de entrenamiento de ImageNet.
Tamaño del conjunto de datos :
6.46 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,000 |
'tune' | 1,000 |
'validation' | 50,000 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
imagenet2012_fewshot/5shot
Descripción de la configuración : 5 tomas del conjunto total de entrenamiento de ImageNet.
Tamaño del conjunto de datos :
6.88 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,000 |
'tune' | 1,000 |
'validation' | 50,000 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
imagenet2012_pocasfotos/10fotos
Descripción de la configuración : 10 disparos del conjunto total de entrenamiento de ImageNet.
Tamaño del conjunto de datos :
7.42 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 10,000 |
'tune' | 1,000 |
'validation' | 50,000 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):