sol397

  • Descripción :

La base de datos contiene 108.753 imágenes de 397 categorías, utilizadas en el punto de referencia Scene UNderstanding (SUN). La cantidad de imágenes varía según las categorías, pero hay al menos 100 imágenes por categoría.

Varias configuraciones del conjunto de datos están disponibles a través de TFDS:

  • Una partición personalizada (aleatoria) de todo el conjunto de datos con 76.128 imágenes de entrenamiento, 10.875 imágenes de validación y 21.750 imágenes de prueba. Se ha cambiado el tamaño de las imágenes para que tengan un máximo de 120.000 píxeles y se han codificado como JPEG con una calidad de 72.

  • "standard-part1-120k", "standard-part2-120k", ..., "standard-part10-120k": cada una de las 10 particiones oficiales de entrenamiento/prueba con 50 imágenes por clase en cada división. Se ha cambiado el tamaño de las imágenes para que tengan un máximo de 120.000 píxeles y se han codificado como JPEG con una calidad de 72.

  • Documentación adicional : Explorar en artículos con código

  • Página de inicio : https://vision.princeton.edu/projects/2010/SUN/

  • Código fuente : tfds.datasets.sun397.Builder

  • Versiones :

    • 4.0.0 (predeterminado): sin notas de la versión.
  • Tamaño de descarga : 36.41 GiB

  • Tamaño del conjunto de datos : Unknown size

  • Almacenamiento en caché automático ( documentación ): Desconocido

  • Estructura de características :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=397),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
Nombre del archivo Texto cadena
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
@INPROCEEDINGS{Xiao:2010,
author={J. {Xiao} and J. {Hays} and K. A. {Ehinger} and A. {Oliva} and A. {Torralba} },
booktitle={2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
title={SUN database: Large-scale scene recognition from abbey to zoo},
year={2010},
volume={},
number={},
pages={3485-3492},
keywords={computer vision;human factors;image classification;object recognition;visual databases;SUN database;large-scale scene recognition;abbey;zoo;scene categorization;computer vision;scene understanding research;scene category;object categorization;scene understanding database;state-of-the-art algorithms;human scene classification performance;finer-grained scene representation;Sun;Large-scale systems;Layout;Humans;Image databases;Computer vision;Anthropometry;Bridges;Legged locomotion;Spatial databases},
doi={10.1109/CVPR.2010.5539970},
ISSN={1063-6919},
month={June},}

sun397/tfds (configuración predeterminada)

  • Descripción de la configuración : partición TFDS con divisiones aleatorias de tren/validación/prueba con el 70%/10%/20% de las imágenes, respectivamente. Las imágenes cambian de tamaño para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 21.750
'train' 76.128
'validation' 10.875

Visualización

sun397/estándar-parte1-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 1. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/estándar-parte2-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 2. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/estándar-parte3-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 3. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/estándar-parte4-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 4. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/estándar-parte5-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 5. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/estándar-parte6-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 6. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/parte-estándar7-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 7. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/estándar-part8-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 8. Las imágenes se redimensionan para tener como máximo 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/estándar-part9-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 9. Las imágenes se redimensionan para tener un máximo de 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización

sun397/parte-estándar10-120k

  • Descripción de la configuración : entrene y pruebe divisiones desde la partición oficial número 10. Las imágenes se redimensionan para tener como máximo 120.000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Dividir Ejemplos
'test' 19.850
'train' 19.850

Visualización