sol397

La base de datos contiene 108.753 imágenes de 397 categorías, utilizadas en el benchmark Scene UNderstanding (SUN). El número de imágenes varía según las categorías, pero hay al menos 100 imágenes por categoría.

Varias configuraciones del conjunto de datos están disponibles a través de TFDS:

  • Una partición personalizada (aleatoria) de todo el conjunto de datos con 76 128 imágenes de entrenamiento, 10 875 imágenes de validación y 21 750 imágenes de prueba. Las imágenes se han redimensionado para tener un máximo de 120 000 píxeles y se han codificado como JPEG con una calidad de 72.

  • "standard-part1-120k", "standard-part2-120k", ..., "standard-part10-120k": cada una de las 10 particiones oficiales de tren/prueba con 50 imágenes por clase en cada división. Las imágenes se han redimensionado para tener un máximo de 120 000 píxeles y se han codificado como JPEG con una calidad de 72.

  • Documentación adicional : Explore en Papers With Code

  • Página de inicio: https://vision.princeton.edu/projects/2010/SUN/

  • Código fuente : tfds.datasets.sun397.Builder

  • Versiones :

    • 4.0.0 (predeterminado): Sin notas de la versión.
  • Tamaño de descarga : 36.41 GiB

  • Tamaño del conjunto de datos : Unknown size

  • Auto-caché ( documentación ): Desconocido

  • Estructura de características :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=397),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
nombre del archivo Texto cuerda
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
@INPROCEEDINGS{Xiao:2010,
author={J. {Xiao} and J. {Hays} and K. A. {Ehinger} and A. {Oliva} and A. {Torralba} },
booktitle={2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
title={SUN database: Large-scale scene recognition from abbey to zoo},
year={2010},
volume={},
number={},
pages={3485-3492},
keywords={computer vision;human factors;image classification;object recognition;visual databases;SUN database;large-scale scene recognition;abbey;zoo;scene categorization;computer vision;scene understanding research;scene category;object categorization;scene understanding database;state-of-the-art algorithms;human scene classification performance;finer-grained scene representation;Sun;Large-scale systems;Layout;Humans;Image databases;Computer vision;Anthropometry;Bridges;Legged locomotion;Spatial databases},
doi={10.1109/CVPR.2010.5539970},
ISSN={1063-6919},
month={June},}

sun397/tfds (configuración predeterminada)

  • Descripción de la configuración : partición TFDS con divisiones aleatorias de tren/validación/prueba con el 70 %/10 %/20 % de las imágenes, respectivamente. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 21,750
'train' 76,128
'validation' 10,875

Visualización

sun397/estándar-parte1-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 1. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte2-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 2. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte3-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 3. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte4-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 4. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte5-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 5. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte6-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 6. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte7-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 7. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte8-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 8. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte9-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 9. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización

sun397/estándar-parte10-120k

  • Descripción de la configuración : entrene y pruebe las divisiones desde la partición oficial número 10. Las imágenes se redimensionan para tener un máximo de 120 000 píxeles y se comprimen con calidad 72 JPEG.

  • Divisiones :

Separar Ejemplos
'test' 19,850
'train' 19,850

Visualización