open_images_challenge2019_detection

  • Descripción :

Open Images es una versión colaborativa de aproximadamente 9 millones de imágenes anotadas con etiquetas a nivel de imagen, cuadros delimitadores de objetos, máscaras de segmentación de objetos y relaciones visuales. Este conjunto de datos excepcionalmente grande y diverso está diseñado para impulsar avances de última generación en el análisis y la comprensión de imágenes.

Este contiene los datos de la pista de Detección de Objetos de la competencia. El objetivo de esta pista es predecir un cuadro delimitador ajustado alrededor de todas las instancias de objetos de 500 clases.

Las imágenes están anotadas con etiquetas positivas a nivel de imagen, que indican que ciertas clases de objetos están presentes, y con etiquetas negativas a nivel de imagen, que indican que ciertas clases están ausentes. En la competencia, todas las demás clases no anotadas quedan excluidas de la evaluación en esa imagen. Para cada etiqueta positiva a nivel de imagen en una imagen, se anotó cada instancia de esa clase de objeto en la imagen.

Dividir Ejemplos
'test' 99,999
'train' 1.743.042
'validation' 41.620
  • Estructura de características :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
objetos Secuencia
bobjects/bbox Característica BBox (4,) flotador32
bobjects/is_group_of Tensor booleano
objetos/etiqueta Etiqueta de clase int64
identificación Texto cadena
imagen Imagen (Ninguno, Ninguno, 3) uint8
objetos Secuencia
objetos/confianza Tensor flotador32
objetos/etiqueta Etiqueta de clase int64
objetos/fuente Texto cadena

open_images_challenge2019_detection/200k (configuración predeterminada)

  • Descripción de la configuración : las imágenes tienen como máximo 200.000 píxeles, con calidad 72 JPEG.

  • Tamaño del conjunto de datos : 59.06 GiB

  • Figura ( tfds.show_examples ):

Visualización

open_images_challenge2019_detection/300k

  • Descripción de la configuración : las imágenes tienen como máximo 300.000 píxeles, con calidad 72 JPEG.

  • Tamaño del conjunto de datos : 80.10 GiB

  • Figura ( tfds.show_examples ):

Visualización