- Descripción :
Open Images es una versión colaborativa de aproximadamente 9 millones de imágenes anotadas con etiquetas a nivel de imagen, cuadros delimitadores de objetos, máscaras de segmentación de objetos y relaciones visuales. Este conjunto de datos excepcionalmente grande y diverso está diseñado para impulsar avances de última generación en el análisis y la comprensión de imágenes.
Este contiene los datos de la pista de Detección de Objetos de la competencia. El objetivo de esta pista es predecir un cuadro delimitador ajustado alrededor de todas las instancias de objetos de 500 clases.
Las imágenes están anotadas con etiquetas positivas a nivel de imagen, que indican que ciertas clases de objetos están presentes, y con etiquetas negativas a nivel de imagen, que indican que ciertas clases están ausentes. En la competencia, todas las demás clases no anotadas quedan excluidas de la evaluación en esa imagen. Para cada etiqueta positiva a nivel de imagen en una imagen, se anotó cada instancia de esa clase de objeto en la imagen.
Página de inicio : https://storage.googleapis.com/openimages/web/challenge2019.html
Código fuente :
tfds.datasets.open_images_challenge2019_detection.Builder
Versiones :
-
1.0.0
(predeterminado): sin notas de la versión.
-
Tamaño de descarga :
534.63 GiB
Almacenamiento en caché automático ( documentación ): No
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 99,999 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Estructura de características :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_group_of': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
}),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'confidence': float32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
'source': Text(shape=(), dtype=string),
}),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
objetos | Secuencia | |||
bobjects/bbox | Característica BBox | (4,) | flotador32 | |
bobjects/is_group_of | Tensor | booleano | ||
objetos/etiqueta | Etiqueta de clase | int64 | ||
identificación | Texto | cadena | ||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
objetos | Secuencia | |||
objetos/confianza | Tensor | flotador32 | ||
objetos/etiqueta | Etiqueta de clase | int64 | ||
objetos/fuente | Texto | cadena |
Claves supervisadas (ver documento
as_supervised
):None
Citación :
open_images_challenge2019_detection/200k (configuración predeterminada)
Descripción de la configuración : las imágenes tienen como máximo 200.000 píxeles, con calidad 72 JPEG.
Tamaño del conjunto de datos :
59.06 GiB
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
open_images_challenge2019_detection/300k
Descripción de la configuración : las imágenes tienen como máximo 300.000 píxeles, con calidad 72 JPEG.
Tamaño del conjunto de datos :
80.10 GiB
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):