- Descripción :
Cityscapes es un conjunto de datos que consta de diversas escenas de calles urbanas en 50 ciudades diferentes en distintas épocas del año, así como verdades básicas para varias tareas de visión, incluida la segmentación semántica, la segmentación a nivel de instancia (TODO) y la inferencia de disparidad de pares estéreo.
Para las tareas de segmentación (división predeterminada, accesible a través de 'cityscapes/semantic_segmentation'), Cityscapes proporciona anotaciones densas a nivel de píxeles para 5000 imágenes con una resolución de 1024 * 2048 dividida previamente en conjuntos de entrenamiento (2975), validación (500) y prueba (1525). Las anotaciones de etiquetas para las tareas de segmentación abarcan más de 30 clases que se encuentran comúnmente durante la percepción de la escena de conducción. La información detallada de la etiqueta se puede encontrar aquí: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes también proporciona anotaciones de segmentación de grano grueso (accesibles a través de 'cityscapes/semantic_segmentation_extra') para imágenes de 19998 en una división 'train_extra' que puede resultar útil para modelos de preentrenamiento/con gran cantidad de datos.
Además de la segmentación, los paisajes urbanos también proporcionan pares de imágenes estéreo y verdades básicas para tareas de inferencia de disparidad en las divisiones normal y extra (accesibles a través de 'cityscapes/stereo_disparity' y 'cityscapes/stereo_disparity_extra' respectivamente).
Ejemplos engordados:
- Para 'paisajes urbanos/stereo_disparity_extra':
- troisdorf_000000 000073 {*} imágenes (sin mapa de disparidad presente)
Documentación adicional : Explore en Papers With Code
Página de inicio: https://www.cityscapes-dataset.com
Código fuente :
tfds.datasets.cityscapes.Builder
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de descarga :
Unknown size
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
Tienes que descargar archivos de https://www.cityscapes-dataset.com/login/ (Este conjunto de datos requiere registro). Para la configuración básica (semantic_segmentation) debe descargar 'leftImg8bit_trainvaltest.zip' y 'gtFine_trainvaltest.zip'. Otras configuraciones requieren archivos adicionales; consulte el código para obtener más detalles.Almacenamiento automático en caché ( documentación ): No
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
paisajes urbanos/segmentación_semántica (configuración predeterminada)
Descripción de la configuración : conjunto de datos de segmentación semántica de paisajes urbanos.
Tamaño del conjunto de datos :
10.86 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 1,525 |
'train' | 2,975 |
'validation' | 500 |
- Estructura de características :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
id_imagen | Texto | cuerda | ||
imagen_izquierda | Imagen | (1024, 2048, 3) | uint8 | |
etiqueta_segmentación | Imagen | (1024, 2048, 1) | uint8 |
- Ejemplos ( tfds.as_dataframe ):
paisajes urbanos/semantic_segmentation_extra
Descripción de la configuración : conjunto de datos de segmentación semántica de paisajes urbanos con etiquetas gruesas y divididas train_extra.
Tamaño del conjunto de datos :
51.92 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,975 |
'train_extra' | 19,998 |
'validation' | 500 |
- Estructura de características :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
id_imagen | Texto | cuerda | ||
imagen_izquierda | Imagen | (1024, 2048, 3) | uint8 | |
etiqueta_segmentación | Imagen | (1024, 2048, 1) | uint8 |
- Ejemplos ( tfds.as_dataframe ):
paisajes urbanos/stereo_disparity
Descripción de la configuración : imagen estéreo de paisajes urbanos y conjunto de datos de mapas de disparidad.
Tamaño del conjunto de datos :
25.03 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 1,525 |
'train' | 2,975 |
'validation' | 500 |
- Estructura de características :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
disparity_map | Imagen | (1024, 2048, 1) | uint8 | |
id_imagen | Texto | cuerda | ||
imagen_izquierda | Imagen | (1024, 2048, 3) | uint8 | |
imagen_derecha | Imagen | (1024, 2048, 3) | uint8 |
- Ejemplos ( tfds.as_dataframe ):
paisajes urbanos/stereo_disparity_extra
Descripción de la configuración : imagen estéreo de paisajes urbanos y conjunto de datos de mapas de disparidad con división train_extra.
Tamaño del conjunto de datos :
119.18 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,975 |
'train_extra' | 19,997 |
'validation' | 500 |
- Estructura de características :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
disparity_map | Imagen | (1024, 2048, 1) | uint8 | |
id_imagen | Texto | cuerda | ||
imagen_izquierda | Imagen | (1024, 2048, 3) | uint8 | |
imagen_derecha | Imagen | (1024, 2048, 3) | uint8 |
- Ejemplos ( tfds.as_dataframe ):