- Descrizione :
Cityscapes è un set di dati composto da diverse scene di strade urbane in 50 città diverse in diversi periodi dell'anno, nonché verità di base per diverse attività visive tra cui segmentazione semantica, segmentazione a livello di istanza (TODO) e inferenza di disparità di coppia stereo.
Per le attività di segmentazione (divisione predefinita, accessibile tramite 'cityscapes/semantic_segmentation'), Cityscapes fornisce annotazioni a livello di pixel dense per 5000 immagini con risoluzione 1024 * 2048 pre-suddivise in set di addestramento (2975), convalida (500) e test (1525). Le annotazioni delle etichette per le attività di segmentazione si estendono su oltre 30 classi comunemente riscontrate durante la percezione della scena di guida. Informazioni dettagliate sull'etichetta possono essere trovate qui: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes fornisce anche annotazioni di segmentazione a grana grossa (accessibili tramite 'cityscapes/semantic_segmentation_extra') per le immagini 19998 in una divisione 'train_extra' che può rivelarsi utile per il pre-addestramento/modelli ricchi di dati.
Oltre alla segmentazione, i paesaggi urbani forniscono anche coppie di immagini stereo e verità di base per attività di inferenza sulla disparità su entrambe le divisioni normali ed extra (accessibili rispettivamente tramite "cityscapes/stereo_disparity" e "cityscapes/stereo_disparity_extra").
Esempi ingoriti:
- Per 'paesaggi urbani/stereo_disparity_extra':
- troisdorf_000000 000073 {*} immagini (nessuna mappa delle disparità presente)
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://www.cityscapes-dataset.com
Codice sorgente :
tfds.datasets.cityscapes.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensioni del download :
Unknown size
Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in
download_config.manual_dir
(il valore predefinito~/tensorflow_datasets/downloads/manual/
):
Devi scaricare i file da https://www.cityscapes-dataset.com/login/ (questo set di dati richiede la registrazione). Per la configurazione di base (semantic_segmentation) devi scaricare 'leftImg8bit_trainvaltest.zip' e 'gtFine_trainvaltest.zip'. Altre configurazioni richiedono file aggiuntivi: vedere il codice per maggiori dettagli.Cache automatica ( documentazione ): No
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
paesaggi urbani/semantic_segmentation (configurazione predefinita)
Descrizione della configurazione : set di dati di segmentazione semantica dei paesaggi urbani.
Dimensione del set di dati:
10.86 GiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.525 |
'train' | 2.975 |
'validation' | 500 |
- Struttura delle caratteristiche :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
immagine_id | Testo | corda | ||
immagine_sinistra | Immagine | (1024, 2048, 3) | uint8 | |
etichetta_segmentazione | Immagine | (1024, 2048, 1) | uint8 |
- Esempi ( tfds.as_dataframe ):
paesaggi urbani/segmentazione_semantica_extra
Descrizione della configurazione : set di dati di segmentazione semantica di paesaggi urbani con etichette split e grossolane train_extra.
Dimensione del set di dati:
51.92 GiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 2.975 |
'train_extra' | 19.998 |
'validation' | 500 |
- Struttura delle caratteristiche :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
immagine_id | Testo | corda | ||
immagine_sinistra | Immagine | (1024, 2048, 3) | uint8 | |
etichetta_segmentazione | Immagine | (1024, 2048, 1) | uint8 |
- Esempi ( tfds.as_dataframe ):
paesaggi urbani/stereo_disparity
Descrizione della configurazione : immagine stereo dei paesaggi urbani e set di dati delle mappe delle disparità.
Dimensione del set di dati:
25.03 GiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.525 |
'train' | 2.975 |
'validation' | 500 |
- Struttura delle caratteristiche :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
disparità_mappa | Immagine | (1024, 2048, 1) | uint8 | |
immagine_id | Testo | corda | ||
immagine_sinistra | Immagine | (1024, 2048, 3) | uint8 | |
immagine_destra | Immagine | (1024, 2048, 3) | uint8 |
- Esempi ( tfds.as_dataframe ):
paesaggi urbani/stereo_disparity_extra
Descrizione della configurazione : immagine stereo dei paesaggi urbani e set di dati delle mappe di disparità con suddivisione train_extra.
Dimensione del set di dati:
119.18 GiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 2.975 |
'train_extra' | 19.997 |
'validation' | 500 |
- Struttura delle caratteristiche :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
disparità_mappa | Immagine | (1024, 2048, 1) | uint8 | |
immagine_id | Testo | corda | ||
immagine_sinistra | Immagine | (1024, 2048, 3) | uint8 | |
immagine_destra | Immagine | (1024, 2048, 3) | uint8 |
- Esempi ( tfds.as_dataframe ):