paesaggi urbani

  • Descrizione :

Cityscapes è un set di dati composto da diverse scene di strade urbane in 50 città diverse in diversi periodi dell'anno, nonché verità di base per diverse attività visive tra cui segmentazione semantica, segmentazione a livello di istanza (TODO) e inferenza di disparità di coppia stereo.

Per le attività di segmentazione (divisione predefinita, accessibile tramite 'cityscapes/semantic_segmentation'), Cityscapes fornisce annotazioni a livello di pixel dense per 5000 immagini con risoluzione 1024 * 2048 pre-suddivise in set di addestramento (2975), convalida (500) e test (1525). Le annotazioni delle etichette per le attività di segmentazione si estendono su oltre 30 classi comunemente riscontrate durante la percezione della scena di guida. Informazioni dettagliate sull'etichetta possono essere trovate qui: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes fornisce anche annotazioni di segmentazione a grana grossa (accessibili tramite 'cityscapes/semantic_segmentation_extra') per le immagini 19998 in una divisione 'train_extra' che può rivelarsi utile per il pre-addestramento/modelli ricchi di dati.

Oltre alla segmentazione, i paesaggi urbani forniscono anche coppie di immagini stereo e verità di base per attività di inferenza sulla disparità su entrambe le divisioni normali ed extra (accessibili rispettivamente tramite "cityscapes/stereo_disparity" e "cityscapes/stereo_disparity_extra").

Esempi ingoriti:

  • Per 'paesaggi urbani/stereo_disparity_extra':
    • troisdorf_000000 000073 {*} immagini (nessuna mappa delle disparità presente)
@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

paesaggi urbani/semantic_segmentation (configurazione predefinita)

  • Descrizione della configurazione : set di dati di segmentazione semantica dei paesaggi urbani.

  • Dimensione del set di dati: 10.86 GiB

  • Divisioni :

Diviso Esempi
'test' 1.525
'train' 2.975
'validation' 500
  • Struttura delle caratteristiche :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
immagine_id Testo corda
immagine_sinistra Immagine (1024, 2048, 3) uint8
etichetta_segmentazione Immagine (1024, 2048, 1) uint8

paesaggi urbani/segmentazione_semantica_extra

  • Descrizione della configurazione : set di dati di segmentazione semantica di paesaggi urbani con etichette split e grossolane train_extra.

  • Dimensione del set di dati: 51.92 GiB

  • Divisioni :

Diviso Esempi
'train' 2.975
'train_extra' 19.998
'validation' 500
  • Struttura delle caratteristiche :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
immagine_id Testo corda
immagine_sinistra Immagine (1024, 2048, 3) uint8
etichetta_segmentazione Immagine (1024, 2048, 1) uint8

paesaggi urbani/stereo_disparity

  • Descrizione della configurazione : immagine stereo dei paesaggi urbani e set di dati delle mappe delle disparità.

  • Dimensione del set di dati: 25.03 GiB

  • Divisioni :

Diviso Esempi
'test' 1.525
'train' 2.975
'validation' 500
  • Struttura delle caratteristiche :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
disparità_mappa Immagine (1024, 2048, 1) uint8
immagine_id Testo corda
immagine_sinistra Immagine (1024, 2048, 3) uint8
immagine_destra Immagine (1024, 2048, 3) uint8

paesaggi urbani/stereo_disparity_extra

  • Descrizione della configurazione : immagine stereo dei paesaggi urbani e set di dati delle mappe di disparità con suddivisione train_extra.

  • Dimensione del set di dati: 119.18 GiB

  • Divisioni :

Diviso Esempi
'train' 2.975
'train_extra' 19.997
'validation' 500
  • Struttura delle caratteristiche :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
disparità_mappa Immagine (1024, 2048, 1) uint8
immagine_id Testo corda
immagine_sinistra Immagine (1024, 2048, 3) uint8
immagine_destra Immagine (1024, 2048, 3) uint8