paysages urbains

  • Descriptif :

Cityscapes est un ensemble de données composé de diverses scènes de rue urbaines dans 50 villes différentes à différents moments de l'année, ainsi que des vérités de terrain pour plusieurs tâches de vision, notamment la segmentation sémantique, la segmentation au niveau de l'instance (TODO) et l'inférence de disparité de paires stéréo.

Pour les tâches de segmentation (division par défaut, accessible via 'cityscapes/semantic_segmentation'), Cityscapes fournit des annotations denses au niveau des pixels pour 5000 images à une résolution de 1024 * 2048 pré-divisées en ensembles d'apprentissage (2975), de validation (500) et de test (1525). Les annotations d'étiquettes pour les tâches de segmentation couvrent plus de 30 classes couramment rencontrées lors de la perception de la scène de conduite. Des informations détaillées sur les étiquettes peuvent être trouvées ici : https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes fournit également des annotations de segmentation à gros grains (accessibles via 'cityscapes/semantic_segmentation_extra') pour 19998 images dans une division 'train_extra' qui peut s'avérer utile pour les modèles de pré-formation / lourds en données.

Outre la segmentation, les paysages urbains fournissent également des paires d'images stéréo et des vérités de terrain pour les tâches d'inférence de disparité sur les fractionnements normaux et supplémentaires (accessibles via 'cityscapes/stereo_disparity' et 'cityscapes/stereo_disparity_extra' respectivement).

Exemples intégrés :

  • Pour 'paysages urbains/stereo_disparity_extra' :
    • troisdorf_000000 000073 {*} images (aucune carte de disparité présente)
  • Documentation complémentaire : Explorer sur Papers With Code

  • Page d' accueil : https://www.cityscapes-dataset.com

  • Code source : tfds.datasets.cityscapes.Builder

  • Versions :

    • 1.0.0 (par défaut) : aucune note de version.
  • Taille du téléchargement : Unknown size

  • Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ) :
    Vous devez télécharger les fichiers depuis https://www.cityscapes-dataset.com/login/ (Cet ensemble de données nécessite une inscription). Pour la configuration de base (semantic_segmentation), vous devez télécharger 'leftImg8bit_trainvaltest.zip' et 'gtFine_trainvaltest.zip'. D'autres configurations nécessitent des fichiers supplémentaires - veuillez consulter le code pour plus de détails.

  • Mise en cache automatique ( documentation ): Non

  • Clés supervisées (Voir as_supervised doc ): None

  • Figure ( tfds.show_examples ) : non pris en charge.

  • Citation :

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

paysages urbains/semantic_segmentation (configuration par défaut)

  • Description de la configuration : jeu de données de segmentation sémantique Cityscapes.

  • Taille du jeu de données : 10.86 GiB

  • Fractionnements :

Diviser Exemples
'test' 1 525
'train' 2 975
'validation' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image_id Texte chaîne de caractères
image_left Image (1024, 2048, 3) uint8
segmentation_label Image (1024, 2048, 1) uint8

paysages urbains/semantic_segmentation_extra

  • Description de la configuration : ensemble de données de segmentation sémantique des paysages urbains avec des étiquettes fractionnées et grossières train_extra.

  • Taille du jeu de données : 51.92 GiB

  • Fractionnements :

Diviser Exemples
'train' 2 975
'train_extra' 19 998
'validation' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image_id Texte chaîne de caractères
image_left Image (1024, 2048, 3) uint8
segmentation_label Image (1024, 2048, 1) uint8

paysages urbains/stéréo_disparité

  • Description de la configuration : ensemble de données d'images stéréo et de cartes de disparité Cityscapes.

  • Taille du jeu de données : 25.03 GiB

  • Fractionnements :

Diviser Exemples
'test' 1 525
'train' 2 975
'validation' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
disparité_map Image (1024, 2048, 1) uint8
image_id Texte chaîne de caractères
image_left Image (1024, 2048, 3) uint8
image_right Image (1024, 2048, 3) uint8

paysages urbains/stereo_disparity_extra

  • Description de la configuration : ensemble de données d'images stéréo et de cartes de disparité Cityscapes avec fractionnement train_extra.

  • Taille du jeu de données : 119.18 GiB

  • Fractionnements :

Diviser Exemples
'train' 2 975
'train_extra' 19 997
'validation' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
disparité_map Image (1024, 2048, 1) uint8
image_id Texte chaîne de caractères
image_left Image (1024, 2048, 3) uint8
image_right Image (1024, 2048, 3) uint8