- Descriptif :
Cityscapes est un ensemble de données composé de diverses scènes de rue urbaines dans 50 villes différentes à différents moments de l'année, ainsi que des vérités de terrain pour plusieurs tâches de vision, notamment la segmentation sémantique, la segmentation au niveau de l'instance (TODO) et l'inférence de disparité de paires stéréo.
Pour les tâches de segmentation (division par défaut, accessible via 'cityscapes/semantic_segmentation'), Cityscapes fournit des annotations denses au niveau des pixels pour 5000 images à une résolution de 1024 * 2048 pré-divisées en ensembles d'apprentissage (2975), de validation (500) et de test (1525). Les annotations d'étiquettes pour les tâches de segmentation couvrent plus de 30 classes couramment rencontrées lors de la perception de la scène de conduite. Des informations détaillées sur les étiquettes peuvent être trouvées ici : https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes fournit également des annotations de segmentation à gros grains (accessibles via 'cityscapes/semantic_segmentation_extra') pour 19998 images dans une division 'train_extra' qui peut s'avérer utile pour les modèles de pré-formation / lourds en données.
Outre la segmentation, les paysages urbains fournissent également des paires d'images stéréo et des vérités de terrain pour les tâches d'inférence de disparité sur les fractionnements normaux et supplémentaires (accessibles via 'cityscapes/stereo_disparity' et 'cityscapes/stereo_disparity_extra' respectivement).
Exemples intégrés :
- Pour 'paysages urbains/stereo_disparity_extra' :
- troisdorf_000000 000073 {*} images (aucune carte de disparité présente)
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://www.cityscapes-dataset.com
Code source :
tfds.datasets.cityscapes.Builder
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
Unknown size
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans
download_config.manual_dir
(par défaut~/tensorflow_datasets/downloads/manual/
) :
Vous devez télécharger les fichiers depuis https://www.cityscapes-dataset.com/login/ (Cet ensemble de données nécessite une inscription). Pour la configuration de base (semantic_segmentation), vous devez télécharger 'leftImg8bit_trainvaltest.zip' et 'gtFine_trainvaltest.zip'. D'autres configurations nécessitent des fichiers supplémentaires - veuillez consulter le code pour plus de détails.Mise en cache automatique ( documentation ): Non
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
paysages urbains/semantic_segmentation (configuration par défaut)
Description de la configuration : jeu de données de segmentation sémantique Cityscapes.
Taille du jeu de données :
10.86 GiB
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 1 525 |
'train' | 2 975 |
'validation' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image_id | Texte | chaîne de caractères | ||
image_left | Image | (1024, 2048, 3) | uint8 | |
segmentation_label | Image | (1024, 2048, 1) | uint8 |
- Exemples ( tfds.as_dataframe ):
paysages urbains/semantic_segmentation_extra
Description de la configuration : ensemble de données de segmentation sémantique des paysages urbains avec des étiquettes fractionnées et grossières train_extra.
Taille du jeu de données :
51.92 GiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 2 975 |
'train_extra' | 19 998 |
'validation' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image_id | Texte | chaîne de caractères | ||
image_left | Image | (1024, 2048, 3) | uint8 | |
segmentation_label | Image | (1024, 2048, 1) | uint8 |
- Exemples ( tfds.as_dataframe ):
paysages urbains/stéréo_disparité
Description de la configuration : ensemble de données d'images stéréo et de cartes de disparité Cityscapes.
Taille du jeu de données :
25.03 GiB
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 1 525 |
'train' | 2 975 |
'validation' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
disparité_map | Image | (1024, 2048, 1) | uint8 | |
image_id | Texte | chaîne de caractères | ||
image_left | Image | (1024, 2048, 3) | uint8 | |
image_right | Image | (1024, 2048, 3) | uint8 |
- Exemples ( tfds.as_dataframe ):
paysages urbains/stereo_disparity_extra
Description de la configuration : ensemble de données d'images stéréo et de cartes de disparité Cityscapes avec fractionnement train_extra.
Taille du jeu de données :
119.18 GiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 2 975 |
'train_extra' | 19 997 |
'validation' | 500 |
- Structure des fonctionnalités :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
disparité_map | Image | (1024, 2048, 1) | uint8 | |
image_id | Texte | chaîne de caractères | ||
image_left | Image | (1024, 2048, 3) | uint8 | |
image_right | Image | (1024, 2048, 3) | uint8 |
- Exemples ( tfds.as_dataframe ):