- 説明:
Cityscapes は、1 年のさまざまな時期における 50 の異なる都市にわたる多様な都市のストリート シーンと、セマンティック セグメンテーション、インスタンス レベル セグメンテーション (TODO)、およびステレオ ペア視差推論を含むいくつかのビジョン タスクのグラウンド トゥルースで構成されるデータセットです。
セグメンテーション タスク (デフォルトの分割、「cityscapes/semantic_segmentation」経由でアクセス可能) の場合、Cityscapes は、トレーニング (2975)、検証 (500)、およびテスト (1525) セットに事前に分割された 1024 * 2048 解像度の 5000 画像の高密度ピクセル レベルの注釈を提供します。セグメンテーション タスクのラベル アノテーションは、シーンの認識を促進する際に一般的に遭遇する 30 以上のクラスにまたがっています。詳細なラベル情報はこちらにあります: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes は、「train_extra」分割で 19998 枚の画像の粗粒度セグメンテーション アノテーション (「cityscapes/semantic_segmentation_extra」からアクセス可能) も提供します。これは、事前トレーニング / データ量の多いモデルに役立つ可能性があります。
セグメンテーションに加えて、都市景観は、通常の分割と余分な分割の両方で視差推論タスクのステレオ画像ペアとグラウンド トゥルースも提供します (それぞれ「cityscapes/stereo_disparity」と「cityscapes/stereo_disparity_extra」からアクセスできます)。
無視された例:
- 「cityscapes/stereo_disparity_extra」の場合:
- troisdorf_000000 000073 {*} 画像 (視差マップなし)
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.cityscapes.Builder
バージョン:
-
1.0.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ: サイズ
Unknown size
手動ダウンロードの手順: このデータセットでは、ソース データを手動で
download_config.manual_dir
(デフォルトは~/tensorflow_datasets/downloads/manual/
) にダウンロードする必要があります。
https://www.cityscapes-dataset.com/login/からファイルをダウンロードする必要があります (このデータセットには登録が必要です)。基本構成 (semantic_segmentation) については、「leftImg8bit_trainvaltest.zip」と「gtFine_trainvaltest.zip」をダウンロードする必要があります。その他の構成には追加のファイルが必要です。詳細については、コードを参照してください。自動キャッシュ(ドキュメント): いいえ
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
街並み/semantic_segmentation (デフォルト設定)
構成の説明: 都市景観のセマンティック セグメンテーション データセット。
データセットサイズ:
10.86 GiB
スプリット:
スプリット | 例 |
---|---|
'test' | 1,525 |
'train' | 2,975 |
'validation' | 500 |
- 機能構造:
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
image_id | 文章 | ストリング | ||
image_left | 画像 | (1024、2048、3) | uint8 | |
セグメンテーション ラベル | 画像 | (1024、2048、1) | uint8 |
- 例( tfds.as_dataframe ):
街並み/semantic_segmentation_extra
構成の説明: train_extra 分割ラベルと粗いラベルを使用した Cityscapes セマンティック セグメンテーション データセット。
データセットサイズ:
51.92 GiB
スプリット:
スプリット | 例 |
---|---|
'train' | 2,975 |
'train_extra' | 19,998 |
'validation' | 500 |
- 機能構造:
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
image_id | 文章 | ストリング | ||
image_left | 画像 | (1024、2048、3) | uint8 | |
セグメンテーション ラベル | 画像 | (1024、2048、1) | uint8 |
- 例( tfds.as_dataframe ):
街並み/stereo_disparity
構成の説明: 都市景観のステレオ画像と視差マップのデータセット。
データセットサイズ:
25.03 GiB
スプリット:
スプリット | 例 |
---|---|
'test' | 1,525 |
'train' | 2,975 |
'validation' | 500 |
- 機能構造:
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
disparity_map | 画像 | (1024、2048、1) | uint8 | |
image_id | 文章 | ストリング | ||
image_left | 画像 | (1024、2048、3) | uint8 | |
画像右 | 画像 | (1024、2048、3) | uint8 |
- 例( tfds.as_dataframe ):
街並み/stereo_disparity_extra
構成の説明: 都市景観のステレオ画像と視差マップのデータセット (train_extra 分割あり)。
データセットサイズ:
119.18 GiB
スプリット:
スプリット | 例 |
---|---|
'train' | 2,975 |
'train_extra' | 19,997 |
'validation' | 500 |
- 機能構造:
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
disparity_map | 画像 | (1024、2048、1) | uint8 | |
image_id | 文章 | ストリング | ||
image_left | 画像 | (1024、2048、3) | uint8 | |
画像右 | 画像 | (1024、2048、3) | uint8 |
- 例( tfds.as_dataframe ):