- Mô tả :
Cityscapes là một bộ dữ liệu bao gồm các cảnh đường phố đô thị đa dạng trên 50 thành phố khác nhau vào các thời điểm khác nhau trong năm cũng như các thông tin cơ bản cho một số tác vụ hình ảnh bao gồm phân đoạn ngữ nghĩa, phân đoạn cấp độ phiên bản (TODO) và suy luận chênh lệch cặp âm thanh nổi.
Đối với các tác vụ phân đoạn (tách mặc định, có thể truy cập thông qua 'cityscapes/semantic_segmentation'), Cityscapes cung cấp các chú thích mức độ pixel dày đặc cho 5000 hình ảnh ở độ phân giải 1024 * 2048 được phân chia trước thành các bộ đào tạo (2975), xác thực (500) và thử nghiệm (1525). Chú thích nhãn cho các tác vụ phân đoạn trải rộng trên hơn 30 loại thường gặp trong quá trình nhận biết cảnh lái xe. Thông tin nhãn chi tiết có thể được tìm thấy ở đây: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes cũng cung cấp các chú thích phân đoạn hạt thô (có thể truy cập thông qua 'cityscapes/semantic_segmentation_extra') cho các hình ảnh năm 19998 trong phần tách 'train_extra', điều này có thể hữu ích cho các mô hình chuẩn bị trước/có nhiều dữ liệu.
Bên cạnh phân đoạn, cảnh quan thành phố cũng cung cấp các cặp hình ảnh âm thanh nổi và sự thật cơ bản cho các tác vụ suy luận chênh lệch trên cả phân tách thông thường và phân tách bổ sung (có thể truy cập qua 'cityscapes/stereo_disparity' và 'cityscapes/stereo_disparity_extra' tương ứng).
Các ví dụ đã nhập:
- Đối với 'cityscapes/stereo_disparity_extra':
- troisdorf_000000 000073 {*} hình ảnh (không có bản đồ chênh lệch)
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://www.cityscapes-dataset.com
Mã nguồn :
tfds.datasets.cityscapes.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
Unknown size
Hướng dẫn tải xuống thủ công : Bộ dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào
download_config.manual_dir
(mặc định là~/tensorflow_datasets/downloads/manual/
):
Bạn phải tải xuống các tệp từ https://www.cityscapes-dataset.com/login/ (Bộ dữ liệu này yêu cầu đăng ký). Đối với cấu hình cơ bản (semantic_segmentation), bạn phải tải xuống 'leftImg8bit_trainvaltest.zip' và 'gtFine_trainvaltest.zip'. Các cấu hình khác yêu cầu tệp bổ sung - vui lòng xem mã để biết thêm chi tiết.Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
cảnh quan thành phố/semantic_segmentation (cấu hình mặc định)
Mô tả cấu hình : Bộ dữ liệu phân đoạn ngữ nghĩa Cityscapes.
Kích thước tập dữ liệu :
10.86 GiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 1.525 |
'train' | 2.975 |
'validation' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
image_id | Chữ | sợi dây | ||
image_left | Hình ảnh | (1024, 2048, 3) | uint8 | |
phân đoạn_nhãn | Hình ảnh | (1024, 2048, 1) | uint8 |
- Ví dụ ( tfds.as_dataframe ):
cảnh quan thành phố/semantic_segmentation_extra
Mô tả cấu hình : Bộ dữ liệu phân đoạn ngữ nghĩa của Cityscapes với các nhãn thô và phân tách train_extra.
Kích thước tập dữ liệu :
51.92 GiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 2.975 |
'train_extra' | 19.998 |
'validation' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
image_id | Chữ | sợi dây | ||
image_left | Hình ảnh | (1024, 2048, 3) | uint8 | |
phân đoạn_nhãn | Hình ảnh | (1024, 2048, 1) | uint8 |
- Ví dụ ( tfds.as_dataframe ):
cảnh quan thành phố/stereo_disparity
Mô tả cấu hình : Bộ dữ liệu bản đồ chênh lệch và hình ảnh âm thanh nổi Cityscapes.
Kích thước tập dữ liệu :
25.03 GiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 1.525 |
'train' | 2.975 |
'validation' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
disparity_map | Hình ảnh | (1024, 2048, 1) | uint8 | |
image_id | Chữ | sợi dây | ||
image_left | Hình ảnh | (1024, 2048, 3) | uint8 | |
image_right | Hình ảnh | (1024, 2048, 3) | uint8 |
- Ví dụ ( tfds.as_dataframe ):
cảnh quan thành phố/âm thanh nổi_disparity_extra
Mô tả cấu hình : Bộ dữ liệu bản đồ chênh lệch và hình ảnh âm thanh nổi Cityscapes với phần tách train_extra.
Kích thước tập dữ liệu :
119.18 GiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 2.975 |
'train_extra' | 19,997 |
'validation' | 500 |
- Cấu trúc tính năng :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
disparity_map | Hình ảnh | (1024, 2048, 1) | uint8 | |
image_id | Chữ | sợi dây | ||
image_left | Hình ảnh | (1024, 2048, 3) | uint8 | |
image_right | Hình ảnh | (1024, 2048, 3) | uint8 |
- Ví dụ ( tfds.as_dataframe ):