- Sự miêu tả :
PASS là tập dữ liệu hình ảnh quy mô lớn không bao gồm bất kỳ con người, bộ phận cơ thể người hoặc thông tin nhận dạng cá nhân nào khác. Nó có thể được sử dụng để đào tạo trước tự giám sát chất lượng cao đồng thời giảm đáng kể những lo ngại về quyền riêng tư.
PASS chứa 1.439.589 hình ảnh không có nhãn có nguồn gốc từ YFCC-100M.
Tất cả hình ảnh trong tập dữ liệu này đều được cấp phép theo giấy phép CC-BY, cũng như chính tập dữ liệu đó. Đối với YFCC-100M, hãy xem http://www.multimediacommons.org/
Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : https://www.robots.ox.ac.uk/~vgg/data/pass/
Mã nguồn :
tfds.datasets.pass.Builder
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
2.0.0
: v2: Đã xóa 472 hình ảnh khỏi v1 vì chúng chứa con người. Cũng đã thêm siêu dữ liệu: ngày tháng và GPS. -
3.0.0
(mặc định): v3: Đã xóa 131 hình ảnh khỏi v2 vì chúng chứa con người/hình xăm.
-
Kích thước tải xuống :
167.30 GiB
Kích thước tập dữ liệu :
166.43 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1.439.588 |
- Cấu trúc tính năng :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
hình ảnh | Hình ảnh | (Không, Không, 3) | uint8 | |
hình ảnh/người sáng tạo_uname | Chữ | sợi dây | ||
hình ảnh/ngày_taken | Chữ | sợi dây | ||
hình ảnh/gps_lat | Tenxơ | phao32 | ||
hình ảnh/gps_lon | Tenxơ | phao32 | ||
hình ảnh/băm | Chữ | sợi dây |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}