- 설명 :
PASS는 사람, 사람의 일부, 기타 개인 식별 정보가 포함되지 않은 대규모 이미지 데이터세트입니다. 개인 정보 보호 문제를 크게 줄이면서 고품질의 자기 감독 사전 학습에 사용할 수 있습니다.
PASS에는 YFCC-100M에서 가져온 라벨이 없는 1,439,589개의 이미지가 포함되어 있습니다.
이 데이터세트의 모든 이미지는 데이터세트 자체와 마찬가지로 CC-BY 라이선스에 따라 라이선스가 부여됩니다. YFCC-100M에 대해서는 http://www.multimediacommons.org/를 참조하세요.
추가 문서 : 코드 가 포함된 논문 탐색
소스 코드 :
tfds.datasets.pass.Builder
버전 :
-
1.0.0
: 최초 릴리스. -
2.0.0
: v2: v1에서 인간이 포함된 472개의 이미지를 제거했습니다. 또한 메타데이터도 추가되었습니다: 촬영 날짜 및 GPS. -
3.0.0
(기본값): v3: 인간/문신이 포함되어 있으므로 v2에서 131개의 이미지를 제거했습니다.
-
다운로드 크기 :
167.30 GiB
데이터세트 크기 :
166.43 GiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,439,588 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
이미지/creator_uname | 텍스트 | 끈 | ||
이미지/날짜_촬영 | 텍스트 | 끈 | ||
이미지/gps_lat | 텐서 | float32 | ||
이미지/gps_lon | 텐서 | float32 | ||
이미지/해시 | 텍스트 | 끈 |
감독되는 키 (
as_supervised
doc 참조):None
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}