- 説明:
PASS は、人間、人間の一部、その他の個人を特定できる情報を含まない大規模な画像データセットです。プライバシーの懸念を大幅に軽減しながら、高品質の自己教師付き事前トレーニングに使用できます。
PASS には、YFCC-100M から取得したラベルのない 1,439,589 枚の画像が含まれています。
このデータセット内のすべての画像は、データセット自体と同様に CC-BY ライセンスに基づいてライセンスされています。 YFCC-100M については、 http://www.multimediacommons.org/ を参照してください。
追加ドキュメント:コード付きの論文について調べる
ソースコード:
tfds.datasets.pass.Builder
バージョン:
-
1.0.0
: 初期リリース。 -
2.0.0
: v2: 人間が含まれていたため、v1 から 472 個の画像を削除しました。メタデータも追加されました: 日付と GPS。 -
3.0.0
(デフォルト): v3: 人間/タトゥーが含まれていたため、v2 から 131 個の画像を削除しました。
-
ダウンロード サイズ:
167.30 GiB
データセットのサイズ:
166.43 GiB
自動キャッシュ(ドキュメント): いいえ
分割:
スプリット | 例 |
---|---|
'train' | 1,439,588 |
- 機能の構造:
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
画像 | 画像 | (なし、なし、3) | uint8 | |
画像/creator_uname | 文章 | 弦 | ||
画像/撮影日 | 文章 | 弦 | ||
画像/gps_lat | テンソル | float32 | ||
画像/gps_lon | テンソル | float32 | ||
画像/ハッシュ | 文章 | 弦 |
監視キー(
as_supervised
docを参照):None
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}