合格

  • 説明

PASS は、人間、人間の一部、その他の個人を特定できる情報を含まない大規模な画像データセットです。プライバシーの懸念を大幅に軽減しながら、高品質の自己教師付き事前トレーニングに使用できます。

PASS には、YFCC-100M から取得したラベルのない 1,439,589 枚の画像が含まれています。

このデータセット内のすべての画像は、データセット自体と同様に CC-BY ライセンスに基づいてライセンスされています。 YFCC-100M については、 http://www.multimediacommons.org/ を参照してください。

スプリット
'train' 1,439,588
  • 機能の構造:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
画像画像(なし、なし、3) uint8
画像/creator_uname文章
画像/撮影日文章
画像/gps_latテンソルfloat32
画像/gps_lonテンソルfloat32
画像/ハッシュ文章

視覚化

  • 引用
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}