ウェイクビジョン

  • 説明

Wake Vision は、600 万を超える画像を特徴とする大規模で高品質のデータセットであり、現在の tinyML データセット (100 倍) の規模と多様性を大幅に超えています。このデータセットには、各画像に人物が含まれているかどうかの注釈が付いた画像が含まれています。さらに、公平性と堅牢性を評価するための包括的なきめの細かいベンチマークが組み込まれており、知覚される性別、知覚される年齢、被写体の距離、照明条件、描写をカバーします。 Wake Vision ラベルは、CC BY 4.0 ライセンスに基づいて Google LLC からライセンスを取得した Open Image の注釈から派生しています。画像は CC BY 2.0 ライセンスを持つものとしてリストされています。 Open Images からの注記: 「クリエイティブ コモンズ表示ライセンスに基づいてライセンスが付与されている画像を特定しようとしましたが、各画像のライセンス ステータスに関していかなる表明も保証も行いません。各画像のライセンスはご自身で確認してください。」

スプリット
'test' 55,763
'train_large' 5,760,428
'train_quality' 1,248,230
'validation' 18,582
  • 機能の構造:
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
年齢不明クラスラベルint64
ボディパーツクラスラベルint64
明るいクラスラベルint64
暗いクラスラベルint64
描写クラスラベルint64
遠いクラスラベルint64
ファイル名文章
性別不明クラスラベルint64
画像画像(なし、なし、3) uint8
中距離クラスラベルint64
中年クラスラベルint64
近くクラスラベルint64
人物以外の描写クラスラベルint64
非人物_非描写クラスラベルint64
通常_照明クラスラベルint64
年上のクラスラベルint64
クラスラベルint64
人物の描写クラスラベルint64
主に女性クラスラベルint64
主に男性クラスラベルint64
若いクラスラベルint64

視覚化

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}