wake_vision

  • 설명 :

Wake Vision은 600만 개가 넘는 이미지를 포함하는 대규모 고품질 데이터 세트로, 현재 TinyML 데이터 세트(100배)의 규모와 다양성을 훨씬 뛰어넘습니다. 이 데이터 세트에는 각 이미지에 사람이 포함되어 있는지 여부에 대한 주석이 포함된 이미지가 포함되어 있습니다. 또한 인식된 성별, 인식된 연령, 피사체 거리, 조명 조건 및 묘사를 포괄하여 공정성과 견고성을 평가하기 위한 포괄적이고 세분화된 벤치마크를 통합합니다. Wake Vision 라벨은 CC BY 4.0 라이선스에 따라 Google LLC에서 라이선스를 부여한 Open Image의 주석에서 파생됩니다. 이미지에는 CC BY 2.0 라이센스가 있는 것으로 나열됩니다. Open Images의 참고 사항: "Creative Commons Attribution 라이선스에 따라 라이선스가 부여된 이미지를 식별하려고 시도했지만 각 이미지의 라이선스 상태에 대해 어떠한 진술이나 보증도 하지 않으며 각 이미지에 대한 라이선스를 직접 확인해야 합니다."

나뉘다
'test' 55,763
'train_large' 5,760,428
'train_quality' 1,248,230
'validation' 18,582
  • 기능 구조 :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • 기능 문서 :
특징 수업 모양 Dtype 설명
특징Dict
나이_알 수 없음 클래스 라벨 정수64
신체 부위 클래스 라벨 정수64
밝은 클래스 라벨 정수64
어두운 클래스 라벨 정수64
묘사 클래스 라벨 정수64
멀리 클래스 라벨 정수64
파일 이름 텍스트
성별_알 수 없음 클래스 라벨 정수64
영상 영상 (없음, 없음, 3) uint8
중간 거리 클래스 라벨 정수64
중년 클래스 라벨 정수64
가까운 클래스 라벨 정수64
사람이 아닌 묘사 클래스 라벨 정수64
사람이 아닌_비설명 클래스 라벨 정수64
일반_조명 클래스 라벨 정수64
나이가 많은 클래스 라벨 정수64
사람 클래스 라벨 정수64
사람_묘사 클래스 라벨 정수64
주로_여성 클래스 라벨 정수64
주로_남성 클래스 라벨 정수64
어린 클래스 라벨 정수64

심상

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}