wake_vision

설명 :

Wake Vision은 600만 개가 넘는 이미지를 포함하는 대규모 고품질 데이터 세트로, 현재 TinyML 데이터 세트(100배)의 규모와 다양성을 훨씬 뛰어넘습니다. 이 데이터 세트에는 각 이미지에 사람이 포함되어 있는지 여부에 대한 주석이 포함된 이미지가 포함되어 있습니다. 또한 인지된 성별, 인지된 연령, 피사체 거리, 조명 조건 및 묘사를 포괄하여 공정성과 견고성을 평가하기 위한 포괄적이고 세분화된 벤치마크를 통합합니다. Wake Vision 라벨은 CC BY 4.0 라이선스에 따라 Google LLC에서 라이선스를 부여한 Open Image의 주석에서 파생됩니다. 이미지에는 CC BY 2.0 라이센스가 있는 것으로 나열됩니다. Open Images의 참고 사항: "Creative Commons Attribution 라이센스에 따라 라이센스가 부여된 이미지를 식별하려고 시도했지만 각 이미지의 라이센스 상태에 대해 어떠한 진술이나 보증도 하지 않으며 각 이미지에 대한 라이센스를 직접 확인해야 합니다."

홈페이지 : https://dataverse.harvard.edu/dataset.xhtml?pertantId=doi%3A10.7910%2FDVN%2F1HOPXC
소스 코드 : tfds.datasets.wake_vision.Builder
버전 :
- 1.0.0 (기본값): 초기 TensorFlow 데이터세트 릴리스입니다. 이는 Harvard Dataverse의 Wake Vision 2.0 버전을 기반으로 합니다.
다운로드 크기 : Unknown size
데이터세트 크기 : 239.25 GiB
자동 캐시 ( 문서 ): 아니요
분할 :

나뉘다	예
`'test'`	55,763
`'train_large'`	5,760,428
`'train_quality'`	1,248,230
`'validation'`	18,582

기능 구조 :

FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

기능 문서 :

특징	수업	모양	Dtype
	특징Dict
나이_알 수 없음	클래스 라벨		정수64
신체 부위	클래스 라벨		정수64
밝은	클래스 라벨		정수64
어두운	클래스 라벨		정수64
묘사	클래스 라벨		정수64
멀리	클래스 라벨		정수64
파일 이름	텍스트		끈
성별_알 수 없음	클래스 라벨		정수64
영상	영상	(없음, 없음, 3)	uint8
중간 거리	클래스 라벨		정수64
중년	클래스 라벨		정수64
가까운	클래스 라벨		정수64
사람이 아닌 묘사	클래스 라벨		정수64
사람이 아닌_비묘사	클래스 라벨		정수64
일반_조명	클래스 라벨		정수64
나이가 많은	클래스 라벨		정수64
사람	클래스 라벨		정수64
사람_묘사	클래스 라벨		정수64
주로_여성	클래스 라벨		정수64
주로_남성	클래스 라벨		정수64
어린	클래스 라벨		정수64

감독되는 키 ( as_supervised doc 참조): ('image', 'person')
그림 ( tfds.show_examples ):

예 ( tfds.as_dataframe ):

인용 :

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}

wake_vision 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

wake_vision