пробуждение_видение

  • Описание :

Wake Vision — это большой высококачественный набор данных, содержащий более 6 миллионов изображений, что значительно превышает масштаб и разнообразие текущих наборов данных tinyML (в 100 раз). Этот набор данных включает изображения с аннотациями о том, содержит ли каждое изображение человека. Кроме того, он включает в себя комплексный детальный критерий для оценки справедливости и надежности, охватывающий воспринимаемый пол, воспринимаемый возраст, расстояние до объекта, условия освещения и изображения. Ярлыки Wake Vision созданы на основе аннотаций Open Image, которые лицензированы Google LLC по лицензии CC BY 4.0. Изображения указаны как имеющие лицензию CC BY 2.0. Примечание от Open Images: «Хотя мы пытались идентифицировать изображения, лицензированные по лицензии Creative Commons Attribution, мы не делаем никаких заявлений и не даем гарантий относительно статуса лицензии каждого изображения, и вам следует проверить лицензию для каждого изображения самостоятельно».

Расколоть Примеры
'test' 55 763
'train_large' 5 760 428
'train_quality' 1 248 230
'validation' 18 582
  • Структура функции :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
возраст_неизвестен Класслейбл int64
часть_тела Класслейбл int64
яркий Класслейбл int64
темный Класслейбл int64
описание Класслейбл int64
далеко Класслейбл int64
имя файла Текст нить
пол_неизвестен Класслейбл int64
изображение Изображение (Нет, Нет, 3) uint8
среднее_дистанция Класслейбл int64
средний_возраст Класслейбл int64
около Класслейбл int64
неperson_depiction Класслейбл int64
нечеловек_неизображение Класслейбл int64
нормальное_освещение Класслейбл int64
старше Класслейбл int64
человек Класслейбл int64
person_depiction Класслейбл int64
преимущественно_женщины Класслейбл int64
преимущественно_мужчины Класслейбл int64
молодой Класслейбл int64

Визуализация

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}