- Description :
Wake Vision est un vaste ensemble de données de haute qualité comprenant plus de 6 millions d'images, dépassant largement l'échelle et la diversité des ensembles de données tinyML actuels (100x). Cet ensemble de données comprend des images avec des annotations indiquant si chaque image contient une personne. De plus, il intègre une référence complète et fine pour évaluer l'équité et la robustesse, couvrant le sexe perçu, l'âge perçu, la distance du sujet, les conditions d'éclairage et les représentations. Les étiquettes Wake Vision sont dérivées des annotations d'Open Image qui sont sous licence Google LLC sous licence CC BY 4.0. Les images sont répertoriées comme ayant une licence CC BY 2.0. Remarque d'Open Images : "bien que nous ayons essayé d'identifier les images sous licence Creative Commons Attribution, nous ne faisons aucune déclaration ni garantie concernant le statut de licence de chaque image et vous devez vérifier vous-même la licence de chaque image."
Page d'accueil : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
Code source :
tfds.datasets.wake_vision.Builder
Versions :
-
1.0.0
(par défaut) : version initiale des ensembles de données TensorFlow. Notez que ceci est basé sur la version 2.0 de Wake Vision sur Harvard Dataverse.
-
Taille du téléchargement :
Unknown size
Taille de l'ensemble de données :
239.25 GiB
Mise en cache automatique ( documentation ) : Non
Divisions :
Diviser | Exemples |
---|---|
'test' | 55 763 |
'train_large' | 5 760 428 |
'train_quality' | 1 248 230 |
'validation' | 18 582 |
- Structure des fonctionnalités :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
âge_inconnu | Étiquette de classe | int64 | ||
partie_corps | Étiquette de classe | int64 | ||
brillant | Étiquette de classe | int64 | ||
sombre | Étiquette de classe | int64 | ||
représentation | Étiquette de classe | int64 | ||
loin | Étiquette de classe | int64 | ||
nom de fichier | Texte | chaîne | ||
genre_inconnu | Étiquette de classe | int64 | ||
image | Image | (Aucun, Aucun, 3) | uint8 | |
moyenne_distance | Étiquette de classe | int64 | ||
âge_moyen | Étiquette de classe | int64 | ||
près | Étiquette de classe | int64 | ||
non-person_depiction | Étiquette de classe | int64 | ||
non-person_non-depiction | Étiquette de classe | int64 | ||
éclairage_normal | Étiquette de classe | int64 | ||
plus vieux | Étiquette de classe | int64 | ||
personne | Étiquette de classe | int64 | ||
représentation_personne | Étiquette de classe | int64 | ||
majoritairement_femelle | Étiquette de classe | int64 | ||
majoritairement_masculin | Étiquette de classe | int64 | ||
jeune | Étiquette de classe | int64 |
Clés supervisées (Voir doc
as_supervised
) :('image', 'person')
Figure ( tfds.show_examples ) :
Exemples ( tfds.as_dataframe ) : Manquant.
Citation :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}