wake_vision

  • Descrizione :

Wake Vision è un set di dati di grandi dimensioni e di alta qualità contenente oltre 6 milioni di immagini, che supera significativamente la scala e la diversità degli attuali set di dati tinyML (100x). Questo set di dati include immagini con annotazioni che indicano se ciascuna immagine contiene una persona. Inoltre, incorpora un benchmark completo e dettagliato per valutare l’equità e la robustezza, coprendo il genere percepito, l’età percepita, la distanza del soggetto, le condizioni di illuminazione e le rappresentazioni. Le etichette Wake Vision derivano dalle annotazioni di Open Image concesse in licenza da Google LLC con licenza CC BY 4.0. Le immagini sono elencate come aventi una licenza CC BY 2.0. Nota da Open Images: "anche se abbiamo cercato di identificare le immagini concesse in licenza con una licenza Creative Commons Attribution, non forniamo alcuna dichiarazione o garanzia in merito allo stato della licenza di ciascuna immagine e dovresti verificare tu stesso la licenza per ciascuna immagine."

Diviso Esempi
'test' 55.763
'train_large' 5.760.428
'train_quality' 1.248.230
'validation' 18.582
  • Struttura delle caratteristiche :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
età_sconosciuta ClassLabel int64
parte_delcorpo ClassLabel int64
luminoso ClassLabel int64
buio ClassLabel int64
rappresentazione ClassLabel int64
lontano ClassLabel int64
nomefile Testo corda
genere_sconosciuto ClassLabel int64
immagine Immagine (Nessuno, Nessuno, 3) uint8
media_distanza ClassLabel int64
mezza_età ClassLabel int64
vicino ClassLabel int64
non-person_depiction ClassLabel int64
non-persona_non-rappresentazione ClassLabel int64
illuminazione_normale ClassLabel int64
più vecchio ClassLabel int64
persona ClassLabel int64
person_depiction ClassLabel int64
prevalentemente_femminile ClassLabel int64
prevalentemente_maschile ClassLabel int64
giovane ClassLabel int64

Visualizzazione

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}