despertar_vision

  • Descripción :

Wake Vision es un conjunto de datos grande y de alta calidad que presenta más de 6 millones de imágenes, lo que supera significativamente la escala y diversidad de los conjuntos de datos tinyML actuales (100x). Este conjunto de datos incluye imágenes con anotaciones sobre si cada imagen contiene una persona. Además, incorpora un punto de referencia integral y detallado para evaluar la equidad y la solidez, que abarca el género percibido, la edad percibida, la distancia del sujeto, las condiciones de iluminación y las representaciones. Las etiquetas de Wake Vision se derivan de las anotaciones de Open Image que tienen licencia de Google LLC bajo la licencia CC BY 4.0. Las imágenes figuran con una licencia CC BY 2.0. Nota de Open Images: "si bien intentamos identificar imágenes con licencia Creative Commons Attribution, no hacemos representaciones ni garantías con respecto al estado de la licencia de cada imagen y usted debe verificar la licencia de cada imagen usted mismo".

Dividir Ejemplos
'test' 55.763
'train_large' 5.760.428
'train_quality' 1.248.230
'validation' 18.582
  • Estructura de características :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
edad_desconocida Etiqueta de clase int64
parte_del_cuerpo Etiqueta de clase int64
brillante Etiqueta de clase int64
oscuro Etiqueta de clase int64
representación Etiqueta de clase int64
lejos Etiqueta de clase int64
Nombre del archivo Texto cadena
género_desconocido Etiqueta de clase int64
imagen Imagen (Ninguno, Ninguno, 3) uint8
media_distancia Etiqueta de clase int64
mediana edad Etiqueta de clase int64
cerca Etiqueta de clase int64
representación_no-persona Etiqueta de clase int64
no persona_no-representación Etiqueta de clase int64
iluminación_normal Etiqueta de clase int64
más viejo Etiqueta de clase int64
persona Etiqueta de clase int64
representación_persona Etiqueta de clase int64
predominantemente_femenina Etiqueta de clase int64
predominantemente_masculino Etiqueta de clase int64
joven Etiqueta de clase int64

Visualización

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}