- وصف :
Wake Vision عبارة عن مجموعة بيانات كبيرة وعالية الجودة تضم أكثر من 6 ملايين صورة، وهو ما يتجاوز بشكل كبير حجم وتنوع مجموعات بيانات tinyML الحالية (100x). تتضمن مجموعة البيانات هذه صورًا مع تعليقات توضيحية حول ما إذا كانت كل صورة تحتوي على شخص ما. بالإضافة إلى ذلك، فهو يتضمن معيارًا شاملاً ودقيقًا لتقييم العدالة والقوة، ويغطي الجنس المدرك، والعمر المتصور، ومسافة الهدف، وظروف الإضاءة، والصور. ملصقات Wake Vision مشتقة من تعليقات Open Image المرخصة من شركة Google LLC بموجب ترخيص CC BY 4.0. تم إدراج الصور على أنها تحتوي على ترخيص CC BY 2.0. ملاحظة من Open Images: "بينما حاولنا تحديد الصور المرخصة بموجب ترخيص Creative Commons Attribution، فإننا لا نقدم أي تعهدات أو ضمانات فيما يتعلق بحالة ترخيص كل صورة ويجب عليك التحقق من ترخيص كل صورة بنفسك."
الصفحة الرئيسية : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
كود المصدر :
tfds.datasets.wake_vision.Builder
الإصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي لمجموعات بيانات TensorFlow. لاحظ أن هذا يعتمد على الإصدار 2.0 من Wake Vision على Harvard Dataverse.
-
حجم التحميل :
Unknown size
حجم مجموعة البيانات :
Unknown size
التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الإنشقاقات :
ينقسم | أمثلة |
---|
- هيكل الميزة :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
age_unknown | ClassLabel | int64 | ||
body_part | ClassLabel | int64 | ||
ساطع | ClassLabel | int64 | ||
مظلم | ClassLabel | int64 | ||
تصوير | ClassLabel | int64 | ||
بعيد | ClassLabel | int64 | ||
اسم الملف | نص | خيط | ||
الجنس_غير معروف | ClassLabel | int64 | ||
صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | |
Medium_distance | ClassLabel | int64 | ||
middle_age | ClassLabel | int64 | ||
قريب | ClassLabel | int64 | ||
تصوير غير شخصي | ClassLabel | int64 | ||
غير شخص_غير تصوير | ClassLabel | int64 | ||
Normal_lighting | ClassLabel | int64 | ||
كبار السن | ClassLabel | int64 | ||
شخص | ClassLabel | int64 | ||
person_depiction | ClassLabel | int64 | ||
في الغالب_أنثى | ClassLabel | int64 | ||
في الغالب_ذكر | ClassLabel | int64 | ||
شاب | ClassLabel | كثافة العمليات64 |
المفاتيح الخاضعة للإشراف (انظر
as_supervised
doc ):('image', 'person')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}