- বর্ণনা :
ওয়েক ভিশন হল একটি বড়, উচ্চ-মানের ডেটাসেট যা 6 মিলিয়নেরও বেশি ছবি সমন্বিত করে, যা বর্তমান টিনিএমএল ডেটাসেটের (100x) স্কেল এবং বৈচিত্র্যকে উল্লেখযোগ্যভাবে অতিক্রম করে। এই ডেটাসেটে প্রতিটি ছবিতে একজন ব্যক্তি আছে কিনা তার টীকা সহ ছবি অন্তর্ভুক্ত করে। উপরন্তু, এটি ন্যায্যতা এবং দৃঢ়তা মূল্যায়ন করার জন্য একটি ব্যাপক সূক্ষ্ম-দানাযুক্ত বেঞ্চমার্ক অন্তর্ভুক্ত করে, অনুভূত লিঙ্গ, অনুভূত বয়স, বিষয়ের দূরত্ব, আলোর অবস্থা এবং চিত্রণগুলিকে কভার করে। ওয়েক ভিশন লেবেলগুলি ওপেন ইমেজের টীকা থেকে নেওয়া হয়েছে যা CC BY 4.0 লাইসেন্সের অধীনে Google LLC দ্বারা লাইসেন্সপ্রাপ্ত৷ ছবিগুলিকে একটি CC BY 2.0 লাইসেন্স আছে বলে তালিকাভুক্ত করা হয়েছে৷ ওপেন ইমেজ থেকে দ্রষ্টব্য: "যদিও আমরা ক্রিয়েটিভ কমন্স অ্যাট্রিবিউশন লাইসেন্সের অধীনে লাইসেন্সপ্রাপ্ত ছবিগুলি সনাক্ত করার চেষ্টা করেছি, আমরা প্রতিটি ছবির লাইসেন্সের স্থিতির বিষয়ে কোনও উপস্থাপনা বা ওয়ারেন্টি দিই না এবং প্রতিটি ছবির লাইসেন্স আপনার নিজেরই যাচাই করা উচিত।"
হোমপেজ : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
সোর্স কোড :
tfds.datasets.wake_vision.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক টেনসরফ্লো ডেটাসেট প্রকাশ। মনে রাখবেন যে এটি হার্ভার্ড ডেটাভার্সে ওয়েক ভিশনের 2.0 সংস্করণের উপর ভিত্তি করে তৈরি।
-
ডাউনলোড আকার :
Unknown size
ডেটাসেটের আকার :
239.25 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 55,763 |
'train_large' | 5,760,428 |
'train_quality' | 1,248,230 |
'validation' | 18,582 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
বয়স_অজানা | ক্লাসলেবেল | int64 | ||
শরীরের_অংশ | ক্লাসলেবেল | int64 | ||
উজ্জ্বল | ক্লাসলেবেল | int64 | ||
অন্ধকার | ক্লাসলেবেল | int64 | ||
চিত্রণ | ক্লাসলেবেল | int64 | ||
দূরে | ক্লাসলেবেল | int64 | ||
ফাইলের নাম | পাঠ্য | স্ট্রিং | ||
লিঙ্গ_অজানা | ক্লাসলেবেল | int64 | ||
ইমেজ | ছবি | (কোনটিই নয়, 3) | uint8 | |
মধ্যম_দূরত্ব | ক্লাসলেবেল | int64 | ||
মধ্য_বয়স | ক্লাসলেবেল | int64 | ||
কাছাকাছি | ক্লাসলেবেল | int64 | ||
অ-ব্যক্তি_চিত্র | ক্লাসলেবেল | int64 | ||
অ-ব্যক্তি_অ-চিত্রণ | ক্লাসলেবেল | int64 | ||
স্বাভাবিক_আলো | ক্লাসলেবেল | int64 | ||
পুরোনো | ক্লাসলেবেল | int64 | ||
ব্যক্তি | ক্লাসলেবেল | int64 | ||
ব্যক্তি_চিত্র | ক্লাসলেবেল | int64 | ||
predominantly_female | ক্লাসলেবেল | int64 | ||
প্রধানত_পুরুষ | ক্লাসলেবেল | int64 | ||
তরুণ | ক্লাসলেবেল | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('image', 'person')
চিত্র ( tfds.show_examples ):
উদাহরণ ( tfds.as_dataframe ): অনুপস্থিত।
উদ্ধৃতি :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}