- বর্ণনা :
এই ডেটাসেটে ILSVRC-2012 (ImageNet) ভ্যালিডেশন ইমেজ রয়েছে যা "ইমেজনেটে মেশিনের নির্ভুলতার মূল্যায়ন" , ICML, 2020 থেকে বহু-শ্রেণীর লেবেল সহ টীকা করা হয়েছে। মাল্টি-ক্লাস লেবেলগুলি বিশেষজ্ঞদের একটি প্যানেল দ্বারা পর্যালোচনা করা হয়েছে যারা সূক্ষ্ম-বিদ্যায় ব্যাপকভাবে প্রশিক্ষিত। ইমেজনেট শ্রেণির শ্রেণিবিন্যাসে দানাদার শ্রেণির পার্থক্য (আরো বিশদ বিবরণের জন্য কাগজ দেখুন)। মূল লেবেলগুলির তুলনায়, এই বিশেষজ্ঞ-পর্যালোচিত বহু-শ্রেণীর লেবেলগুলি নির্ভুলতার আরও শব্দার্থগতভাবে সুসংগত মূল্যায়ন সক্ষম করে৷
এই ডেটাসেটের সংস্করণ 3.0.0-এ আরও সংশোধন করা লেবেল রয়েছে "কখন ময়দা একটি ব্যাগেল হয়ে যায়? ImageNet-এর সাথে সাথে ImageNet-Major (ImageNet-M) 68-উদাহরণ বিভক্ত 'imagenet-m'-এর অধীনে অবশিষ্ট ভুলগুলি বিশ্লেষণ করে ৷
50,000 ইমেজনেট বৈধতা চিত্রের মধ্যে মাত্র 20,000টিতে বহু-লেবেল টীকা রয়েছে। মাল্টি-লেবেলের সেটটি প্রথমে 67টি প্রশিক্ষিত ইমেজনেট মডেলের একটি টেস্টবেড দ্বারা তৈরি করা হয়েছিল, এবং তারপরে প্রতিটি পৃথক মডেলের ভবিষ্যদ্বাণী বিশেষজ্ঞদের দ্বারা ম্যানুয়ালি টীকা করা হয়েছিল যেমন হয় correct
(চিত্রের জন্য লেবেলটি সঠিক), wrong
(লেবেলটি ভুল চিত্র), বা unclear
(বিশেষজ্ঞদের মধ্যে কোন ঐকমত্য পৌঁছেনি)।
উপরন্তু, টীকা করার সময়, বিশেষজ্ঞ প্যানেল সমস্যাযুক্ত চিত্রগুলির একটি সেট চিহ্নিত করেছে৷ একটি চিত্র সমস্যাযুক্ত ছিল যদি এটি নীচের কোন মানদণ্ড পূরণ করে:
- আসল ইমেজনেট লেবেল (শীর্ষ-1 লেবেল) ভুল বা অস্পষ্ট ছিল
- ইমেজ ছিল একটি অঙ্কন, পেইন্টিং, স্কেচ, কার্টুন, বা কম্পিউটার-রেন্ডার করা
- ছবি অত্যধিক সম্পাদনা করা হয়েছে
- ছবিতে অনুপযুক্ত বিষয়বস্তু ছিল
সমস্যাযুক্ত ছবিগুলি এই ডেটাসেটে অন্তর্ভুক্ত করা হয়েছে কিন্তু মাল্টি-লেবেল নির্ভুলতা গণনা করার সময় উপেক্ষা করা উচিত। অতিরিক্তভাবে, যেহেতু 20,000 টি টীকাগুলির প্রাথমিক সেটটি শ্রেণী-ভারসাম্যপূর্ণ, কিন্তু সমস্যাযুক্ত চিত্রগুলির সেটটি নয়, তাই আমরা প্রতি-শ্রেণীর নির্ভুলতা গণনা করার এবং তারপরে তাদের গড় করার পরামর্শ দিই। আমরা একটি ভবিষ্যদ্বাণীকে সঠিক হিসাবে গণনা করার পরামর্শ দিই যদি এটি সঠিক বা অস্পষ্ট হিসাবে চিহ্নিত করা হয় (অর্থাৎ, অস্পষ্ট লেবেলগুলির সাথে নম্র হওয়া)।
এটি করার একটি সম্ভাব্য উপায় হল নিম্নলিখিত NumPy কোডের সাথে:
import tensorflow_datasets as tfds
ds = tfds.load('imagenet2012_multilabel', split='validation')
# We assume that predictions is a dictionary from file_name to a class index between 0 and 999
num_correct_per_class = {}
num_images_per_class = {}
for example in ds:
# We ignore all problematic images
if example[‘is_problematic’].numpy():
continue
# The label of the image in ImageNet
cur_class = example['original_label'].numpy()
# If we haven't processed this class yet, set the counters to 0
if cur_class not in num_correct_per_class:
num_correct_per_class[cur_class] = 0
assert cur_class not in num_images_per_class
num_images_per_class[cur_class] = 0
num_images_per_class[cur_class] += 1
# Get the predictions for this image
cur_pred = predictions[example['file_name'].numpy()]
# We count a prediction as correct if it is marked as correct or unclear
# (i.e., we are lenient with the unclear labels)
if cur_pred is in example['correct_multi_labels'].numpy() or cur_pred is in example['unclear_multi_labels'].numpy():
num_correct_per_class[cur_class] += 1
# Check that we have collected accuracy data for each of the 1,000 classes
num_classes = 1000
assert len(num_correct_per_class) == num_classes
assert len(num_images_per_class) == num_classes
# Compute the per-class accuracies and then average them
final_avg = 0
for cid in range(num_classes):
assert cid in num_correct_per_class
assert cid in num_images_per_class
final_avg += num_correct_per_class[cid] / num_images_per_class[cid]
final_avg /= num_classes
হোমপেজ : https://github.com/modestyachts/evaluating_machine_accuracy_on_imagenet
সোর্স কোড :
tfds.datasets.imagenet2012_multilabel.Builder
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
2.0.0
: স্থির ILSVRC2012_img_val.tar ফাইল। -
3.0.0
(ডিফল্ট): সঠিক লেবেল এবং ImageNet-M বিভক্ত।
-
ডাউনলোড সাইজ :
191.13 MiB
ডেটাসেটের আকার :
2.50 GiB
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে
download_config.manual_dir
এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে (~/tensorflow_datasets/downloads/manual/
এ ডিফল্ট):
manual_dir-এILSVRC2012_img_val.tar
ফাইল থাকা উচিত। ডেটাসেট ডাউনলোড করার লিঙ্ক পেতে আপনাকে http://www.image-net.org/download-images- এ নিবন্ধন করতে হবে।স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'imagenet_m' | 68 |
'validation' | 20,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'correct_multi_labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'is_problematic': bool,
'original_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
'unclear_multi_labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
'wrong_multi_labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
সঠিক_মাল্টি_লেবেল | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
ফাইল_নাম | পাঠ্য | স্ট্রিং | ||
ইমেজ | ছবি | (কোনটিই নয়, 3) | uint8 | |
সমস্যাযুক্ত | টেনসর | bool | ||
মূল_লেবেল | ক্লাসলেবেল | int64 | ||
অস্পষ্ট_মাল্টি_লেবেল | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
ভুল_মাল্টি_লেবেল | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 |
তত্ত্বাবধান করা কী (দেখুন_তত্ত্বাবধানকৃত ডক
as_supervised
):('image', 'correct_multi_labels')
চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{shankar2019evaluating,
title={Evaluating Machine Accuracy on ImageNet},
author={Vaishaal Shankar* and Rebecca Roelofs* and Horia Mania and Alex Fang and Benjamin Recht and Ludwig Schmidt},
journal={ICML},
year={2020},
note={\url{http://proceedings.mlr.press/v119/shankar20c.html} }
}
@article{ImageNetChallenge,
title={ {ImageNet} large scale visual recognition challenge},
author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause
and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and
Alexander C. Berg and Fei-Fei Li},
journal={International Journal of Computer Vision},
year={2015},
note={\url{https://arxiv.org/abs/1409.0575} }
}
@inproceedings{ImageNet,
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={Conference on Computer Vision and Pattern Recognition (CVPR)},
title={ {ImageNet}: A large-scale hierarchical image database},
year={2009},
note={\url{http://www.image-net.org/papers/imagenet_cvpr09.pdf} }
}
@article{vasudevan2022does,
title={When does dough become a bagel? Analyzing the remaining mistakes on ImageNet},
author={Vasudevan, Vijay and Caine, Benjamin and Gontijo-Lopes, Raphael and Fridovich-Keil, Sara and Roelofs, Rebecca},
journal={arXiv preprint arXiv:2205.04596},
year={2022}
}