- বর্ণনা :
CIFAR-10.1 ডেটাসেট হল CIFAR-10-এর জন্য একটি নতুন পরীক্ষা সেট। CIFAR-10.1-এ মোটামুটি 2,000টি নতুন পরীক্ষার ছবি রয়েছে যেগুলি মূল CIFAR-10 ডেটাসেটের উপর বহু বছরের গবেষণার পরে নমুনা করা হয়েছিল। CIFAR-10.1-এর ডেটা সংগ্রহ মূল ডেটাসেটের তুলনায় বন্টন স্থানান্তর কমানোর জন্য ডিজাইন করা হয়েছিল। আমরা কাগজে CIFAR-10.1 তৈরির বর্ণনা দিই "CIFAR-10 ক্লাসিফায়ারগুলি কি CIFAR-10-এ সাধারণীকরণ করে?"। CIFAR-10.1-এর ছবিগুলি হল TinyImages ডেটাসেটের একটি উপসেট। বর্তমানে CIFAR-10.1 ডেটাসেটের দুটি সংস্করণ রয়েছে: v4 এবং v6৷
সোর্স কোড :
tfds.image_classification.Cifar10_1
সংস্করণ :
-
1.1.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বৈশিষ্ট্য গঠন :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
ইমেজ | ছবি | (৩২, ৩২, ৩) | uint8 | |
লেবেল | ক্লাসলেবেল | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('image', 'label')
উদ্ধৃতি :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : এটি আমাদের ডেটাসেটের প্রথম সংস্করণ যার উপর আমরা কোনো ক্লাসিফায়ার পরীক্ষা করেছি। উপরে উল্লিখিত হিসাবে, এটি v4 ডেটাসেটকে আমাদের মূল্যায়ন করা ক্লাসিফায়ারের থেকে স্বাধীন করে তোলে। আমাদের কাগজের প্রধান বিভাগে রিপোর্ট করা সংখ্যাগুলি ডেটাসেটের এই সংস্করণটি ব্যবহার করে। এটি প্রতিটি ক্লাসের জন্য শীর্ষ 25 টি টিনিইমেজ কীওয়ার্ড থেকে তৈরি করা হয়েছিল, যা একটি সামান্য শ্রেণী ভারসাম্যহীনতার দিকে পরিচালিত করেছিল। সবচেয়ে বড় পার্থক্য হল যে জাহাজগুলি 10% এর পরিবর্তে পরীক্ষা সেটের মাত্র 8% তৈরি করে। v4 তে 2,021টি ছবি রয়েছে।
ডাউনলোড সাইজ :
5.93 MiB
ডেটাসেটের আকার :
4.46 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,021 |
- চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):
cifar10_1/v6
কনফিগার বর্ণনা : এটি একটি সামান্য উন্নত কীওয়ার্ড বরাদ্দ থেকে উদ্ভূত যা ঠিক শ্রেণী ভারসাম্যপূর্ণ। ডেটাসেটের এই সংস্করণটি আমাদের কাগজের পরিশিষ্ট D-এর ফলাফলের সাথে মিলে যায়। v6 তে 2,000টি ছবি রয়েছে।
ডাউনলোড সাইজ :
5.87 MiB
ডেটাসেটের আকার :
4.40 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 2,000 |
- চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):