- বর্ণনা :
ILSVRC 2012, সাধারণত 'ImageNet' নামে পরিচিত একটি ইমেজ ডেটাসেট WordNet শ্রেণীবিন্যাস অনুসারে সংগঠিত৷ WordNet-এ প্রতিটি অর্থপূর্ণ ধারণা, সম্ভবত একাধিক শব্দ বা শব্দ বাক্যাংশ দ্বারা বর্ণিত, একটি "সমার্থক সেট" বা "সিনসেট" বলা হয়। WordNet-এ 100,000 টিরও বেশি সিসেট রয়েছে, তাদের বেশিরভাগই বিশেষ্য (80,000+)। ImageNet-এ, আমরা প্রতিটি সিন্সেটকে চিত্রিত করার জন্য গড়ে 1000টি ছবি প্রদান করার লক্ষ্য রাখি। প্রতিটি ধারণার ছবি মান-নিয়ন্ত্রিত এবং মানব-টীকাযুক্ত। এর সমাপ্তিতে, আমরা আশা করি ইমেজনেট WordNet অনুক্রমের বেশিরভাগ ধারণার জন্য লক্ষ লক্ষ পরিষ্কারভাবে সাজানো ছবি অফার করবে।
টেস্ট স্প্লিটে 100K ছবি রয়েছে কিন্তু কোনো লেবেল নেই কারণ কোনো লেবেল সর্বজনীনভাবে প্রকাশ করা হয়নি। আমরা 2012 থেকে 10 অক্টোবর, 2019-এ প্রকাশিত ছোটখাট প্যাচের সাথে পরীক্ষা বিভক্ত করার জন্য সমর্থন প্রদান করি। এই ডেটা ম্যানুয়ালি ডাউনলোড করার জন্য, একজন ব্যবহারকারীকে নিম্নলিখিত ক্রিয়াকলাপগুলি সম্পাদন করতে হবে:
- এখানে উপলব্ধ 2012 টেস্ট স্প্লিট ডাউনলোড করুন।
- অক্টোবর 10, 2019 প্যাচ ডাউনলোড করুন। একই পৃষ্ঠায় দেওয়া প্যাচটিতে একটি Google ড্রাইভ লিঙ্ক রয়েছে।
- দুটি টার-বল একত্রিত করুন, ম্যানুয়ালি মূল আর্কাইভের যেকোনো ছবিকে প্যাচের ছবি দিয়ে ওভাররাইট করুন। image-net.org-এর নির্দেশাবলী অনুসারে, এই পদ্ধতিটি মাত্র কয়েকটি ছবি ওভাররাইট করে।
ফলে টার-বল টিএফডিএস দ্বারা প্রক্রিয়া করা হতে পারে।
ইমেজনেট টেস্ট স্প্লিটে একটি মডেলের নির্ভুলতা মূল্যায়ন করতে, একজনকে অবশ্যই বিভাজনের সমস্ত চিত্রের অনুমান চালাতে হবে, সেই ফলাফলগুলিকে একটি পাঠ্য ফাইলে রপ্তানি করতে হবে যা অবশ্যই ইমেজনেট মূল্যায়ন সার্ভারে আপলোড করতে হবে। ইমেজনেট মূল্যায়ন সার্ভারের রক্ষণাবেক্ষণকারীরা অতিরিক্ত ফিটিং প্রতিরোধ করার জন্য একজন একক ব্যবহারকারীকে প্রতি সপ্তাহে 2টি পর্যন্ত জমা দেওয়ার অনুমতি দেয়।
পরীক্ষার বিভাজনে নির্ভুলতা মূল্যায়ন করতে, একজনকে প্রথমে image-net.org এ একটি অ্যাকাউন্ট তৈরি করতে হবে। এই অ্যাকাউন্টটি অবশ্যই সাইট অ্যাডমিনিস্ট্রেটর দ্বারা অনুমোদিত হতে হবে। অ্যাকাউন্ট তৈরি হওয়ার পরে, কেউ https://image-net.org/challenges/LSVRC/eval_server.php- এ পরীক্ষার সার্ভারে ফলাফল জমা দিতে পারে জমাটি একাধিক কাজের সাথে সম্পর্কিত একাধিক ASCII পাঠ্য ফাইল নিয়ে গঠিত। আগ্রহের কাজটি হল "শ্রেণীবিন্যাস জমা দেওয়া (টপ-5 সিএলএস ত্রুটি)"। একটি রপ্তানি করা পাঠ্য ফাইলের একটি নমুনা নিম্নলিখিত মত দেখায়:
771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168
রপ্তানি বিন্যাসটি এখানে উপলব্ধ 2013 ডেভেলপমেন্ট কিটের মধ্যে "readme.txt" এ সম্পূর্ণ বর্ণনা করা হয়েছে: https://image-net.org/data/ILSVRC/2013/ILSVRC2013_devkit.tgz অনুগ্রহ করে "3.3 CLS-LOC" শিরোনামের বিভাগটি দেখুন জমা দেওয়ার বিন্যাস"। সংক্ষিপ্তভাবে, টেক্সট ফাইলের বিন্যাস হল 100,000 লাইন পরীক্ষা বিভাজনের প্রতিটি চিত্রের সাথে সম্পর্কিত। পূর্ণসংখ্যার প্রতিটি লাইন প্রতিটি পরীক্ষার চিত্রের জন্য শীর্ষ 5 ভবিষ্যদ্বাণী র্যাঙ্ক-অর্ডার-এর সাথে মিলে যায়। পূর্ণসংখ্যাগুলি সংশ্লিষ্ট লেবেল ফাইলের লাইন নম্বরের সাথে 1-সূচীযুক্ত। labels.txt দেখুন।
হোমপেজ : http://image-net.org/
সোর্স কোড :
tfds.datasets.imagenet2012_subset.Builder
সংস্করণ :
-
2.0.0
: বৈধতা লেবেল ঠিক করুন। -
2.0.1
: এনকোডিং ফিক্স। ব্যবহারকারীর দৃষ্টিকোণ থেকে কোন পরিবর্তন নেই। 3.0.0
: ~12 ইমেজ (CMYK -> RGB) এর কালারাইজেশন ঠিক করুন। সামঞ্জস্যের জন্য বিন্যাস ঠিক করুন (একক পিএনজি চিত্রকে Jpeg এ রূপান্তর করুন)। আর্কাইভ থেকে সরাসরি প্রজন্মের দ্রুত পড়া।4.0.0
: (অপ্রকাশিত)5.0.0
(ডিফল্ট): নতুন স্প্লিট API ( https://tensorflow.org/datasets/splits )5.1.0
: টেস্ট স্প্লিট যোগ করা হয়েছে।
-
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে
download_config.manual_dir
এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে (~/tensorflow_datasets/downloads/manual/
এ ডিফল্ট):
manual_dir-এ দুটি ফাইল থাকা উচিত: ILSVRC2012_img_train.tar এবং ILSVRC2012_img_val.tar। ডেটাসেট ডাউনলোড করার লিঙ্ক পেতে আপনাকে https://image-net.org/download-images- এ নিবন্ধন করতে হবে।স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বৈশিষ্ট্য গঠন :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
ফাইল_নাম | পাঠ্য | স্ট্রিং | ||
ইমেজ | ছবি | (কোনটিই নয়, 3) | uint8 | |
লেবেল | ক্লাসলেবেল | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('image', 'label')
উদ্ধৃতি :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (ডিফল্ট কনফিগারেশন)
কনফিগার বিবরণ : মোট ইমেজনেট প্রশিক্ষণ সেটের 1pct।
ডাউনলোড সাইজ :
254.22 KiB
ডেটাসেটের আকার :
7.61 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 12,811 |
'validation' | 50,000 |
- চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):
imagenet2012_subset/10pct
কনফিগারের বিবরণ : মোট ইমেজনেট প্রশিক্ষণ সেটের 10pct।
ডাউনলোড সাইজ :
2.48 MiB
ডেটাসেটের আকার :
19.91 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 128,116 |
'validation' | 50,000 |
- চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):