imagenet2012_fewshot

  • বর্ণনা :

Imagenet2012Fewshot হল মূল ImageNet ILSVRC 2012 ডেটাসেটের একটি উপসেট। ডেটাসেটটি মূল ImageNet ILSVRC 2012 ডেটাসেটের মতো একই বৈধতা সেট শেয়ার করে৷ যাইহোক, প্রশিক্ষণ সেট একটি লেবেল সুষম ফ্যাশন সাবস্যাম্পল করা হয়. 5shot কনফিগারেশনে, প্রতি লেবেলে 5টি ছবি, বা 5000টি ছবি নমুনা করা হয়; এবং 10shot কনফিগারেশনে, প্রতি লেবেলে 10টি ছবি বা 10000টি ছবি নমুনা করা হয়।

  • হোমপেজ : http://image-net.org/

  • সোর্স কোড : tfds.datasets.imagenet2012_fewshot.Builder

  • সংস্করণ :

    • 2.0.0 : বৈধতা লেবেল ঠিক করুন।
    • 2.0.1 : এনকোডিং ফিক্স। ব্যবহারকারীর দৃষ্টিকোণ থেকে কোন পরিবর্তন নেই।
    • 3.0.0 : ~12 ইমেজ (CMYK -> RGB) এর কালারাইজেশন ঠিক করুন। সামঞ্জস্যের জন্য বিন্যাস ঠিক করুন (একক পিএনজি চিত্রকে Jpeg এ রূপান্তর করুন)। আর্কাইভ থেকে সরাসরি প্রজন্মের দ্রুত পড়া।

    • 4.0.0 : (অপ্রকাশিত)

    • 5.0.0 : নতুন স্প্লিট API ( https://tensorflow.org/datasets/splits )

    • 5.0.1 (ডিফল্ট): কোনো রিলিজ নোট নেই।

    • 5.1.0 : টেস্ট স্প্লিট যোগ করা হয়েছে।

  • ডাউনলোড আকার : Unknown size

  • ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে download_config.manual_dir এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে ( ~/tensorflow_datasets/downloads/manual/ এ ডিফল্ট):
    manual_dir-এ দুটি ফাইল থাকা উচিত: ILSVRC2012_img_train.tar এবং ILSVRC2012_img_val.tar। ডেটাসেট ডাউনলোড করার লিঙ্ক পেতে আপনাকে https://image-net.org/download-images- এ নিবন্ধন করতে হবে।

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বৈশিষ্ট্য গঠন :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ফাইল_নাম পাঠ্য স্ট্রিং
ইমেজ ছবি (কোনটিই নয়, 3) uint8
লেবেল ক্লাসলেবেল int64
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): ('image', 'label')

  • উদ্ধৃতি :

@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_fewshot/1shot (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : মোট ইমেজনেট প্রশিক্ষণ সেটের 1 শট।

  • ডেটাসেটের আকার : 6.46 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000
'tune' 1,000
'validation' 50,000

ভিজ্যুয়ালাইজেশন

imagenet2012_fewshot/5shot

  • কনফিগারেশনের বিবরণ : মোট ইমেজনেট প্রশিক্ষণ সেটের 5 শট।

  • ডেটাসেটের আকার : 6.88 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 5,000
'tune' 1,000
'validation' 50,000

ভিজ্যুয়ালাইজেশন

imagenet2012_fewshot/10shot

  • কনফিগার বিবরণ : মোট ইমেজনেট প্রশিক্ষণ সেটের 10 শট।

  • ডেটাসেটের আকার : 7.42 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 10,000
'tune' 1,000
'validation' 50,000

ভিজ্যুয়ালাইজেশন