স্থানপূর্ণ

  • বর্ণনা :

স্থানের ডেটাসেটটি মানুষের চাক্ষুষ জ্ঞানের নীতি অনুসরণ করে ডিজাইন করা হয়েছে। আমাদের লক্ষ্য হল ভিজ্যুয়াল জ্ঞানের একটি মূল তৈরি করা যা উচ্চ-স্তরের ভিজ্যুয়াল বোঝার কাজগুলির জন্য কৃত্রিম সিস্টেমগুলিকে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে, যেমন দৃশ্যের প্রসঙ্গ, বস্তুর স্বীকৃতি, ক্রিয়া এবং ঘটনার পূর্বাভাস এবং তত্ত্ব-অব-মনের অনুমান।

স্থানগুলির শব্দার্থগত বিভাগগুলি তাদের ফাংশন দ্বারা সংজ্ঞায়িত করা হয়: লেবেলগুলি পরিবেশের প্রবেশ-স্তরের প্রতিনিধিত্ব করে। ব্যাখ্যা করার জন্য, ডেটাসেটের বিভিন্ন শ্রেণীর শয়নকক্ষ, বা রাস্তা ইত্যাদি রয়েছে, কারণ কেউ একইভাবে কাজ করে না এবং বাড়ির বেডরুমে, হোটেলের বেডরুমে বা নার্সারিতে কী ঘটতে পারে তার একই ভবিষ্যদ্বাণী করে না। মোট, স্থানগুলিতে 400+ অনন্য দৃশ্য বিভাগ সমন্বিত 10 মিলিয়নেরও বেশি চিত্র রয়েছে৷ ডেটাসেটটিতে প্রতি শ্রেণীতে 5000 থেকে 30,000টি প্রশিক্ষণ চিত্র রয়েছে, যা বাস্তব-বিশ্বের সংঘটনের ফ্রিকোয়েন্সির সাথে সামঞ্জস্যপূর্ণ। কনভোল্যুশনাল নিউরাল নেটওয়ার্ক (CNN) ব্যবহার করে, স্থানের ডেটাসেট দৃশ্য-কেন্দ্রিক বেঞ্চমার্কে নতুন অত্যাধুনিক পারফরম্যান্স স্থাপনের লক্ষ্যে বিভিন্ন দৃশ্য শনাক্তকরণ কাজের জন্য গভীর দৃশ্যের বৈশিষ্ট্যগুলি শেখার অনুমতি দেয়।

এখানে আমরা একাডেমিক গবেষণা এবং শিক্ষার উদ্দেশ্যে স্থান ডেটাবেস এবং প্রশিক্ষিত CNN প্রদান করি।

বিভক্ত উদাহরণ
'train' 10,653,087
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ফাইলের নাম পাঠ্য স্ট্রিং
ইমেজ ছবি (256, 256, 3) uint8
লেবেল ক্লাসলেবেল int64

ভিজ্যুয়ালাইজেশন

  • উদ্ধৃতি :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}