- বর্ণনা :
স্থানের ডেটাসেটটি মানুষের চাক্ষুষ জ্ঞানের নীতি অনুসরণ করে ডিজাইন করা হয়েছে। আমাদের লক্ষ্য হল ভিজ্যুয়াল জ্ঞানের একটি মূল তৈরি করা যা উচ্চ-স্তরের ভিজ্যুয়াল বোঝার কাজগুলির জন্য কৃত্রিম সিস্টেমগুলিকে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে, যেমন দৃশ্যের প্রসঙ্গ, বস্তুর স্বীকৃতি, ক্রিয়া এবং ঘটনার পূর্বাভাস এবং তত্ত্ব-অব-মনের অনুমান।
স্থানগুলির শব্দার্থগত বিভাগগুলি তাদের ফাংশন দ্বারা সংজ্ঞায়িত করা হয়: লেবেলগুলি পরিবেশের প্রবেশ-স্তরের প্রতিনিধিত্ব করে। ব্যাখ্যা করার জন্য, ডেটাসেটের বিভিন্ন শ্রেণীর শয়নকক্ষ, বা রাস্তা ইত্যাদি রয়েছে, কারণ কেউ একইভাবে কাজ করে না এবং বাড়ির বেডরুমে, হোটেলের বেডরুমে বা নার্সারিতে কী ঘটতে পারে তার একই ভবিষ্যদ্বাণী করে না। মোট, স্থানগুলিতে 400+ অনন্য দৃশ্য বিভাগ সমন্বিত 10 মিলিয়নেরও বেশি চিত্র রয়েছে৷ ডেটাসেটটিতে প্রতি শ্রেণীতে 5000 থেকে 30,000টি প্রশিক্ষণ চিত্র রয়েছে, যা বাস্তব-বিশ্বের সংঘটনের ফ্রিকোয়েন্সির সাথে সামঞ্জস্যপূর্ণ। কনভোল্যুশনাল নিউরাল নেটওয়ার্ক (CNN) ব্যবহার করে, স্থানের ডেটাসেট দৃশ্য-কেন্দ্রিক বেঞ্চমার্কে নতুন অত্যাধুনিক পারফরম্যান্স স্থাপনের লক্ষ্যে বিভিন্ন দৃশ্য শনাক্তকরণ কাজের জন্য গভীর দৃশ্যের বৈশিষ্ট্যগুলি শেখার অনুমতি দেয়।
এখানে আমরা একাডেমিক গবেষণা এবং শিক্ষার উদ্দেশ্যে স্থান ডেটাবেস এবং প্রশিক্ষিত CNN প্রদান করি।
হোমপেজ : http://places2.csail.mit.edu/
সোর্স কোড :
tfds.datasets.placesfull.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড আকার :
143.56 GiB
ডেটাসেটের আকার :
136.56 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 10,653,087 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
ফাইলের নাম | পাঠ্য | স্ট্রিং | ||
ইমেজ | ছবি | (256, 256, 3) | uint8 | |
লেবেল | ক্লাসলেবেল | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('image', 'label', 'filename')
চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{zhou2017places,
title={Places: A 10 million Image Database for Scene Recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2017},
publisher={IEEE}
}