- الوصف :
تم تصميم مجموعة بيانات الأماكن وفقًا لمبادئ الإدراك البصري البشري. هدفنا هو بناء جوهر المعرفة المرئية التي يمكن استخدامها لتدريب الأنظمة الاصطناعية على مهام الفهم البصري عالية المستوى ، مثل سياق المشهد ، والتعرف على الأشياء ، والتنبؤ بالأحداث والأحداث ، واستنتاج نظرية العقل.
يتم تحديد الفئات الدلالية للأماكن من خلال وظيفتها: تمثل الملصقات مستوى دخول البيئة. للتوضيح ، تحتوي مجموعة البيانات على فئات مختلفة من غرف النوم ، أو الشوارع ، وما إلى ذلك ، حيث لا يتصرف المرء بنفس الطريقة ، ولا يقدم نفس التنبؤات لما يمكن أن يحدث بعد ذلك ، في غرفة نوم منزلية أو غرفة نوم فندق أو حضانة. في المجموع ، تحتوي الأماكن على أكثر من 10 ملايين صورة تضم أكثر من 400 فئة فريدة للمشهد. تحتوي مجموعة البيانات على 5000 إلى 30000 صورة تدريب لكل فصل ، بما يتوافق مع الترددات الواقعية للوقوع. باستخدام الشبكات العصبية التلافيفية (CNN) ، تتيح مجموعة بيانات الأماكن تعلم ميزات المشهد العميق لمختلف مهام التعرف على المشهد ، بهدف إنشاء عروض جديدة على أحدث طراز على معايير تتمحور حول المشهد.
نقدم هنا قاعدة بيانات الأماكن وشبكات CNN المدربة لأغراض البحث الأكاديمي والتعليم.
الصفحة الرئيسية : http://places2.csail.mit.edu/
كود المصدر :
tfds.datasets.placesfull.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
143.56 GiB
حجم مجموعة البيانات :
136.56 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'train' | 10653.087 |
- هيكل الميزة :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
اسم الملف | نص | سلسلة | ||
صورة | صورة | (256 ، 256 ، 3) | uint8 | |
ضع الكلمة المناسبة | ClassLabel | int64 |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('image', 'label', 'filename')
الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@article{zhou2017places,
title={Places: A 10 million Image Database for Scene Recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2017},
publisher={IEEE}
}