प्लेसफुल

  • विवरण :

स्थान डेटासेट को मानव दृश्य अनुभूति के सिद्धांतों का पालन करते हुए डिज़ाइन किया गया है। हमारा लक्ष्य दृश्य ज्ञान का एक मूल निर्माण करना है जिसका उपयोग उच्च-स्तरीय दृश्य समझ कार्यों के लिए कृत्रिम प्रणालियों को प्रशिक्षित करने के लिए किया जा सकता है, जैसे दृश्य संदर्भ, वस्तु पहचान, क्रिया और घटना की भविष्यवाणी, और सिद्धांत-के-दिमाग अनुमान।

स्थानों की सिमेंटिक श्रेणियां उनके कार्य द्वारा परिभाषित की जाती हैं: लेबल एक परिवेश के प्रवेश-स्तर का प्रतिनिधित्व करते हैं। उदाहरण के लिए, डेटासेट में बेडरूम, या सड़कों आदि की अलग-अलग श्रेणियां होती हैं, क्योंकि कोई एक ही तरह से कार्य नहीं करता है, और घर के बेडरूम, होटल के बेडरूम या नर्सरी में आगे क्या हो सकता है, इसकी भविष्यवाणी नहीं करता है। कुल मिलाकर, स्थानों में 400+ अद्वितीय दृश्य श्रेणियों वाली 10 मिलियन से अधिक छवियां हैं। डेटासेट में प्रति वर्ग 5000 से 30,000 प्रशिक्षण छवियां होती हैं, जो घटना की वास्तविक दुनिया की आवृत्तियों के अनुरूप होती हैं। दृढ़ तंत्रिका नेटवर्क (सीएनएन) का उपयोग करते हुए, स्थान डेटासेट दृश्य-केंद्रित बेंचमार्क पर नए अत्याधुनिक प्रदर्शन स्थापित करने के लक्ष्य के साथ विभिन्न दृश्य पहचान कार्यों के लिए गहरे दृश्य सुविधाओं को सीखने की अनुमति देता है।

यहां हम शैक्षिक अनुसंधान और शिक्षा के उद्देश्यों के लिए स्थान डेटाबेस और प्रशिक्षित सीएनएन प्रदान करते हैं।

विभाजित करना उदाहरण
'train' 10,653,087
  • फ़ीचर संरचना :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
फ़ाइल का नाम मूलपाठ डोरी
छवि छवि (256, 256, 3) uint8
लेबल क्लासलेबल int64

VISUALIZATION

  • उद्धरण :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}