इमेजनेट2012

  • विवरण :

ILSVRC 2012, जिसे आमतौर पर 'इमेजनेट' के नाम से जाना जाता है, वर्डनेट पदानुक्रम के अनुसार व्यवस्थित एक छवि डेटासेट है। वर्डनेट में प्रत्येक सार्थक अवधारणा, जिसे संभवतः कई शब्दों या शब्द वाक्यांशों द्वारा वर्णित किया गया है, को "समानार्थी सेट" या "सिनसेट" कहा जाता है। वर्डनेट में 100,000 से अधिक सिनसेट हैं, उनमें से अधिकांश संज्ञा (80,000+) हैं। इमेजनेट में, हमारा लक्ष्य प्रत्येक सिंसेट को चित्रित करने के लिए औसतन 1000 छवियां प्रदान करना है। प्रत्येक अवधारणा की छवियां गुणवत्ता-नियंत्रित और मानव-एनोटेटेड हैं। इसके पूरा होने पर, हमें उम्मीद है कि इमेजनेट वर्डनेट पदानुक्रम में अधिकांश अवधारणाओं के लिए लाखों साफ-सुथरी क्रमबद्ध छवियां पेश करेगा।

परीक्षण विभाजन में 100K छवियां हैं लेकिन कोई लेबल नहीं है क्योंकि कोई भी लेबल सार्वजनिक रूप से जारी नहीं किया गया है। हम 10 अक्टूबर, 2019 को जारी मामूली पैच के साथ 2012 से परीक्षण विभाजन के लिए समर्थन प्रदान करते हैं। इस डेटा को मैन्युअल रूप से डाउनलोड करने के लिए, उपयोगकर्ता को निम्नलिखित ऑपरेशन करने होंगे:

  1. यहां उपलब्ध 2012 टेस्ट स्प्लिट डाउनलोड करें।
  2. 10 अक्टूबर 2019 पैच डाउनलोड करें। उसी पृष्ठ पर पैच के लिए एक Google ड्राइव लिंक दिया गया है।
  3. दो टार-बॉल को मिलाएं, मूल संग्रह में किसी भी छवि को पैच से छवियों के साथ मैन्युअल रूप से ओवरराइट करें। Image-net.org पर दिए गए निर्देशों के अनुसार, यह प्रक्रिया केवल कुछ छवियों को अधिलेखित करती है।

परिणामी टार-बॉल को टीएफडीएस द्वारा संसाधित किया जा सकता है।

इमेजनेट परीक्षण स्प्लिट पर एक मॉडल की सटीकता का आकलन करने के लिए, किसी को स्प्लिट में सभी छवियों पर अनुमान चलाना होगा, उन परिणामों को एक टेक्स्ट फ़ाइल में निर्यात करना होगा जिसे इमेजनेट मूल्यांकन सर्वर पर अपलोड किया जाना चाहिए। इमेजनेट मूल्यांकन सर्वर के अनुरक्षक ओवरफिटिंग को रोकने के लिए एक उपयोगकर्ता को प्रति सप्ताह 2 सबमिशन सबमिट करने की अनुमति देते हैं।

परीक्षण विभाजन पर सटीकता का मूल्यांकन करने के लिए, सबसे पहले image-net.org पर एक खाता बनाना होगा। यह खाता साइट व्यवस्थापक द्वारा अनुमोदित होना चाहिए. खाता बनने के बाद, कोई व्यक्ति https://image-net.org/challenges/LSVRC/eval_server.php पर परीक्षण सर्वर पर परिणाम सबमिट कर सकता है। सबमिशन में कई कार्यों के अनुरूप कई ASCII टेक्स्ट फ़ाइलें शामिल होती हैं। रुचि का कार्य "वर्गीकरण प्रस्तुत करना (शीर्ष-5 सीएलएस त्रुटि)" है। निर्यात की गई टेक्स्ट फ़ाइल का एक नमूना निम्न जैसा दिखता है:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

निर्यात प्रारूप यहां उपलब्ध 2013 विकास किट के भीतर "readme.txt" में पूर्ण रूप से वर्णित है: https://image-net.org/data/ILSVRC/2013/ILSVRC2013_devkit.tgz कृपया "3.3 CLS-LOC" शीर्षक वाला अनुभाग देखें सबमिशन प्रारूप"। संक्षेप में, पाठ फ़ाइल का प्रारूप परीक्षण विभाजन में प्रत्येक छवि के अनुरूप 100,000 पंक्तियाँ है। पूर्णांकों की प्रत्येक पंक्ति प्रत्येक परीक्षण छवि के लिए रैंक-क्रमबद्ध, शीर्ष 5 भविष्यवाणियों से मेल खाती है। पूर्णांक संबंधित लेबल फ़ाइल में पंक्ति संख्या के अनुरूप 1-अनुक्रमित हैं। लेबल्स.txt देखें.

  • अतिरिक्त दस्तावेज़ीकरण : कोड वाले कागजात पर अन्वेषण करें

  • मुखपृष्ठ : https://image-net.org/

  • स्रोत कोड : tfds.datasets.imagenet2012.Builder

  • संस्करण :

    • 2.0.0 : सत्यापन लेबल ठीक करें।
    • 2.0.1 : एन्कोडिंग ठीक करें। उपयोगकर्ता के दृष्टिकोण से कोई परिवर्तन नहीं.
    • 3.0.0 : ~12 छवियों (सीएमवाईके -> आरजीबी) पर रंगीकरण ठीक करें। एकरूपता के लिए प्रारूप ठीक करें (एकल पीएनजी छवि को जेपीईजी में बदलें)। संग्रह से सीधे पढ़ने वाली तेज़ पीढ़ी।

    • 4.0.0 : (अप्रकाशित)

    • 5.0.0 : नई स्प्लिट एपीआई ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (डिफ़ॉल्ट): परीक्षण विभाजन जोड़ा गया।

  • डाउनलोड आकार : Unknown size

  • डेटासेट का आकार : 155.84 GiB

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    मैनुअल_डीआईआर में दो फ़ाइलें होनी चाहिए: ILSVRC2012_img_train.tar और ILSVRC2012_img_val.tar। डेटासेट डाउनलोड करने के लिए लिंक प्राप्त करने के लिए आपको https://image-net.org/download-images पर पंजीकरण करना होगा।

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'test' 100,000
'train' 1,281,167
'validation' 50,000
  • फ़ीचर संरचना :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
फ़ाइल का नाम मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 3) uint8
लेबल क्लास लेबल int64

VISUALIZATION

  • उद्धरण :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}