imagenet2012_subset

  • विवरण :

Imagenet2012Subset मूल ImageNet ILSVRC 2012 डेटासेट का एक सबसेट है। डेटासेट मूल ImageNet ILSVRC 2012 डेटासेट के समान सत्यापन सेट साझा करता है। हालाँकि, प्रशिक्षण सेट को एक लेबल संतुलित तरीके से उप-नमूना दिया गया है। 1pct कॉन्फ़िगरेशन में, 1%, या 12811, छवियों का नमूना लिया जाता है, अधिकांश वर्गों में छवियों की समान संख्या होती है (औसत 12.8), कुछ वर्गों में यादृच्छिक रूप से दूसरों की तुलना में 1 अधिक उदाहरण होता है; और 10pct कॉन्फ़िगरेशन में, ~10%, या 128116, अधिकांश वर्गों में छवियों की समान संख्या (औसत 128) होती है, और कुछ वर्गों में यादृच्छिक रूप से दूसरों की तुलना में 1 अधिक उदाहरण होता है।

इसे अर्ध-पर्यवेक्षित शिक्षण के लिए एक बेंचमार्क के रूप में उपयोग किया जाना चाहिए, और मूल रूप से SimCLR पेपर ( https://arxiv.org/abs/2002.05709 ) में उपयोग किया गया है।

  • मुखपृष्ठ : http://image-net.org/

  • स्रोत कोड : tfds.datasets.imagenet2012_subset.Builder

  • संस्करण :

    • 2.0.0 : सत्यापन लेबल ठीक करें।
    • 2.0.1 : एन्कोडिंग ठीक करें। उपयोगकर्ता के दृष्टिकोण से कोई परिवर्तन नहीं.
    • 3.0.0 : ~12 छवियों (सीएमवाईके -> आरजीबी) पर रंगीकरण ठीक करें। एकरूपता के लिए प्रारूप ठीक करें (एकल पीएनजी छवि को जेपीईजी में बदलें)। संग्रह से सीधे पढ़ने वाली तेज़ पीढ़ी।

    • 4.0.0 : (अप्रकाशित)

    • 5.0.0 (डिफ़ॉल्ट): नया स्प्लिट एपीआई ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : परीक्षण विभाजन जोड़ा गया।

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    मैनुअल_डीआईआर में दो फ़ाइलें होनी चाहिए: ILSVRC2012_img_train.tar और ILSVRC2012_img_val.tar। डेटासेट डाउनलोड करने के लिए लिंक प्राप्त करने के लिए आपको https://image-net.org/download-images पर पंजीकरण करना होगा।

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • फ़ीचर संरचना :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
फ़ाइल का नाम मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 3) uint8
लेबल क्लास लेबल int64
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): ('image', 'label')

  • उद्धरण :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फिग विवरण : कुल इमेजनेट प्रशिक्षण सेट का 1 प्रतिशत।

  • डाउनलोड आकार : 254.22 KiB

  • डेटासेट का आकार : 7.61 GiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 12,811
'validation' 50,000

VISUALIZATION

imagenet2012_subset/10pct

  • कॉन्फ़िगरेशन विवरण : कुल इमेजनेट प्रशिक्षण सेट का 10 प्रतिशत।

  • डाउनलोड आकार : 2.48 MiB

  • डेटासेट का आकार : 19.91 GiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 128,116
'validation' 50,000

VISUALIZATION