imagenet2012_fewshot

  • คำอธิบาย :

Imagenet2012Fewshot เป็นส่วนย่อยของชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม ชุดข้อมูลใช้ชุดการตรวจสอบ เดียวกัน กับชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม อย่างไรก็ตาม ชุดการฝึกจะถูกสุ่มตัวอย่างย่อยตามรูปแบบที่สมดุล ในการกำหนดค่า 5shot จะมีการสุ่มตัวอย่าง 5 ภาพต่อฉลาก หรือ 5,000 ภาพ และในการกำหนดค่า 10shot จะมีการสุ่มตัวอย่าง 10 ภาพต่อฉลาก หรือ 10,000 ภาพ

  • หน้าแรก : http://image-net.org/

  • ซอร์สโค้ด : tfds.datasets.imagenet2012_fewshot.Builder

  • รุ่น :

    • 2.0.0 : แก้ไขป้ายกำกับการตรวจสอบความถูกต้อง
    • 2.0.1 : แก้ไขการเข้ารหัส ไม่มีการเปลี่ยนแปลงจากมุมมองของผู้ใช้
    • 3.0.0 : แก้ไข colorization บน ~12 ภาพ (CMYK -> RGB) แก้ไขรูปแบบเพื่อความสอดคล้องกัน (แปลงภาพ png เดียวเป็น Jpeg) รุ่นที่เร็วกว่าการอ่านโดยตรงจากไฟล์เก็บถาวร

    • 4.0.0 : (ยังไม่ได้เผยแพร่)

    • 5.0.0 : API แยกใหม่ ( https://tensorflow.org/datasets/splits )

    • 5.0.1 (ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น

    • 5.1.0 : เพิ่มการแบ่งการทดสอบ

  • ขนาดการดาวน์โหลด : Unknown size

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir ควรมีสองไฟล์: ILSVRC2012_img_train.tar และ ILSVRC2012_img_val.tar คุณต้องลงทะเบียนบน https://image-net.org/download-images เพื่อรับลิงก์สำหรับดาวน์โหลดชุดข้อมูล

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • โครงสร้างคุณลักษณะ :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ชื่อไฟล์ ข้อความ สตริง
ภาพ ภาพ (ไม่มี, ไม่มี, 3) uint8
ฉลาก ป้ายกำกับคลาส int64
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('image', 'label')

  • การอ้างอิง :

@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_fewshot/1shot (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : 1 ช็อตของชุดการฝึก ImageNet ทั้งหมด

  • ขนาดชุดข้อมูล : 6.46 GiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000
'tune' 1,000
'validation' 50,000

การสร้างภาพ

imagenet2012_fewshot/5shot

  • คำอธิบายการกำหนดค่า : 5 ช็อตของชุดการฝึก ImageNet ทั้งหมด

  • ขนาดชุดข้อมูล : 6.88 GiB

  • แยก :

แยก ตัวอย่าง
'train' 5,000
'tune' 1,000
'validation' 50,000

การสร้างภาพ

imagenet2012_fewshot/10shot

  • คำอธิบายการกำหนดค่า : 10 ช็อตของชุดการฝึก ImageNet ทั้งหมด

  • ขนาดชุดข้อมูล : 7.42 GiB

  • แยก :

แยก ตัวอย่าง
'train' 10,000
'tune' 1,000
'validation' 50,000

การสร้างภาพ