imagenet2012_fewshot

Mô tả :

Imagenet2012Fewshot là tập con của tập dữ liệu ImageNet ILSVRC 2012 gốc. Bộ dữ liệu chia sẻ bộ xác thực giống như bộ dữ liệu ImageNet ILSVRC 2012 ban đầu. Tuy nhiên, tập huấn luyện được lấy mẫu con theo kiểu cân bằng nhãn. Trong cấu hình 5shot , 5 ảnh trên mỗi nhãn hoặc 5000 ảnh được lấy mẫu; và trong cấu hình 10shot , 10 ảnh trên mỗi nhãn hoặc 10000 ảnh được lấy mẫu.

Trang chủ : http://image-net.org/
Mã nguồn : tfds.datasets.imagenet2012_fewshot.Builder
Phiên bản :
- 2.0.0 : Sửa nhãn xác thực.
- 2.0.1 : Sửa mã hóa. Không có thay đổi từ quan điểm của người dùng.
- 3.0.0 : Sửa màu trên ~12 ảnh (CMYK -> RGB). Sửa định dạng để thống nhất (chuyển đổi hình ảnh png thành Jpeg). Tạo nhanh hơn đọc trực tiếp từ kho lưu trữ.
- 4.0.0 : (chưa xuất bản)
- 5.0.0 : API phân tách mới ( https://tensorflow.org/datasets/splits )
- 5.0.1 (mặc định): Không có ghi chú phát hành.
- 5.1.0 : Đã thêm phần tách thử nghiệm.
Kích thước tải xuống : Unknown size
Hướng dẫn tải xuống thủ công : Bộ dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
manual_dir phải chứa hai tệp: ILSVRC2012_img_train.tar và ILSVRC2012_img_val.tar. Bạn cần đăng ký trên https://image-net.org/download-images để nhận liên kết tải xuống tập dữ liệu.
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Cấu trúc tính năng :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

Tài liệu tính năng :

Tính năng	Lớp	Hình dạng	Dtype
	Tính năngDict
tên_tệp	Chữ		sợi dây
hình ảnh	Hình ảnh	(Không, Không có, 3)	uint8
nhãn mác	LớpNhãn		int64

Các khóa được giám sát (Xem as_supervised doc ): ('image', 'label')
trích dẫn :

@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}