imagenet_pi

Sự miêu tả :

ImageNet-PI là phiên bản được gán nhãn lại của bộ dữ liệu ImageNet ILSVRC2012 tiêu chuẩn, trong đó các nhãn được cung cấp bởi một tập hợp gồm 16 mạng nơ-ron sâu với các kiến trúc khác nhau đã được huấn luyện trước trên ILSVRC2012 tiêu chuẩn. Cụ thể, các mô hình được huấn luyện trước được tải xuống từ tf.keras.applications.

Ngoài các nhãn mới, ImageNet-PI còn cung cấp siêu dữ liệu về quá trình chú thích dưới dạng độ tin cậy của các mô hình đối với các nhãn của chúng và thông tin bổ sung về từng mô hình.

Để biết thêm thông tin chi tiết, vui lòng xem: ImageNet-PI

Trang chủ : https://github.com/google-research-datasets/imagenet_pi/
Mã nguồn : tfds.datasets.imagenet_pi.Builder
Phiên bản :
- 1.0.0 (mặc định): Phiên bản phát hành ban đầu.
Kích thước tải xuống : Unknown size
Kích thước tập dữ liệu : Unknown size
Hướng dẫn tải xuống thủ công : Bộ dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
Thư mục manual_dir cần chứa hai tệp: ILSVRC2012_img_train.tar và ILSVRC2012_img_val.tar. Bạn cần đăng ký trên http://www.image-net.org/download-images để nhận liên kết tải xuống bộ dữ liệu.
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không xác định
Chia nhỏ :

Tách ra	Ví dụ

Cấu trúc tính năng :

FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})

Tài liệu mô tả tính năng :

Tính năng	Lớp học	Hình dạng	Loại D
	Từ điển tính năng
sự tin cậy của người chú thích	Tensor	(16,)	float32
nhãn chú thích	Tensor	(16,)	int64
nhãn sạch	Nhãn lớp		int64
tên_tệp	Chữ		sợi dây
hình ảnh	Hình ảnh	(Không có, Không có, 3)	uint8

Các khóa được giám sát (Xem tài liệu as_supervised ): ('image', 'annotator_labels')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ): Thiếu.
Trích dẫn :

@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}

imagenet_pi Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

imagenet_pi