- 설명 :
ImageNet-LT는 원본 ImageNet ILSVRC 2012 데이터 세트의 하위 집합입니다. 트레이닝 세트는 클래스당 이미지 수가 긴 꼬리 분포를 따르도록 서브샘플링됩니다. 최대 이미지 수가 있는 클래스는 1,280개의 예제를 포함하는 반면 이미지 수가 가장 적은 클래스는 5개의 예제만 포함합니다. 이 데이터 세트에는 ImageNet ILSVRC 2012 교육 세트의 하위 세트이기도 한 균형 잡힌 유효성 검사 세트가 있으며 클래스당 20개의 이미지가 포함되어 있습니다. 이 데이터 세트의 테스트 세트는 원본 ImageNet ILSVRC 2012 데이터 세트의 검증 세트와 동일합니다.
원본 ImageNet ILSVRC 2012 데이터 세트는 수동으로 다운로드해야 하며 이 데이터 세트를 생성하려면 해당 경로를 --manual_dir로 설정해야 합니다.
홈페이지 : https://github.com/zhmiao/OpenLongTailRecognition-OLTR
버전 :
-
1.0.0
(기본값): 최초 릴리스.
-
다운로드 크기 :
5.21 MiB
데이터세트 크기 :
20.92 GiB
수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를
download_config.manual_dir
에 수동으로 다운로드해야 합니다(기본값은~/tensorflow_datasets/downloads/manual/
).
manual_dir에는 ILSVRC2012_img_train.tar 및 ILSVRC2012_img_val.tar의 두 파일이 포함되어야 합니다. 데이터 세트를 다운로드할 수 있는 링크를 받으려면 http://www.image-net.org/download-images 에 등록해야 합니다.자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'test' | 50,000 |
'train' | 115,846 |
'validation' | 20,000 |
- 기능 구조 :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
파일 이름 | 텍스트 | 끈 | ||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
상표 | 클래스 레이블 | int64 |
감독 키 (
as_supervised
문서 참조):('image', 'label')
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
\
@inproceedings{openlongtailrecognition,
title={Large-Scale Long-Tailed Recognition in an Open World},
author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2019},
url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}