- 설명 :
LVIS: 대규모 어휘 인스턴스 분할을 위한 데이터 세트입니다.
추가 문서 : 코드 가 포함된 논문 탐색
홈페이지 : https://www.lvisdataset.org/
소스 코드 :
tfds.datasets.lvis.Builder
버전 :
-
1.1.0
:neg_category_ids
및not_exhaustive_category_ids
필드가 추가되었습니다. -
1.2.0
: 클래스 이름이 추가되었습니다. -
1.3.0
(기본값): 최소 분할이 추가되었습니다.
-
다운로드 크기 :
25.35 GiB
데이터세트 크기 :
23.04 GiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'minival' | 4,809 |
'test' | 19,822 |
'train' | 100,170 |
'validation' | 19,809 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/id': int64,
'neg_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
'not_exhaustive_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
'objects': Sequence({
'area': int64,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'id': int64,
'label': ClassLabel(shape=(), dtype=int64, num_classes=1203),
'segmentation': Image(shape=(None, None, 1), dtype=uint8),
}),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
이미지/ID | 텐서 | 정수64 | ||
neg_category_ids | 시퀀스(클래스 라벨) | (없음,) | 정수64 | |
not_exhaustive_category_ids | 시퀀스(클래스 라벨) | (없음,) | 정수64 | |
사물 | 순서 | |||
객체/영역 | 텐서 | 정수64 | ||
객체/bbox | B박스특징 | (4,) | float32 | |
객체/ID | 텐서 | 정수64 | ||
객체/라벨 | 클래스 라벨 | 정수64 | ||
객체/분할 | 영상 | (없음, 없음, 1) | uint8 |
감독되는 키 (
as_supervised
doc 참조):None
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{gupta2019lvis,
title={ {LVIS}: A Dataset for Large Vocabulary Instance Segmentation},
author={Gupta, Agrim and Dollar, Piotr and Girshick, Ross},
booktitle={Proceedings of the {IEEE} Conference on Computer Vision and Pattern Recognition},
year={2019}
}