- 설명 :
COCO는 대규모 객체 감지, 분할, 캡션 데이터세트입니다.
추가 문서 : 코드 가 포함된 논문 탐색
홈페이지 : http://cocodataset.org/#home
소스코드 :
tfds.object_detection.Coco
버전 :
-
1.1.0
(기본값): 릴리스 노트가 없습니다.
-
자동 캐시 ( 문서 ): 아니요
감독되는 키 (
as_supervised
doc 참조):None
인용 :
@article{DBLP:journals/corr/LinMBHPRDZ14,
author = {Tsung{-}Yi Lin and
Michael Maire and
Serge J. Belongie and
Lubomir D. Bourdev and
Ross B. Girshick and
James Hays and
Pietro Perona and
Deva Ramanan and
Piotr Doll{'{a} }r and
C. Lawrence Zitnick},
title = {Microsoft {COCO:} Common Objects in Context},
journal = {CoRR},
volume = {abs/1405.0312},
year = {2014},
url = {http://arxiv.org/abs/1405.0312},
archivePrefix = {arXiv},
eprint = {1405.0312},
timestamp = {Mon, 13 Aug 2018 16:48:13 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/LinMBHPRDZ14},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
coco/2014(기본 구성)
구성 설명 : 이 버전에는 2014 버전의 이미지, 경계 상자 및 라벨이 포함되어 있습니다.
다운로드 크기 :
37.57 GiB
데이터세트 크기 :
37.35 GiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 40,775 |
'test2015' | 81,434 |
'train' | 82,783 |
'validation' | 40,504 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'image/id': int64,
'objects': Sequence({
'area': int64,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'id': int64,
'is_crowd': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=80),
}),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
이미지/파일 이름 | 텍스트 | 끈 | ||
이미지/ID | 텐서 | 정수64 | ||
사물 | 순서 | |||
객체/영역 | 텐서 | 정수64 | ||
객체/bbox | B박스특징 | (4,) | float32 | |
객체/ID | 텐서 | 정수64 | ||
객체/is_crowd | 텐서 | 부울 | ||
객체/라벨 | 클래스 라벨 | 정수64 |
- 그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
코코/2017
구성 설명 : 이 버전에는 2017 버전의 이미지, 경계 상자 및 라벨이 포함되어 있습니다.
다운로드 크기 :
25.20 GiB
데이터세트 크기 :
24.98 GiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 40,670 |
'train' | 118,287 |
'validation' | 5,000 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'image/id': int64,
'objects': Sequence({
'area': int64,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'id': int64,
'is_crowd': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=80),
}),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
이미지/파일 이름 | 텍스트 | 끈 | ||
이미지/ID | 텐서 | 정수64 | ||
사물 | 순서 | |||
객체/영역 | 텐서 | 정수64 | ||
객체/bbox | B박스특징 | (4,) | float32 | |
객체/ID | 텐서 | 정수64 | ||
객체/is_crowd | 텐서 | 부울 | ||
객체/라벨 | 클래스 라벨 | 정수64 |
- 그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
코코/2017_panoptic
구성 설명 : 이 버전에는 2017 버전의 이미지, 경계 상자 및 라벨이 포함되어 있습니다.
다운로드 크기 :
19.57 GiB
데이터세트 크기 :
19.63 GiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 118,287 |
'validation' | 5,000 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'image/id': int64,
'panoptic_image': Image(shape=(None, None, 3), dtype=uint8),
'panoptic_image/filename': Text(shape=(), dtype=string),
'panoptic_objects': Sequence({
'area': int64,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'id': int64,
'is_crowd': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=133),
}),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
이미지/파일 이름 | 텍스트 | 끈 | ||
이미지/ID | 텐서 | 정수64 | ||
panoptic_이미지 | 영상 | (없음, 없음, 3) | uint8 | |
panoptic_image/파일 이름 | 텍스트 | 끈 | ||
panoptic_objects | 순서 | |||
panoptic_objects/지역 | 텐서 | 정수64 | ||
panoptic_objects/bbox | B박스특징 | (4,) | float32 | |
panoptic_objects/id | 텐서 | 정수64 | ||
panoptic_objects/is_crowd | 텐서 | 부울 | ||
panoptic_objects/레이블 | 클래스 라벨 | 정수64 |
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):