- 설명 :
BCCD 데이터 세트는 혈액 세포 검출을 위한 소규모 데이터 세트입니다.
cosmicad 및 akshaylamba의 원본 데이터 및 주석에 감사드립니다. 원본 데이터 세트는 VOC 형식으로 재구성됩니다. BCCD 데이터 세트는 MIT 라이선스에 따릅니다.
기계 학습을 사용하려면 데이터 준비가 중요합니다. 이 프로젝트에서는 객체 감지를 위해 keras-frcnn의 Faster R-CNN 알고리즘이 사용됩니다. 이 데이터 세트에서 nicolaschen1은 의료 이미지에서 혈액 세포의 이상을 인식하기 위한 준비 데이터(CSV 파일 및 이미지)를 만들기 위해 두 개의 Python 스크립트를 개발했습니다.
export.py: 필요한 모든 데이터(filename, class_name, x1,y1,x2,y2)가 포함된 "test.csv" 파일을 생성합니다. plot.py: 각 이미지에 대한 상자를 플롯하고 새 디렉토리에 저장합니다.
이미지 종류 : jpeg(JPEG) 가로 x 세로 : 640 x 480
소스 코드 :
tfds.datasets.bccd.Builder
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
7.51 MiB
데이터 세트 크기 :
7.34 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'test' | 72 |
'train' | 205 |
'validation' | 87 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(480, 640, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
}),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
영상 | 영상 | (480, 640, 3) | uint8 | |
이미지/파일 이름 | 텍스트 | 끈 | ||
사물 | 순서 | |||
개체/bbox | BBox기능 | (4,) | float32 | |
개체/레이블 | 클래스 레이블 | int64 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@ONLINE {BCCD_Dataset,
author = "Shenggan",
title = "BCCD Dataset",
year = "2017",
url = "https://github.com/Shenggan/BCCD_Dataset"
}