- توضیحات :
مجموعه داده BCCD یک مجموعه داده در مقیاس کوچک برای تشخیص سلول های خونی است.
با تشکر از داده های اصلی و حاشیه نویسی از cosmicad و akshaylamba. مجموعه داده اصلی مجدداً در قالب VOC سازماندهی شده است. BCCD Dataset تحت مجوز MIT است.
آماده سازی داده برای استفاده از یادگیری ماشین مهم است. در این پروژه از الگوریتم Faster R-CNN از keras-frcnn برای تشخیص اشیا استفاده شده است. از این مجموعه داده، nicolaschen1 دو اسکریپت پایتون را برای ایجاد داده های آماده سازی (فایل CSV و تصاویر) برای تشخیص ناهنجاری های سلول های خونی در تصاویر پزشکی ایجاد کرد.
export.py: فایل "test.csv" را با تمام داده های مورد نیاز ایجاد می کند: نام فایل، نام کلاس، x1، y1، x2، y2. plot.py: کادرهای هر تصویر را رسم می کند و آن را در یک فهرست جدید ذخیره می کند.
نوع تصویر: jpeg (JPEG) عرض x ارتفاع: 640 x 480
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/Shenggan/BCCD_Dataset
کد منبع :
tfds.datasets.bccd.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
7.51 MiB
حجم مجموعه داده :
7.34 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 72 |
'train' | 205 |
'validation' | 87 |
- ساختار ویژگی :
FeaturesDict({
'image': Image(shape=(480, 640, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تصویر | تصویر | (480، 640، 3) | uint8 | |
تصویر/نام فایل | متن | رشته | ||
اشیاء | توالی | |||
اشیاء/bbox | ویژگی BBox | (4،) | float32 | |
اشیاء/برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
- نقل قول :
@ONLINE {BCCD_Dataset,
author = "Shenggan",
title = "BCCD Dataset",
year = "2017",
url = "https://github.com/Shenggan/BCCD_Dataset"
}