bccd

  • Mô tả :

Bộ dữ liệu BCCD là một bộ dữ liệu quy mô nhỏ để phát hiện tế bào máu.

Cảm ơn dữ liệu gốc và chú thích từ vũ trụ và akshaylamba. Tập dữ liệu ban đầu được tổ chức lại thành định dạng VOC. Bộ dữ liệu BCCD theo giấy phép của MIT.

Chuẩn bị dữ liệu là rất quan trọng để sử dụng máy học. Trong dự án này, thuật toán Faster R-CNN từ keras-frcnn cho Phát hiện đối tượng được sử dụng. Từ bộ dữ liệu này, nicolaschen1 đã phát triển hai tập lệnh Python để tạo dữ liệu chuẩn bị (tệp CSV và hình ảnh) để nhận dạng các bất thường trong tế bào máu trên hình ảnh y tế.

export.py: nó tạo tệp "test.csv" với tất cả dữ liệu cần thiết: tên tệp, tên_lớp, x1,y1,x2,y2. plot.py: nó vẽ các ô cho mỗi hình ảnh và lưu nó vào một thư mục mới.

Loại ảnh : jpeg(JPEG) Chiều rộng x Chiều cao : 640 x 480

Tách ra ví dụ
'test' 72
'train' 205
'validation' 87
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (480, 640, 3) uint8
hình ảnh/tên tập tin Chữ sợi dây
các đối tượng Sự phối hợp
đối tượng/bbox Tính năng BBox (4,) phao32
đối tượng/nhãn LớpNhãn int64

Hình dung

  • trích dẫn :
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}