bccd

  • 説明:

BCCD データセットは、血球検出用の小規模なデータセットです。

cosmicad と akshaylamba からの元のデータと注釈に感謝します。元のデータセットは VOC 形式に再編成されます。 BCCD データセットは MIT ライセンスの下にあります。

機械学習を利用するには、データの準備が重要です。このプロジェクトでは、オブジェクト検出に keras-frcnn の Faster R-CNN アルゴリズムが使用されます。このデータセットから、nicolaschen1 は 2 つの Python スクリプトを開発し、医用画像上の血球の異常を認識するための準備データ (CSV ファイルと画像) を作成しました。

export.py: 必要なすべてのデータ (ファイル名、クラス名、x1、y1、x2、y2) を含むファイル「test.csv」を作成します。 plot.py: 各画像のボックスをプロットし、新しいディレクトリに保存します。

画像形式:jpeg(JPEG) 幅×高さ:640×480

スプリット
'test' 72
'train' 205
'validation' 87
  • 機能構造:
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
画像画像(480、640、3) uint8
画像/ファイル名文章ストリング
オブジェクト順序
オブジェクト/bbox BBoxFeature (4) float32
オブジェクト/ラベルクラスラベルint64

視覚化

  • 引用
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}