bccd

  • Descriptif :

BCCD Dataset est un ensemble de données à petite échelle pour la détection des cellules sanguines.

Merci pour les données originales et les annotations de cosmicad et akshaylamba. L'ensemble de données d'origine est réorganisé au format VOC. BCCD Dataset est sous licence MIT.

La préparation des données est importante pour utiliser l'apprentissage automatique. Dans ce projet, l'algorithme Faster R-CNN de keras-frcnn pour la détection d'objets est utilisé. À partir de ce jeu de données, nicolaschen1 a développé deux scripts Python pour créer des données de préparation (fichier CSV et images) pour la reconnaissance d'anomalies dans les cellules sanguines sur des images médicales.

export.py : il crée le fichier "test.csv" avec toutes les données nécessaires : nom de fichier, nom_classe, x1,y1,x2,y2. plot.py : il trace les cases pour chaque image et l'enregistre dans un nouveau répertoire.

Type d'image : jpeg(JPEG) Largeur x Hauteur : 640 x 480

Diviser Exemples
'test' 72
'train' 205
'validation' 87
  • Structure des fonctionnalités :
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image Image (480, 640, 3) uint8
image/nom de fichier Texte chaîne de caractères
objets Séquence
objets/bbox BBoxFeature (4,) float32
objets/étiquette Étiquette de classe int64

Visualisation

  • Citation :
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}