bccd

  • Descripción :

BCCD Dataset es un conjunto de datos a pequeña escala para la detección de células sanguíneas.

Gracias por los datos originales y las anotaciones de cosmicad y akshaylamba. El conjunto de datos original se reorganiza en formato VOC. BCCD Dataset está bajo licencia MIT.

La preparación de datos es importante para utilizar el aprendizaje automático. En este proyecto se utiliza el algoritmo Faster R-CNN de keras-frcnn para la detección de objetos. A partir de este conjunto de datos, nicolaschen1 desarrolló dos secuencias de comandos de Python para preparar datos (archivo CSV e imágenes) para el reconocimiento de anomalías en las células sanguíneas en imágenes médicas.

export.py: crea el archivo "test.csv" con todos los datos necesarios: nombre de archivo, class_name, x1,y1,x2,y2. plot.py: traza las casillas de cada imagen y las guarda en un nuevo directorio.

Tipo de imagen: jpeg (JPEG) Ancho x Alto: 640 x 480

Separar Ejemplos
'test' 72
'train' 205
'validation' 87
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (480, 640, 3) uint8
imagen/nombre de archivo Texto cuerda
objetos Secuencia
objetos/bbox BBoxCaracterística (4,) flotar32
objetos/etiqueta Etiqueta de clase int64

Visualización

  • Cita :
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}