curated_breast_imaging_ddsm

  • Descripción :

El CBIS-DDSM (Subconjunto seleccionado de imágenes mamarias de DDSM) es una versión actualizada y estandarizada de la Base de datos digital para mamografías de detección (DDSM). El DDSM es una base de datos de 2620 estudios de mamografía con película escaneada. Contiene casos normales, benignos y malignos con información patológica verificada.

La configuración predeterminada está hecha de parches extraídos de las mamografías originales, siguiendo la descripción de ( http://arxiv.org/abs/1708.09427 ), para enmarcar la tarea a resolver en una configuración de clasificación de imágenes tradicional.

Debido a que se necesitan bibliotecas y software especiales para descargar y leer las imágenes contenidas en el conjunto de datos, TFDS supone que el usuario descargó los archivos DCIM originales y los convirtió a PNG.

Se deben utilizar los siguientes comandos (o equivalentes) para generar los archivos PNG para garantizar resultados reproducibles:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Las imágenes resultantes deben colocarse en manual_dir , como: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (configuración predeterminada)

  • Descripción de la configuración : parches que contienen casos de calsificación y masa, además de parches sin anomalías. Diseñado como una tarea tradicional de clasificación de 5 clases.

  • Tamaño de descarga : 2.01 MiB

  • Tamaño del conjunto de datos : 801.46 MiB

  • Divisiones :

Dividir Ejemplos
'test' 9.770
'train' 49.780
'validation' 5.580
  • Estructura de características :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
identificación Texto cadena
imagen Imagen (Ninguno, Ninguno, 1) uint8
etiqueta Etiqueta de clase int64

Visualización

curated_breast_imaging_ddsm/original-calc

  • Descripción de la configuración : Imágenes originales de los casos de calcificación comprimidas en PNG sin pérdidas.

  • Tamaño de descarga : 1.06 MiB

  • Tamaño del conjunto de datos : 4.42 GiB

  • Divisiones :

Dividir Ejemplos
'test' 284
'train' 1.227
  • Estructura de características :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
anormalidades Secuencia
anomalías/evaluación Etiqueta de clase int64
anomalías/calc_distribution Etiqueta de clase int64
anomalías/calc_type Etiqueta de clase int64
anomalías/identificación Tensor int32
anomalías/máscara Imagen (Ninguno, Ninguno, 1) uint8
anomalías/patología Etiqueta de clase int64
anomalías/sutileza Etiqueta de clase int64
mama Etiqueta de clase int64
identificación Texto cadena
imagen Imagen (Ninguno, Ninguno, 1) uint8
paciente Texto cadena
vista Etiqueta de clase int64

Visualización

curated_breast_imaging_ddsm/original-mass

  • Descripción de la configuración : Imágenes originales de los casos masivos comprimidos en PNG sin pérdidas.

  • Tamaño de descarga : 966.57 KiB

  • Tamaño del conjunto de datos : 4.80 GiB

  • Divisiones :

Dividir Ejemplos
'test' 348
'train' 1,166
  • Estructura de características :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
anormalidades Secuencia
anomalías/evaluación Etiqueta de clase int64
anomalías/identificación Tensor int32
anomalías/máscara Imagen (Ninguno, Ninguno, 1) uint8
anomalías/márgenes_masa Etiqueta de clase int64
anomalías/forma_masa Etiqueta de clase int64
anomalías/patología Etiqueta de clase int64
anomalías/sutileza Etiqueta de clase int64
mama Etiqueta de clase int64
identificación Texto cadena
imagen Imagen (Ninguno, Ninguno, 1) uint8
paciente Texto cadena
vista Etiqueta de clase int64

Visualización