curated_breast_imaging_ddsm

  • Descrizione :

Il CBIS-DDSM (Curated Breast Imaging Subset of DDSM) è una versione aggiornata e standardizzata del Digital Database for Screening Mammography (DDSM). Il DDSM è un database di 2.620 studi mammografici su pellicola scansionata. Contiene casi normali, benigni e maligni con informazioni patologiche verificate.

La configurazione predefinita è composta da patch estratti dalle mammografie originali, seguendo la descrizione da ( http://arxiv.org/abs/1708.09427 ), in modo da inquadrare il compito da risolvere in un ambiente di classificazione delle immagini tradizionale.

Poiché per scaricare e leggere le immagini contenute nel set di dati sono necessari software e librerie speciali, TFDS presuppone che l'utente abbia scaricato i file DCIM originali e li abbia convertiti in PNG.

Per generare i file PNG è necessario utilizzare i seguenti comandi (o equivalenti) per garantire risultati riproducibili:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Le immagini risultanti dovrebbero essere inserite in manual_dir , come: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (configurazione predefinita)

  • Descrizione della configurazione : patch contenenti sia casi di calcificazione che di massa, oltre a percorsi senza anomalie. Progettato come un tradizionale compito di classificazione in 5 classi.

  • Dimensione download : 2.01 MiB

  • Dimensione del set di dati : 801.46 MiB

  • Divide :

Diviso Esempi
'test' 9.770
'train' 49.780
'validation' 5.580
  • Struttura delle caratteristiche :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 1) uint8
etichetta ClassLabel int64

Visualizzazione

curated_breast_imaging_ddsm/original-calc

  • Descrizione configurazione : immagini originali dei casi di calcificazione compresse in PNG senza perdita di dati.

  • Dimensione download : 1.06 MiB

  • Dimensione del set di dati : 4.42 GiB

  • Divide :

Diviso Esempi
'test' 284
'train' 1.227
  • Struttura delle caratteristiche :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
anomalie Sequenza
anomalie/valutazione ClassLabel int64
anomalie/calc_distribution ClassLabel int64
anomalie/calc_type ClassLabel int64
anomalie/id Tensore int32
anomalie/maschera Immagine (Nessuno, Nessuno, 1) uint8
anomalie/patologie ClassLabel int64
anomalie/sottigliezza ClassLabel int64
seno ClassLabel int64
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 1) uint8
paziente Testo corda
visualizzazione ClassLabel int64

Visualizzazione

curated_breast_imaging_ddsm/original-mass

  • Descrizione configurazione : immagini originali dei casi di massa compressi in PNG senza perdita di dati.

  • Dimensione del download : 966.57 KiB

  • Dimensione del set di dati : 4.80 GiB

  • Divide :

Diviso Esempi
'test' 348
'train' 1.166
  • Struttura delle caratteristiche :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
anomalie Sequenza
anomalie/valutazione ClassLabel int64
anomalie/id Tensore int32
anomalie/maschera Immagine (Nessuno, Nessuno, 1) uint8
anomalie/margini_di_massa ClassLabel int64
anomalie/forma_massa ClassLabel int64
anomalie/patologie ClassLabel int64
anomalie/sottigliezza ClassLabel int64
seno ClassLabel int64
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 1) uint8
paziente Testo corda
visualizzazione ClassLabel int64

Visualizzazione