curated_breast_imaging_ddsm

  • Tanım :

CBIS-DDSM (DDSM'nin Özel Meme Görüntüleme Alt Kümesi), Tarama Mamografisi için Dijital Veritabanının (DDSM) güncellenmiş ve standartlaştırılmış bir sürümüdür. DDSM, 2.620 taranmış film mamografi çalışmasının yer aldığı bir veri tabanıdır. Doğrulanmış patoloji bilgilerine sahip normal, iyi huylu ve kötü huylu vakaları içerir.

Varsayılan yapılandırma, geleneksel görüntü sınıflandırma ayarında çözülecek görevi çerçevelemek amacıyla ( http://arxiv.org/abs/1708.09427 ) adresindeki açıklamaya uygun olarak orijinal mamogramlardan çıkarılan yamalardan oluşur.

Veri setinde yer alan görsellerin indirilmesi ve okunması için özel yazılım ve kütüphanelere ihtiyaç duyulduğundan TFDS, kullanıcının orijinal DCIM dosyalarını indirdiğini ve bunları PNG'ye dönüştürdüğünü varsayar.

Tekrarlanabilir sonuçları garanti etmek amacıyla PNG dosyalarını oluşturmak için aşağıdaki komutlar (veya eşdeğeri) kullanılmalıdır:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Ortaya çıkan görüntüler şu şekilde manual_dir içine yerleştirilmelidir: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Hem kalsifikasyon hem de kitle vakalarını içeren yamalar ve ayrıca anormallik içermeyen yollar. Geleneksel 5 sınıflı bir sınıflandırma görevi olarak tasarlanmıştır.

  • İndirme boyutu : 2.01 MiB

  • Veri kümesi boyutu : 801.46 MiB

  • Bölünmeler :

Bölmek Örnekler
'test' 9.770
'train' 49.780
'validation' 5.580
  • Özellik yapısı :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
İD Metin sicim
resim Resim (Yok, Yok, 1) uint8
etiket SınıfEtiketi int64

Görselleştirme

curated_breast_imaging_ddsm/original-calc

  • Yapılandırma açıklaması : Kalsifikasyon vakalarının kayıpsız PNG formatında sıkıştırılmış orijinal görüntüleri.

  • İndirme boyutu : 1.06 MiB

  • Veri kümesi boyutu : 4.42 GiB

  • Bölünmeler :

Bölmek Örnekler
'test' 284
'train' 1.227
  • Özellik yapısı :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
anormallikler Sekans
anormallikler/değerlendirme SınıfEtiketi int64
anormallikler/calc_distribution SınıfEtiketi int64
anormallikler/calc_type SınıfEtiketi int64
anormallikler/kimlik Tensör int32
anormallikler/maske Resim (Yok, Yok, 1) uint8
anormallikler/patoloji SınıfEtiketi int64
anormallikler/incelik SınıfEtiketi int64
göğüs SınıfEtiketi int64
İD Metin sicim
resim Resim (Yok, Yok, 1) uint8
hasta Metin sicim
görüş SınıfEtiketi int64

Görselleştirme

curated_breast_imaging_ddsm/original-mass

  • Yapılandırma açıklaması : Kayıpsız PNG formatında sıkıştırılmış toplu vakaların orijinal görüntüleri.

  • İndirme boyutu : 966.57 KiB

  • Veri kümesi boyutu : 4.80 GiB

  • Bölünmeler :

Bölmek Örnekler
'test' 348
'train' 1.166
  • Özellik yapısı :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
anormallikler Sekans
anormallikler/değerlendirme SınıfEtiketi int64
anormallikler/kimlik Tensör int32
anormallikler/maske Resim (Yok, Yok, 1) uint8
anormallikler/mass_margins SınıfEtiketi int64
anormallikler/mass_shape SınıfEtiketi int64
anormallikler/patoloji SınıfEtiketi int64
anormallikler/incelik SınıfEtiketi int64
göğüs SınıfEtiketi int64
İD Metin sicim
resim Resim (Yok, Yok, 1) uint8
hasta Metin sicim
görüş SınıfEtiketi int64

Görselleştirme