- Tanım :
CBIS-DDSM (DDSM'nin Özel Meme Görüntüleme Alt Kümesi), Tarama Mamografisi için Dijital Veritabanının (DDSM) güncellenmiş ve standartlaştırılmış bir sürümüdür. DDSM, 2.620 taranmış film mamografi çalışmasının yer aldığı bir veri tabanıdır. Doğrulanmış patoloji bilgilerine sahip normal, iyi huylu ve kötü huylu vakaları içerir.
Varsayılan yapılandırma, geleneksel görüntü sınıflandırma ayarında çözülecek görevi çerçevelemek amacıyla ( http://arxiv.org/abs/1708.09427 ) adresindeki açıklamaya uygun olarak orijinal mamogramlardan çıkarılan yamalardan oluşur.
Ana sayfa : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Kaynak kodu :
tfds.image_classification.CuratedBreastImagingDDSM
Sürümler :
-
2.0.1
: Yeni bölünmüş API ( https://tensorflow.org/datasets/splits ) -
3.0.0
(varsayılan): Daha iyi kırpma örneklemesi ( https://github.com/tensorflow/datasets/pull/2502 )
-
Manuel indirme talimatları : Bu veri kümesi, kaynak verilerini manuel olarak
download_config.manual_dir
içine indirmenizi gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/
şeklindedir):
Görselleri https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM adresinden indirebilirsiniz.
Veri setinde yer alan görsellerin indirilmesi ve okunması için özel yazılım ve kütüphanelere ihtiyaç duyulduğundan TFDS, kullanıcının orijinal DCIM dosyalarını indirdiğini ve bunları PNG'ye dönüştürdüğünü varsayar.
Tekrarlanabilir sonuçları garanti etmek amacıyla PNG dosyalarını oluşturmak için aşağıdaki komutlar (veya eşdeğeri) kullanılmalıdır:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
Ortaya çıkan görüntüler şu şekilde manual_dir
içine yerleştirilmelidir: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Alıntı :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (varsayılan yapılandırma)
Yapılandırma açıklaması : Hem kalsifikasyon hem de kitle vakalarını içeren yamalar ve ayrıca anormallik içermeyen yollar. Geleneksel 5 sınıflı bir sınıflandırma görevi olarak tasarlanmıştır.
İndirme boyutu :
2.01 MiB
Veri kümesi boyutu :
801.46 MiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 9.770 |
'train' | 49.780 |
'validation' | 5.580 |
- Özellik yapısı :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
İD | Metin | sicim | ||
resim | Resim | (Yok, Yok, 1) | uint8 | |
etiket | SınıfEtiketi | int64 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
Yapılandırma açıklaması : Kalsifikasyon vakalarının kayıpsız PNG formatında sıkıştırılmış orijinal görüntüleri.
İndirme boyutu :
1.06 MiB
Veri kümesi boyutu :
4.42 GiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 284 |
'train' | 1.227 |
- Özellik yapısı :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
anormallikler | Sekans | |||
anormallikler/değerlendirme | SınıfEtiketi | int64 | ||
anormallikler/calc_distribution | SınıfEtiketi | int64 | ||
anormallikler/calc_type | SınıfEtiketi | int64 | ||
anormallikler/kimlik | Tensör | int32 | ||
anormallikler/maske | Resim | (Yok, Yok, 1) | uint8 | |
anormallikler/patoloji | SınıfEtiketi | int64 | ||
anormallikler/incelik | SınıfEtiketi | int64 | ||
göğüs | SınıfEtiketi | int64 | ||
İD | Metin | sicim | ||
resim | Resim | (Yok, Yok, 1) | uint8 | |
hasta | Metin | sicim | ||
görüş | SınıfEtiketi | int64 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
Yapılandırma açıklaması : Kayıpsız PNG formatında sıkıştırılmış toplu vakaların orijinal görüntüleri.
İndirme boyutu :
966.57 KiB
Veri kümesi boyutu :
4.80 GiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 348 |
'train' | 1.166 |
- Özellik yapısı :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
anormallikler | Sekans | |||
anormallikler/değerlendirme | SınıfEtiketi | int64 | ||
anormallikler/kimlik | Tensör | int32 | ||
anormallikler/maske | Resim | (Yok, Yok, 1) | uint8 | |
anormallikler/mass_margins | SınıfEtiketi | int64 | ||
anormallikler/mass_shape | SınıfEtiketi | int64 | ||
anormallikler/patoloji | SınıfEtiketi | int64 | ||
anormallikler/incelik | SınıfEtiketi | int64 | ||
göğüs | SınıfEtiketi | int64 | ||
İD | Metin | sicim | ||
resim | Resim | (Yok, Yok, 1) | uint8 | |
hasta | Metin | sicim | ||
görüş | SınıfEtiketi | int64 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):