- विवरण :
सीबीआईएस-डीडीएसएम (डीडीएसएम का क्यूरेटेड ब्रेस्ट इमेजिंग सबसेट) स्क्रीनिंग मैमोग्राफी (डीडीएसएम) के लिए डिजिटल डेटाबेस का एक अद्यतन और मानकीकृत संस्करण है। डीडीएसएम 2,620 स्कैन की गई फिल्म मैमोग्राफी अध्ययनों का एक डेटाबेस है। इसमें सत्यापित रोगविज्ञान जानकारी के साथ सामान्य, सौम्य और घातक मामले शामिल हैं।
पारंपरिक छवि वर्गीकरण सेटिंग में कार्य को हल करने के लिए, ( http://arxiv.org/abs/1708.09427 ) के विवरण के बाद, डिफ़ॉल्ट कॉन्फ़िगरेशन मूल मैमोग्राम से निकाले गए पैच से बना है।
मुखपृष्ठ : https://wiki.cancerimagearchive.net/display/Public/CBIS-DDSM
स्रोत कोड :
tfds.image_classification.CuratedBreastImagingDDSM
संस्करण :
-
2.0.1
: नई स्प्लिट एपीआई ( https://tensorflow.org/datasets/splits ) -
3.0.0
(डिफ़ॉल्ट): बेहतर फसल नमूनाकरण ( https://github.com/tensorflow/datasets/pull/2502 )
-
मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir
(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/
) में डाउनलोड करना होगा:
आप चित्र https://wiki.cancerimagearchive.net/display/Public/CBIS-DDSM से डाउनलोड कर सकते हैं
क्योंकि डेटासेट में मौजूद छवियों को डाउनलोड करने और पढ़ने के लिए विशेष सॉफ़्टवेयर और लाइब्रेरी की आवश्यकता होती है, TFDS मानता है कि उपयोगकर्ता ने मूल DCIM फ़ाइलें डाउनलोड कर ली हैं और उन्हें PNG में परिवर्तित कर दिया है।
प्रतिलिपि प्रस्तुत करने योग्य परिणामों की गारंटी के लिए, पीएनजी फ़ाइलें उत्पन्न करने के लिए निम्नलिखित कमांड (या समतुल्य) का उपयोग किया जाना चाहिए:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
परिणामी छवियों को manual_dir
में रखा जाना चाहिए, जैसे: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
।
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
उद्धरण :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/पैच (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फ़िगरेशन विवरण : कैल्सीफिकेशन और बड़े पैमाने पर दोनों मामलों वाले पैच, साथ ही बिना किसी असामान्यता वाले पथ। पारंपरिक 5-श्रेणी वर्गीकरण कार्य के रूप में डिज़ाइन किया गया।
डाउनलोड आकार :
2.01 MiB
डेटासेट का आकार :
801.46 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | 5,580 |
- फ़ीचर संरचना :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
पहचान | मूलपाठ | डोरी | ||
छवि | छवि | (कोई नहीं, कोई नहीं, 1) | uint8 | |
लेबल | क्लास लेबल | int64 |
- चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):
क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/ओरिजिनल-कैल्क
कॉन्फ़िगरेशन विवरण : दोषरहित पीएनजी में संपीड़ित कैल्सीफिकेशन मामलों की मूल छवियां।
डाउनलोड आकार :
1.06 MiB
डेटासेट का आकार :
4.42 GiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 284 |
'train' | 1,227 |
- फ़ीचर संरचना :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
असामान्यताएं | अनुक्रम | |||
असामान्यताएं/मूल्यांकन | क्लास लेबल | int64 | ||
असामान्यताएं/calc_distribution | क्लास लेबल | int64 | ||
असामान्यताएं/calc_type | क्लास लेबल | int64 | ||
असामान्यताएं/आईडी | टेन्सर | int32 | ||
असामान्यताएं/मुखौटा | छवि | (कोई नहीं, कोई नहीं, 1) | uint8 | |
असामान्यताएं/विकृति | क्लास लेबल | int64 | ||
असामान्यताएँ/सूक्ष्मताएँ | क्लास लेबल | int64 | ||
स्तन | क्लास लेबल | int64 | ||
पहचान | मूलपाठ | डोरी | ||
छवि | छवि | (कोई नहीं, कोई नहीं, 1) | uint8 | |
मरीज़ | मूलपाठ | डोरी | ||
देखना | क्लास लेबल | int64 |
- चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):
क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/ओरिजिनल-मास
कॉन्फ़िगरेशन विवरण : दोषरहित पीएनजी में संपीड़ित बड़े मामलों की मूल छवियां।
डाउनलोड आकार :
966.57 KiB
डेटासेट का आकार :
4.80 GiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 348 |
'train' | 1,166 |
- फ़ीचर संरचना :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
असामान्यताएं | अनुक्रम | |||
असामान्यताएं/मूल्यांकन | क्लास लेबल | int64 | ||
असामान्यताएं/आईडी | टेन्सर | int32 | ||
असामान्यताएं/मुखौटा | छवि | (कोई नहीं, कोई नहीं, 1) | uint8 | |
असामान्यताएं/द्रव्यमान_मार्जिन | क्लास लेबल | int64 | ||
असामान्यताएं/द्रव्यमान_आकार | क्लास लेबल | int64 | ||
असामान्यताएं/विकृति | क्लास लेबल | int64 | ||
असामान्यताएँ/सूक्ष्मताएँ | क्लास लेबल | int64 | ||
स्तन | क्लास लेबल | int64 | ||
पहचान | मूलपाठ | डोरी | ||
छवि | छवि | (कोई नहीं, कोई नहीं, 1) | uint8 | |
मरीज़ | मूलपाठ | डोरी | ||
देखना | क्लास लेबल | int64 |
- चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):