- وصف :
تعد CBIS-DDSM (المجموعة الفرعية لتصوير الثدي المنسق لـ DDSM) نسخة محدثة وموحدة من قاعدة البيانات الرقمية لفحص التصوير الشعاعي للثدي (DDSM). DDSM عبارة عن قاعدة بيانات تضم 2620 دراسة لتصوير الثدي بالأشعة السينية الممسوحة ضوئيًا. أنه يحتوي على الحالات الطبيعية والحميدة والخبيثة مع معلومات مرضية مؤكدة.
يتكون التكوين الافتراضي من تصحيحات مستخرجة من صور الثدي الشعاعية الأصلية، باتباع الوصف الموجود في ( http://arxiv.org/abs/1708.09427 )، من أجل تحديد إطار المهمة لحلها في إعداد تصنيف الصور التقليدي.
الصفحة الرئيسية : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
كود المصدر :
tfds.image_classification.CuratedBreastImagingDDSM
الإصدارات :
-
2.0.1
: واجهة برمجة التطبيقات المقسمة الجديدة ( https://tensorflow.org/datasets/splits ) -
3.0.0
(افتراضي): أخذ عينات أفضل للمحاصيل ( https://github.com/tensorflow/datasets/pull/2502 )
-
تعليمات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل البيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية هي~/tensorflow_datasets/downloads/manual/
):
يمكنك تنزيل الصور من https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
ونظرًا للحاجة إلى برامج ومكتبات خاصة لتنزيل الصور الموجودة في مجموعة البيانات وقراءتها، يفترض TFDS أن المستخدم قام بتنزيل ملفات DCIM الأصلية وتحويلها إلى PNG.
ينبغي استخدام الأوامر التالية (أو ما يعادلها) لإنشاء ملفات PNG، لضمان نتائج قابلة للتكرار:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
يجب وضع الصور الناتجة في manual_dir
، مثل: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
التخزين المؤقت التلقائي ( الوثائق ): لا
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الاقتباس :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (التكوين الافتراضي)
وصف التكوين : تصحيحات تحتوي على حالات التكلس والحالات الجماعية، بالإضافة إلى مسارات خالية من أي شذوذ. تم تصميمه كمهمة تصنيف تقليدية من 5 فئات.
حجم التحميل :
2.01 MiB
حجم مجموعة البيانات :
801.46 MiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | 5,580 |
- هيكل الميزة :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
بطاقة تعريف | نص | خيط | ||
صورة | صورة | (لا شيء، لا شيء، 1) | uint8 | |
ملصق | ClassLabel | int64 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
وصف التكوين : الصور الأصلية لحالات التكلس مضغوطة بصيغة PNG بدون فقدان البيانات.
حجم التحميل :
1.06 MiB
حجم مجموعة البيانات :
4.42 GiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 284 |
'train' | 1,227 |
- هيكل الميزة :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
تشوهات | تسلسل | |||
شذوذات / التقييم | ClassLabel | int64 | ||
شذوذات/calc_distribution | ClassLabel | int64 | ||
شذوذات/calc_type | ClassLabel | int64 | ||
شذوذات/معرف | الموتر | int32 | ||
شذوذات / قناع | صورة | (لا شيء، لا شيء، 1) | uint8 | |
التشوهات / علم الأمراض | ClassLabel | int64 | ||
شذوذات / دقة | ClassLabel | int64 | ||
صدر | ClassLabel | int64 | ||
بطاقة تعريف | نص | خيط | ||
صورة | صورة | (لا شيء، لا شيء، 1) | uint8 | |
مريض | نص | خيط | ||
منظر | ClassLabel | int64 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
وصف التكوين : الصور الأصلية للحالات الجماعية مضغوطة بتنسيق PNG بدون فقدان البيانات.
حجم التحميل :
966.57 KiB
حجم مجموعة البيانات :
4.80 GiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 348 |
'train' | 1,166 |
- هيكل الميزة :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
تشوهات | تسلسل | |||
شذوذات / التقييم | ClassLabel | int64 | ||
شذوذات/معرف | الموتر | int32 | ||
شذوذات / قناع | صورة | (لا شيء، لا شيء، 1) | uint8 | |
شذوذات/mass_margins | ClassLabel | int64 | ||
شذوذات/mass_shape | ClassLabel | int64 | ||
التشوهات / علم الأمراض | ClassLabel | int64 | ||
شذوذات / دقة | ClassLabel | int64 | ||
صدر | ClassLabel | int64 | ||
بطاقة تعريف | نص | خيط | ||
صورة | صورة | (لا شيء، لا شيء، 1) | uint8 | |
مريض | نص | خيط | ||
منظر | ClassLabel | int64 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):