- বর্ণনা :
সিবিআইএস-ডিডিএসএম (ডিডিএসএমের কিউরেটেড ব্রেস্ট ইমেজিং সাবসেট) হল স্ক্রীনিং ম্যামোগ্রাফির (ডিডিএসএম) জন্য ডিজিটাল ডেটাবেসের একটি আপডেট করা এবং প্রমিত সংস্করণ। DDSM হল 2,620টি স্ক্যান করা ফিল্ম ম্যামোগ্রাফি অধ্যয়নের একটি ডাটাবেস। এটিতে যাচাইকৃত প্যাথলজি তথ্য সহ স্বাভাবিক, সৌম্য এবং ম্যালিগন্যান্ট কেস রয়েছে।
ডিফল্ট কনফিগারেশনটি মূল ম্যামোগ্রাম থেকে বের করা প্যাচ দিয়ে তৈরি করা হয়, ( http://arxiv.org/abs/1708.09427 ) থেকে বর্ণনা অনুসরণ করে একটি ঐতিহ্যগত চিত্র শ্রেণিবিন্যাসে সমাধানের জন্য টাস্ক ফ্রেম করার জন্য।
হোমপেজ : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
সোর্স কোড :
tfds.image_classification.CuratedBreastImagingDDSM
সংস্করণ :
-
2.0.1
: নতুন স্প্লিট API ( https://tensorflow.org/datasets/splits ) -
3.0.0
(ডিফল্ট): ভাল ক্রপিং স্যাম্পলিং ( https://github.com/tensorflow/datasets/pull/2502 )
-
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে
download_config.manual_dir
এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে (~/tensorflow_datasets/downloads/manual/
এ ডিফল্ট):
আপনি https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM থেকে ছবিগুলি ডাউনলোড করতে পারেন
যেহেতু বিশেষ সফ্টওয়্যার এবং লাইব্রেরিগুলি ডেটাসেটে থাকা ছবিগুলি ডাউনলোড এবং পড়ার জন্য প্রয়োজন, TFDS অনুমান করে যে ব্যবহারকারী আসল DCIM ফাইলগুলি ডাউনলোড করেছেন এবং সেগুলিকে PNG তে রূপান্তর করেছেন৷
পুনরুত্পাদনযোগ্য ফলাফলের গ্যারান্টি দেওয়ার জন্য, PNG ফাইলগুলি তৈরি করতে নিম্নলিখিত কমান্ডগুলি (বা সমতুল্য) ব্যবহার করা উচিত:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
ফলাফলের চিত্রগুলিকে manual_dir
এ রাখতে হবে, যেমন: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
।
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
উদ্ধৃতি :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/প্যাচ (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : প্যাচগুলি যেখানে ক্যালিসিফিকেশন এবং ভর উভয় ক্ষেত্রেই রয়েছে, এবং কোনো অস্বাভাবিকতা ছাড়াই পথ। একটি ঐতিহ্যগত 5-শ্রেণীর শ্রেণীবিভাগের টাস্ক হিসাবে ডিজাইন করা হয়েছে।
ডাউনলোড সাইজ :
2.01 MiB
ডেটাসেটের আকার :
801.46 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | ৫,৫৮০ |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
আইডি | পাঠ্য | স্ট্রিং | ||
ইমেজ | ছবি | (কোনটিই নয়, 1) | uint8 | |
লেবেল | ক্লাসলেবেল | int64 |
- চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
কনফিগারেশনের বিবরণ : ক্ষতিহীন পিএনজিতে সংকুচিত ক্যালসিফিকেশন কেসের আসল চিত্র।
ডাউনলোড সাইজ :
1.06 MiB
ডেটাসেটের আকার :
4.42 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 284 |
'train' | 1,227 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
অস্বাভাবিকতা | ক্রম | |||
অস্বাভাবিকতা/মূল্যায়ন | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/ক্যাল্ক_ডিস্ট্রিবিউশন | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/ক্যাল্ক_টাইপ | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/আইডি | টেনসর | int32 | ||
অস্বাভাবিকতা/মাস্ক | ছবি | (কোনটিই নয়, 1) | uint8 | |
অস্বাভাবিকতা/প্যাথলজি | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/সূক্ষ্মতা | ক্লাসলেবেল | int64 | ||
স্তন | ক্লাসলেবেল | int64 | ||
আইডি | পাঠ্য | স্ট্রিং | ||
ইমেজ | ছবি | (কোনটিই নয়, 1) | uint8 | |
রোগী | পাঠ্য | স্ট্রিং | ||
দেখুন | ক্লাসলেবেল | int64 |
- চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/অরিজিনাল-ম্যাস
কনফিগারেশনের বিবরণ : লসলেস পিএনজিতে কম্প্রেস করা ভর কেসের আসল ছবি।
ডাউনলোড সাইজ :
966.57 KiB
ডেটাসেটের আকার :
4.80 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 348 |
'train' | 1,166 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
অস্বাভাবিকতা | ক্রম | |||
অস্বাভাবিকতা/মূল্যায়ন | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/আইডি | টেনসর | int32 | ||
অস্বাভাবিকতা/মাস্ক | ছবি | (কোনটিই নয়, 1) | uint8 | |
অস্বাভাবিকতা/ভর_মার্জিন | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/ভর_আকৃতি | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/প্যাথলজি | ক্লাসলেবেল | int64 | ||
অস্বাভাবিকতা/সূক্ষ্মতা | ক্লাসলেবেল | int64 | ||
স্তন | ক্লাসলেবেল | int64 | ||
আইডি | পাঠ্য | স্ট্রিং | ||
ইমেজ | ছবি | (কোনটিই নয়, 1) | uint8 | |
রোগী | পাঠ্য | স্ট্রিং | ||
দেখুন | ক্লাসলেবেল | int64 |
- চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):