- คำอธิบาย :
CBIS-DDSM (ชุดย่อยการถ่ายภาพเต้านมที่ได้รับการคัดสรรของ DDSM) เป็นฐานข้อมูลดิจิทัลสำหรับการคัดกรองการตรวจเต้านม (DDSM) เวอร์ชันที่ได้รับการปรับปรุงและเป็นมาตรฐาน DDSM เป็นฐานข้อมูลของการศึกษาการตรวจแมมโมแกรมด้วยฟิล์มสแกนจำนวน 2,620 รายการ ประกอบด้วยกรณีปกติ อ่อนโยน และร้ายพร้อมข้อมูลทางพยาธิวิทยาที่ตรวจสอบแล้ว
การกำหนดค่าเริ่มต้นทำจากแพตช์ที่แยกมาจากแมมโมแกรมดั้งเดิม ตามคำอธิบายจาก ( http://arxiv.org/abs/1708.09427 ) เพื่อวางกรอบงานที่ต้องแก้ไขในการตั้งค่าการจัดหมวดหมู่รูปภาพแบบดั้งเดิม
หน้าแรก : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
ซอร์สโค้ด :
tfds.image_classification.CuratedBreastImagingDDSM
รุ่น :
-
2.0.1
: API แยกใหม่ ( https://tensorflow.org/datasets/splits ) -
3.0.0
(ค่าเริ่มต้น): การสุ่มตัวอย่างการครอบตัดที่ดีขึ้น ( https://github.com/tensorflow/datasets/pull/2502 )
-
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้ต้องการให้คุณดาวน์โหลดข้อมูลต้นฉบับด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
คุณสามารถดาวน์โหลดภาพได้จาก https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
เนื่องจากจำเป็นต้องใช้ซอฟต์แวร์และไลบรารีพิเศษในการดาวน์โหลดและอ่านรูปภาพที่มีอยู่ในชุดข้อมูล TFDS จึงถือว่าผู้ใช้ดาวน์โหลดไฟล์ DCIM ต้นฉบับแล้วแปลงเป็น PNG
ควรใช้คำสั่งต่อไปนี้ (หรือเทียบเท่า) เพื่อสร้างไฟล์ PNG เพื่อรับประกันผลลัพธ์ที่สามารถทำซ้ำได้:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
รูปภาพที่ได้ควรใส่ไว้ใน manual_dir
เช่น: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
แคชอัตโนมัติ ( เอกสาร ): No
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
การอ้างอิง :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (การกำหนดค่าเริ่มต้น)
คำอธิบายการกำหนดค่า : แผ่นปะที่มีทั้งแคลเซียมและกรณีมวล รวมถึงเส้นทางที่ไม่มีความผิดปกติ ออกแบบมาเป็นงานจำแนกประเภท 5 คลาสแบบดั้งเดิม
ขนาดดาวน์โหลด :
2.01 MiB
ขนาดชุดข้อมูล :
801.46 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | 5,580 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
รหัส | ข้อความ | เชือก | ||
ภาพ | ภาพ | (ไม่มี ไม่มี 1) | uint8 | |
ฉลาก | ClassLabel | int64 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/Original-calc
คำอธิบายการกำหนดค่า : รูปภาพต้นฉบับของกล่องปูนที่บีบอัดเป็น PNG แบบไม่สูญเสียข้อมูล
ขนาดดาวน์โหลด :
1.06 MiB
ขนาดชุดข้อมูล :
4.42 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 284 |
'train' | 1,227 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ความผิดปกติ | ลำดับ | |||
ความผิดปกติ/การประเมิน | ClassLabel | int64 | ||
ความผิดปกติ/calc_distribution | ClassLabel | int64 | ||
ความผิดปกติ/calc_type | ClassLabel | int64 | ||
ความผิดปกติ/รหัส | เทนเซอร์ | int32 | ||
ความผิดปกติ/หน้ากาก | ภาพ | (ไม่มี ไม่มี 1) | uint8 | |
ความผิดปกติ/พยาธิวิทยา | ClassLabel | int64 | ||
ความผิดปกติ/รายละเอียดปลีกย่อย | ClassLabel | int64 | ||
หน้าอก | ClassLabel | int64 | ||
รหัส | ข้อความ | เชือก | ||
ภาพ | ภาพ | (ไม่มี ไม่มี 1) | uint8 | |
อดทน | ข้อความ | เชือก | ||
ดู | ClassLabel | int64 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/ต้นฉบับ-มวล
คำอธิบายการกำหนดค่า : รูปภาพต้นฉบับของเคสขนาดใหญ่ที่บีบอัดเป็น PNG แบบไม่สูญเสียข้อมูล
ขนาดการดาวน์โหลด :
966.57 KiB
ขนาดชุดข้อมูล :
4.80 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 348 |
'train' | 1,166 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ความผิดปกติ | ลำดับ | |||
ความผิดปกติ/การประเมิน | ClassLabel | int64 | ||
ความผิดปกติ/รหัส | เทนเซอร์ | int32 | ||
ความผิดปกติ/หน้ากาก | ภาพ | (ไม่มี ไม่มี 1) | uint8 | |
ความผิดปกติ/mass_margins | ClassLabel | int64 | ||
ความผิดปกติ/มวล_รูปร่าง | ClassLabel | int64 | ||
ความผิดปกติ/พยาธิวิทยา | ClassLabel | int64 | ||
ความผิดปกติ/รายละเอียดปลีกย่อย | ClassLabel | int64 | ||
หน้าอก | ClassLabel | int64 | ||
รหัส | ข้อความ | เชือก | ||
ภาพ | ภาพ | (ไม่มี ไม่มี 1) | uint8 | |
อดทน | ข้อความ | เชือก | ||
ดู | ClassLabel | int64 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):