- 説明:
CBIS-DDSM (DDSM の厳選された乳房画像処理サブセット) は、スクリーニング マンモグラフィー用デジタル データベース (DDSM) の更新および標準化されたバージョンです。 DDSM は、2,620 件のスキャンされたフィルム マンモグラフィー検査のデータベースです。これには、正常、良性、悪性の症例と検証された病理情報が含まれています。
デフォルトの設定は、従来の画像分類設定で解決するタスクを組み立てるために、( http://arxiv.org/abs/1708.09427 ) の説明に従って、元のマンモグラムから抽出されたパッチで構成されています。
ホームページ: https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
バージョン:
-
2.0.1
: 新しい分割 API ( https://tensorflow.org/datasets/splits ) -
3.0.0
(デフォルト): クロッピングサンプリングの改善 ( https://github.com/tensorflow/datasets/pull/2502 )
-
手動ダウンロード手順: このデータセットでは、ソース データを
download_config.manual_dir
に手動でダウンロードする必要があります (デフォルトは~/tensorflow_datasets/downloads/manual/
)。
画像はhttps://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSMからダウンロードできます。
データセットに含まれる画像をダウンロードして読み取るには特別なソフトウェアとライブラリが必要であるため、TFDS はユーザーが元の DCIM ファイルをダウンロードして PNG に変換していることを前提としています。
再現可能な結果を保証するには、次のコマンド (または同等のコマンド) を使用して PNG ファイルを生成する必要があります。
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
結果のイメージは、 <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
のように、 manual_dir
に配置する必要があります。
自動キャッシュ(ドキュメント): いいえ
監視キー(
as_supervised
docを参照):None
引用:
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (デフォルト設定)
構成の説明: 石灰化と集団の両方の症例と、異常のないパスを含むパッチ。従来の 5 クラス分類タスクとして設計されています。
ダウンロードサイズ:
2.01 MiB
データセットのサイズ:
801.46 MiB
分割:
スプリット | 例 |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | 5,580 |
- 機能の構造:
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ID | 文章 | 弦 | ||
画像 | 画像 | (なし、なし、1) | uint8 | |
ラベル | クラスラベル | int64 |
- 図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
構成の説明: ロスレス PNG で圧縮された石灰化症例の元の画像。
ダウンロードサイズ:
1.06 MiB
データセットのサイズ:
4.42 GiB
分割:
スプリット | 例 |
---|---|
'test' | 284 |
'train' | 1,227 |
- 機能の構造:
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
異常 | 順序 | |||
異常・評価 | クラスラベル | int64 | ||
異常/calc_distribution | クラスラベル | int64 | ||
異常/calc_type | クラスラベル | int64 | ||
異常/ID | テンソル | int32 | ||
異常/マスク | 画像 | (なし、なし、1) | uint8 | |
異常/病理 | クラスラベル | int64 | ||
異常/微妙 | クラスラベル | int64 | ||
胸 | クラスラベル | int64 | ||
ID | 文章 | 弦 | ||
画像 | 画像 | (なし、なし、1) | uint8 | |
忍耐強い | 文章 | 弦 | ||
ビュー | クラスラベル | int64 |
- 図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
curated_breast_imaging_ddsm/オリジナル-マス
構成の説明: ロスレス PNG で圧縮された大量症例の元の画像。
ダウンロードサイズ:
966.57 KiB
データセットのサイズ:
4.80 GiB
分割:
スプリット | 例 |
---|---|
'test' | 348 |
'train' | 1,166 |
- 機能の構造:
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
異常 | 順序 | |||
異常・評価 | クラスラベル | int64 | ||
異常/ID | テンソル | int32 | ||
異常/マスク | 画像 | (なし、なし、1) | uint8 | |
異常/質量マージン | クラスラベル | int64 | ||
異常/腫瘤の形状 | クラスラベル | int64 | ||
異常/病理 | クラスラベル | int64 | ||
異常/微妙 | クラスラベル | int64 | ||
胸 | クラスラベル | int64 | ||
ID | 文章 | 弦 | ||
画像 | 画像 | (なし、なし、1) | uint8 | |
忍耐強い | 文章 | 弦 | ||
ビュー | クラスラベル | int64 |
- 図( tfds.show_examples ):
- 例( tfds.as_dataframe ):