- Descripción :
El CBIS-DDSM (Subconjunto seleccionado de imágenes mamarias de DDSM) es una versión actualizada y estandarizada de la Base de datos digital para mamografías de detección (DDSM). El DDSM es una base de datos de 2620 estudios de mamografía con película escaneada. Contiene casos normales, benignos y malignos con información patológica verificada.
La configuración predeterminada está hecha de parches extraídos de las mamografías originales, siguiendo la descripción de ( http://arxiv.org/abs/1708.09427 ), para enmarcar la tarea a resolver en una configuración de clasificación de imágenes tradicional.
Página de inicio : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Código fuente :
tfds.image_classification.CuratedBreastImagingDDSM
Versiones :
-
2.0.1
: Nueva API dividida ( https://tensorflow.org/datasets/splits ) -
3.0.0
(predeterminado): mejor muestreo de recorte ( https://github.com/tensorflow/datasets/pull/2502 )
-
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
Puede descargar las imágenes desde https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Debido a que se necesitan bibliotecas y software especiales para descargar y leer las imágenes contenidas en el conjunto de datos, TFDS supone que el usuario descargó los archivos DCIM originales y los convirtió a PNG.
Se deben utilizar los siguientes comandos (o equivalentes) para generar los archivos PNG para garantizar resultados reproducibles:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
Las imágenes resultantes deben colocarse en manual_dir
, como: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
Almacenamiento en caché automático ( documentación ): No
Claves supervisadas (ver documento
as_supervised
):None
Citación :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (configuración predeterminada)
Descripción de la configuración : parches que contienen casos de calsificación y masa, además de parches sin anomalías. Diseñado como una tarea tradicional de clasificación de 5 clases.
Tamaño de descarga :
2.01 MiB
Tamaño del conjunto de datos :
801.46 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 9.770 |
'train' | 49.780 |
'validation' | 5.580 |
- Estructura de características :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
identificación | Texto | cadena | ||
imagen | Imagen | (Ninguno, Ninguno, 1) | uint8 | |
etiqueta | Etiqueta de clase | int64 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
Descripción de la configuración : Imágenes originales de los casos de calcificación comprimidas en PNG sin pérdidas.
Tamaño de descarga :
1.06 MiB
Tamaño del conjunto de datos :
4.42 GiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 284 |
'train' | 1.227 |
- Estructura de características :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
anormalidades | Secuencia | |||
anomalías/evaluación | Etiqueta de clase | int64 | ||
anomalías/calc_distribution | Etiqueta de clase | int64 | ||
anomalías/calc_type | Etiqueta de clase | int64 | ||
anomalías/identificación | Tensor | int32 | ||
anomalías/máscara | Imagen | (Ninguno, Ninguno, 1) | uint8 | |
anomalías/patología | Etiqueta de clase | int64 | ||
anomalías/sutileza | Etiqueta de clase | int64 | ||
mama | Etiqueta de clase | int64 | ||
identificación | Texto | cadena | ||
imagen | Imagen | (Ninguno, Ninguno, 1) | uint8 | |
paciente | Texto | cadena | ||
vista | Etiqueta de clase | int64 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
Descripción de la configuración : Imágenes originales de los casos masivos comprimidos en PNG sin pérdidas.
Tamaño de descarga :
966.57 KiB
Tamaño del conjunto de datos :
4.80 GiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 348 |
'train' | 1,166 |
- Estructura de características :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
anormalidades | Secuencia | |||
anomalías/evaluación | Etiqueta de clase | int64 | ||
anomalías/identificación | Tensor | int32 | ||
anomalías/máscara | Imagen | (Ninguno, Ninguno, 1) | uint8 | |
anomalías/márgenes_masa | Etiqueta de clase | int64 | ||
anomalías/forma_masa | Etiqueta de clase | int64 | ||
anomalías/patología | Etiqueta de clase | int64 | ||
anomalías/sutileza | Etiqueta de clase | int64 | ||
mama | Etiqueta de clase | int64 | ||
identificación | Texto | cadena | ||
imagen | Imagen | (Ninguno, Ninguno, 1) | uint8 | |
paciente | Texto | cadena | ||
vista | Etiqueta de clase | int64 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):