curadoria_breast_imaging_ddsm

  • Descrição :

O CBIS-DDSM (Curated Breast Imaging Subset of DDSM) é uma versão atualizada e padronizada do Banco de Dados Digital para Mamografia de Triagem (DDSM). O DDSM é um banco de dados de 2.620 estudos de mamografia digitalizada. Ele contém casos normais, benignos e malignos com informações patológicas verificadas.

A configuração padrão é feita de patches extraídos das mamografias originais, seguindo a descrição de ( http://arxiv.org/abs/1708.09427 ), a fim de enquadrar a tarefa a ser resolvida em um ambiente tradicional de classificação de imagens.

Como são necessários software e bibliotecas especiais para baixar e ler as imagens contidas no conjunto de dados, o TFDS assume que o usuário baixou os arquivos DCIM originais e os converteu para PNG.

Os seguintes comandos (ou equivalentes) devem ser usados ​​para gerar os arquivos PNG, a fim de garantir resultados reproduzíveis:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

As imagens resultantes devem ser colocadas em manual_dir , como: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (configuração padrão)

  • Descrição da configuração : Patches contendo casos de calsificação e massa, além de caminhos sem anormalidades. Projetado como uma tarefa tradicional de classificação de 5 classes.

  • Tamanho do download : 2.01 MiB

  • Tamanho do conjunto de dados : 801.46 MiB

  • Divisões :

Dividir Exemplos
'test' 9.770
'train' 49.780
'validation' 5.580
  • Estrutura de recursos :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
eu ia Texto corda
imagem Imagem (Nenhum, Nenhum, 1) uint8
rótulo ClassLabel int64

Visualização

curated_breast_imaging_ddsm/original-calc

  • Descrição da configuração : Imagens originais dos casos de calcificação compactadas em PNG sem perdas.

  • Tamanho do download : 1.06 MiB

  • Tamanho do conjunto de dados : 4.42 GiB

  • Divisões :

Dividir Exemplos
'test' 284
'train' 1.227
  • Estrutura de recursos :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
anormalidades Seqüência
anormalidades/avaliação ClassLabel int64
anormalidades/calc_distribution ClassLabel int64
anormalidades/calc_type ClassLabel int64
anormalidades/id Tensor int32
anormalidades/máscara Imagem (Nenhum, Nenhum, 1) uint8
anomalias/patologia ClassLabel int64
anormalidades/sutileza ClassLabel int64
seios ClassLabel int64
eu ia Texto corda
imagem Imagem (Nenhum, Nenhum, 1) uint8
paciente Texto corda
visualizar ClassLabel int64

Visualização

curated_breast_imaging_ddsm/original-mass

  • Descrição da configuração : imagens originais dos casos em massa compactadas em PNG sem perdas.

  • Tamanho do download : 966.57 KiB

  • Tamanho do conjunto de dados : 4.80 GiB

  • Divisões :

Dividir Exemplos
'test' 348
'train' 1.166
  • Estrutura de recursos :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
anormalidades Seqüência
anormalidades/avaliação ClassLabel int64
anormalidades/id Tensor int32
anormalidades/máscara Imagem (Nenhum, Nenhum, 1) uint8
anormalidades/margens_de_massa ClassLabel int64
anormalidades/forma_massa ClassLabel int64
anomalias/patologia ClassLabel int64
anormalidades/sutileza ClassLabel int64
seios ClassLabel int64
eu ia Texto corda
imagem Imagem (Nenhum, Nenhum, 1) uint8
paciente Texto corda
visualizar ClassLabel int64

Visualização