- Descrizione :
L'analisi della scena consiste nel segmentare e analizzare un'immagine in diverse regioni dell'immagine associate a categorie semantiche, come cielo, strada, persona e letto. MIT Scene Parsing Benchmark (SceneParse150) fornisce una piattaforma standard di formazione e valutazione per gli algoritmi di analisi delle scene.
Documentazione aggiuntiva : esplora documenti con codice
Pagina iniziale : http://sceneparsing.csail.mit.edu/
Codice sorgente :
tfds.datasets.scene_parse150.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione download :
936.97 MiB
Dimensione del set di dati :
904.91 MiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'test' | 2.000 |
'train' | 20.210 |
- Struttura delle caratteristiche :
FeaturesDict({
'annotation': Image(shape=(None, None, 3), dtype=uint8),
'image': Image(shape=(None, None, 3), dtype=uint8),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
annotazione | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 |
Chiavi supervisionate (vedi il documento
as_supervised
):('image', 'annotation')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{zhou2017scene,
title={Scene Parsing through ADE20K Dataset},
author={Zhou, Bolei and Zhao, Hang and Puig, Xavier and Fidler, Sanja and Barriuso, Adela and Torralba, Antonio},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
year={2017}
}