- Description :
SA-1B Télécharger
Segment Anything 1 Billion (SA-1B) est un ensemble de données conçu pour former des modèles de segmentation d'objets à usage général à partir d'images du monde ouvert. L'ensemble de données a été présenté dans l'article "Segment Anything" .
L'ensemble de données SA-1B se compose de 11 millions d'images diverses, haute résolution, sous licence et protégeant la confidentialité, ainsi que de 1,1 milliard d'annotations de masque. Les masques sont donnés au format RLE (Run-Length Encoding) COCO et n'ont pas de classes.
La licence est personnalisée. Veuillez lire les termes et conditions complets sur https://ai.facebook.com/datasets/segment-anything-downloads
Toutes les fonctionnalités sont dans l'ensemble de données d'origine sauf image.content
(contenu de l'image).
Vous pouvez décoder les masques de segmentation avec :
import tensorflow_datasets as tfds
pycocotools = tfds.core.lazy_imports.pycocotools
ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
segmentation = example['annotations']['segmentation']
for counts, size in zip(segmentation['counts'], segmentation['size']):
encoded_mask = {'size': size, 'counts': counts}
mask = pycocotools.decode(encoded_mask) # np.array(dtype=uint8) mask
...
Page d'accueil : https://ai.facebook.com/datasets/segment-anything-downloads
Code source :
tfds.datasets.segment_anything.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
10.28 TiB
Taille du jeu de données :
10.59 TiB
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez les données sources manuellement dans
download_config.manual_dir
(par défaut~/tensorflow_datasets/downloads/manual/
) :
Téléchargez le fichier de liens depuis https://ai.facebook.com/datasets/segment-anything-downloadsmanual_dir
doit contenir le fichier de liens enregistré sous segment_anything_links.txt.Mise en cache automatique ( documentation ) : Non
Divisions :
Diviser | Exemples |
---|---|
'train' | 11 185 362 |
- Structure des fonctionnalités :
FeaturesDict({
'annotations': Sequence({
'area': Scalar(shape=(), dtype=uint64, description=The area in pixels of the mask.),
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=The box around the mask, in TFDS format.),
'crop_box': BBoxFeature(shape=(4,), dtype=float32, description=The crop of the image used to generate the mask, in TFDS format.),
'id': Scalar(shape=(), dtype=uint64, description=Identifier for the annotation.),
'point_coords': Tensor(shape=(1, 2), dtype=float64, description=The point coordinates input to the model to generate the mask.),
'predicted_iou': Scalar(shape=(), dtype=float64, description=The model's own prediction of the mask's quality.),
'segmentation': FeaturesDict({
'counts': string,
'size': Tensor(shape=(2,), dtype=uint64),
}),
'stability_score': Scalar(shape=(), dtype=float64, description=A measure of the mask's quality.),
}),
'image': FeaturesDict({
'content': Image(shape=(None, None, 3), dtype=uint8, description=Content of the image.),
'file_name': string,
'height': uint64,
'image_id': uint64,
'width': uint64,
}),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
annotations | Séquence | |||
annotations/zone | Scalaire | uint64 | La zone en pixels du masque. | |
annotations/bbox | Fonctionnalité BBox | (4,) | flotteur32 | Le cadre autour du masque, au format TFDS. |
annotations/crop_box | Fonctionnalité BBox | (4,) | flotteur32 | Le recadrage de l'image utilisée pour générer le masque, au format TFDS. |
annotations/identifiant | Scalaire | uint64 | Identifiant de l'annotation. | |
annotations/point_coords | Tenseur | (1, 2) | flotteur64 | Les coordonnées du point entrées dans le modèle pour générer le masque. |
annotations/predicted_iou | Scalaire | flotteur64 | La propre prédiction du modèle sur la qualité du masque. | |
annotations/segmentation | FonctionnalitésDict | Masque de segmentation encodé au format COCO RLE (dict avec size et counts clés). | ||
annotations/segmentation/comptes | Tenseur | chaîne | ||
annotations/segmentation/taille | Tenseur | (2,) | uint64 | |
annotations/stabilité_score | Scalaire | flotteur64 | Une mesure de la qualité du masque. | |
image | FonctionnalitésDict | |||
image/contenu | Image | (Aucun, Aucun, 3) | uint8 | Contenu de l'image. |
image/nom_fichier | Tenseur | chaîne | ||
image/hauteur | Tenseur | uint64 | ||
image/image_id | Tenseur | uint64 | ||
image/largeur | Tenseur | uint64 |
Clés supervisées (Voir doc
as_supervised
) :None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ) : manquant.
Citation :
@misc{kirillov2023segment,
title={Segment Anything},
author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
year={2023},
eprint={2304.02643},
archivePrefix={arXiv},
primaryClass={cs.CV}
}