- विवरण :
एसए-1बी डाउनलोड
सेगमेंट एनीथिंग 1 बिलियन (एसए-1बी) एक डेटासेट है जिसे खुली दुनिया की छवियों से सामान्य-उद्देश्य ऑब्जेक्ट सेगमेंटेशन मॉडल के प्रशिक्षण के लिए डिज़ाइन किया गया है। डेटासेट को "सेगमेंट एनीथिंग" पेपर में पेश किया गया था।
SA-1B डेटासेट में 11M विविध, उच्च-रिज़ॉल्यूशन, लाइसेंस प्राप्त और गोपनीयता की रक्षा करने वाली छवियां और 1.1B मास्क एनोटेशन शामिल हैं। मास्क COCO रन-लेंथ एन्कोडिंग (RLE) प्रारूप में दिए गए हैं, और इनमें कक्षाएं नहीं हैं।
लाइसेंस कस्टम है. कृपया, https://ai.facebook.com/datasets/segment-anything-downloads पर पूर्ण नियम और शर्तें पढ़ें
image.content
(छवि की सामग्री) को छोड़कर सभी सुविधाएँ मूल डेटासेट में हैं।
आप सेगमेंटेशन मास्क को डीकोड कर सकते हैं:
import tensorflow_datasets as tfds
pycocotools = tfds.core.lazy_imports.pycocotools
ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
segmentation = example['annotations']['segmentation']
for counts, size in zip(segmentation['counts'], segmentation['size']):
encoded_mask = {'size': size, 'counts': counts}
mask = pycocotools.decode(encoded_mask) # np.array(dtype=uint8) mask
...
मुखपृष्ठ : https://ai.facebook.com/datasets/segment-anything-downloads
स्रोत कोड :
tfds.datasets.segment_anything.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
10.28 TiB
डेटासेट का आकार :
10.59 TiB
मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir
(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/
) में डाउनलोड करना होगा:
लिंक फ़ाइल को https://ai.facebook.com/datasets/segment-anything-downloadsmanual_dir
डाउनलोड करें।ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 11,185,362 |
- फ़ीचर संरचना :
FeaturesDict({
'annotations': Sequence({
'area': Scalar(shape=(), dtype=uint64, description=The area in pixels of the mask.),
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=The box around the mask, in TFDS format.),
'crop_box': BBoxFeature(shape=(4,), dtype=float32, description=The crop of the image used to generate the mask, in TFDS format.),
'id': Scalar(shape=(), dtype=uint64, description=Identifier for the annotation.),
'point_coords': Tensor(shape=(1, 2), dtype=float64, description=The point coordinates input to the model to generate the mask.),
'predicted_iou': Scalar(shape=(), dtype=float64, description=The model's own prediction of the mask's quality.),
'segmentation': FeaturesDict({
'counts': string,
'size': Tensor(shape=(2,), dtype=uint64),
}),
'stability_score': Scalar(shape=(), dtype=float64, description=A measure of the mask's quality.),
}),
'image': FeaturesDict({
'content': Image(shape=(None, None, 3), dtype=uint8, description=Content of the image.),
'file_name': string,
'height': uint64,
'image_id': uint64,
'width': uint64,
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
एनोटेशन | अनुक्रम | |||
टिप्पणियाँ/क्षेत्र | अदिश | uint64 | मास्क के पिक्सेल में क्षेत्र. | |
एनोटेशन/बीबॉक्स | बीबॉक्सफ़ीचर | (4,) | फ्लोट32 | मास्क के चारों ओर का बॉक्स, टीएफडीएस प्रारूप में। |
एनोटेशन/क्रॉप_बॉक्स | बीबॉक्सफ़ीचर | (4,) | फ्लोट32 | टीएफडीएस प्रारूप में, मास्क बनाने के लिए छवि की क्रॉप का उपयोग किया गया। |
एनोटेशन/आईडी | अदिश | uint64 | एनोटेशन के लिए पहचानकर्ता. | |
टिप्पणियाँ/point_coords | टेन्सर | (1,2) | फ्लोट64 | यह बिंदु मास्क उत्पन्न करने के लिए मॉडल में इनपुट का समन्वय करता है। |
एनोटेशन/predicted_iou | अदिश | फ्लोट64 | मास्क की गुणवत्ता के बारे में मॉडल की अपनी भविष्यवाणी। | |
एनोटेशन/विभाजन | फीचर्सडिक्ट | COCO RLE प्रारूप में एन्कोडेड सेगमेंटेशन मास्क (कुंजी size और counts के साथ निर्देश)। | ||
टिप्पणियाँ/विभाजन/गिनती | टेन्सर | डोरी | ||
एनोटेशन/विभाजन/आकार | टेन्सर | (2,) | uint64 | |
एनोटेशन/स्थिरता_स्कोर | अदिश | फ्लोट64 | मास्क की गुणवत्ता का एक माप. | |
छवि | फीचर्सडिक्ट | |||
छवि/सामग्री | छवि | (कोई नहीं, कोई नहीं, 3) | uint8 | छवि की सामग्री. |
छवि/फ़ाइल_नाम | टेन्सर | डोरी | ||
छवि/ऊंचाई | टेन्सर | uint64 | ||
छवि/image_id | टेन्सर | uint64 | ||
छवि/चौड़ाई | टेन्सर | uint64 |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ): गुम है।
उद्धरण :
@misc{kirillov2023segment,
title={Segment Anything},
author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
year={2023},
eprint={2304.02643},
archivePrefix={arXiv},
primaryClass={cs.CV}
}