- বর্ণনা :
SA-1B ডাউনলোড করুন
সেগমেন্ট এনিথিং 1 বিলিয়ন (SA-1B) হল একটি ডেটাসেট যা ওপেন ওয়ার্ল্ড ইমেজ থেকে সাধারণ-উদ্দেশ্য অবজেক্ট সেগমেন্টেশন মডেলের প্রশিক্ষণের জন্য ডিজাইন করা হয়েছে। ডেটাসেটটি "সেগমেন্ট এনিথিং" কাগজে চালু করা হয়েছিল।
SA-1B ডেটাসেটে 11M বৈচিত্র্যময়, উচ্চ-রেজোলিউশন, লাইসেন্সপ্রাপ্ত, এবং গোপনীয়তা-সুরক্ষামূলক ছবি এবং 1.1B মাস্ক টীকা রয়েছে। মাস্কগুলি COCO রান-লেংথ এনকোডিং (RLE) ফর্ম্যাটে দেওয়া হয় এবং ক্লাস নেই৷
লাইসেন্স কাস্টম। অনুগ্রহ করে https://ai.facebook.com/datasets/segment-anything-downloads- এ সম্পূর্ণ নিয়ম ও শর্তাবলী পড়ুন
image.content
(ছবির বিষয়বস্তু) ছাড়া সমস্ত বৈশিষ্ট্য মূল ডেটাসেটে রয়েছে।
আপনি এর সাথে সেগমেন্টেশন মাস্ক ডিকোড করতে পারেন:
import tensorflow_datasets as tfds
pycocotools = tfds.core.lazy_imports.pycocotools
ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
segmentation = example['annotations']['segmentation']
for counts, size in zip(segmentation['counts'], segmentation['size']):
encoded_mask = {'size': size, 'counts': counts}
mask = pycocotools.decode(encoded_mask) # np.array(dtype=uint8) mask
...
হোমপেজ : https://ai.facebook.com/datasets/segment-anything-downloads
উত্স কোড :
tfds.datasets.segment_anything.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোডের আকার :
10.28 TiB
ডেটাসেটের আকার :
10.59 TiB
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে
download_config.manual_dir
এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে (~/tensorflow_datasets/downloads/manual/
এ ডিফল্ট):
https://ai.facebook.com/datasets/segment-anything-downloadsmanual_dir
থেকে লিঙ্ক ফাইল ডাউনলোড করুন segment_anything_links.txt হিসাবে সংরক্ষিত লিঙ্ক ফাইল থাকা উচিত।স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 11,185,362 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'annotations': Sequence({
'area': Scalar(shape=(), dtype=uint64, description=The area in pixels of the mask.),
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=The box around the mask, in TFDS format.),
'crop_box': BBoxFeature(shape=(4,), dtype=float32, description=The crop of the image used to generate the mask, in TFDS format.),
'id': Scalar(shape=(), dtype=uint64, description=Identifier for the annotation.),
'point_coords': Tensor(shape=(1, 2), dtype=float64, description=The point coordinates input to the model to generate the mask.),
'predicted_iou': Scalar(shape=(), dtype=float64, description=The model's own prediction of the mask's quality.),
'segmentation': FeaturesDict({
'counts': string,
'size': Tensor(shape=(2,), dtype=uint64),
}),
'stability_score': Scalar(shape=(), dtype=float64, description=A measure of the mask's quality.),
}),
'image': FeaturesDict({
'content': Image(shape=(None, None, 3), dtype=uint8, description=Content of the image.),
'file_name': string,
'height': uint64,
'image_id': uint64,
'width': uint64,
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
টীকা | সিকোয়েন্স | |||
টীকা/ক্ষেত্র | স্কেলার | uint64 | মাস্কের পিক্সেলে এলাকা। | |
টীকা/bbox | বিবক্স ফিচার | (৪,) | float32 | মুখোশের চারপাশে বাক্স, TFDS ফর্ম্যাটে। |
টীকা/ক্রপ_বক্স | বিবক্স ফিচার | (৪,) | float32 | TFDS ফর্ম্যাটে মাস্ক তৈরি করতে ব্যবহৃত চিত্রের ক্রপ। |
টীকা/আইডি | স্কেলার | uint64 | টীকা জন্য শনাক্তকারী. | |
টীকা/পয়েন্ট_কোর্ড | টেনসর | (1, 2) | float64 | পয়েন্টটি মাস্ক তৈরি করতে মডেলে ইনপুট সমন্বয় করে। |
টীকা/অনুমানিত_iou | স্কেলার | float64 | মুখোশের গুণমান সম্পর্কে মডেলের নিজস্ব ভবিষ্যদ্বাণী। | |
টীকা/বিভাজন | ফিচারসডিক্ট | COCO RLE ফরম্যাটে এনকোডেড সেগমেন্টেশন মাস্ক (কী size এবং counts সহ নির্দেশনা)। | ||
টীকা/বিভাজন/গণনা | টেনসর | স্ট্রিং | ||
টীকা/বিভাজন/আকার | টেনসর | (2,) | uint64 | |
টীকা/স্থিরতা_স্কোর | স্কেলার | float64 | মুখোশের গুণমানের একটি পরিমাপ। | |
ইমেজ | ফিচারসডিক্ট | |||
ছবি/কন্টেন্ট | ছবি | (কোনটিই নয়, 3) | uint8 | ছবির বিষয়বস্তু। |
image/file_name | টেনসর | স্ট্রিং | ||
ছবি/উচ্চতা | টেনসর | uint64 | ||
ছবি/ছবি_আইডি | টেনসর | uint64 | ||
ছবি/প্রস্থ | টেনসর | uint64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ): অনুপস্থিত।
উদ্ধৃতি :
@misc{kirillov2023segment,
title={Segment Anything},
author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
year={2023},
eprint={2304.02643},
archivePrefix={arXiv},
primaryClass={cs.CV}
}