جریان تنسور:: عملیات:: CombinedNonMaxSuppression
#include <image_ops.h>
حریصانه زیرمجموعه ای از جعبه های محدود کننده را به ترتیب امتیاز نزولی انتخاب می کند.
خلاصه
این عملیات non_max_suppression را روی ورودیهای هر دسته، در همه کلاسها انجام میدهد. جعبههایی را که دارای تقاطع بیش از حد (IOU) بالا هستند با جعبههای انتخاب شده قبلی همپوشانی دارند. جعبه های مرزی به صورت [y1، x1، y2، x2] عرضه می شوند، که در آن (y1، x1) و (y2، x2) مختصات هر جفت مورب گوشه های جعبه هستند و مختصات را می توان به صورت نرمال ارائه کرد (یعنی خوابیده در فاصله [0، 1]) یا مطلق. توجه داشته باشید که این الگوریتم نسبت به جایی که مبدأ در سیستم مختصات است آگنوستیک است. همچنین توجه داشته باشید که این الگوریتم نسبت به تبدیلهای متعامد و ترجمههای سیستم مختصات ثابت است. بنابراین ترجمه یا بازتاب سیستم مختصات منجر به انتخاب کادرهای مشابه توسط الگوریتم می شود. خروجی این عملیات، کادرهای نهایی، امتیازها و تانسور کلاسهایی است که پس از انجام non_max_suppression برگردانده میشوند.
استدلال ها:
- scope: یک شی Scope
- جعبه ها: یک تانسور شناور 4 بعدی با شکل
[batch_size, num_boxes, q, 4]
. اگرq
1 باشد، جعبههای یکسان برای همه کلاسها استفاده میشود، در غیر این صورت، اگرq
برابر با تعداد کلاسها باشد، از کادرهای مخصوص کلاس استفاده میشود. - امتیازها: یک تانسور شناور سه بعدی با شکل
[batch_size, num_boxes, num_classes]
که نشان دهنده یک امتیاز منفرد مربوط به هر جعبه (هر ردیف از جعبه ها) است. - max_output_size_per_class: یک تانسور عدد صحیح اسکالر که نشان دهنده حداکثر تعداد کادرهایی است که باید با سرکوب غیر حداکثر در هر کلاس انتخاب شوند.
- max_total_size: یک اسکالر نشان دهنده حداکثر تعداد جعبه های حفظ شده در تمام کلاس ها.
- iou_threshold: یک تانسور شناور 0-D که آستانه ای را برای تصمیم گیری در مورد همپوشانی بیش از حد جعبه ها نسبت به IOU نشان می دهد.
- score_threshold: یک تانسور شناور 0-D که آستانه تصمیم گیری برای حذف جعبه ها بر اساس امتیاز را نشان می دهد.
ویژگی های اختیاری (به Attrs
مراجعه کنید):
- pad_per_class: اگر نادرست باشد، جعبههای nmsed خروجی، امتیازها و کلاسها به
max_total_size
اضافه میشوند/بریده میشوند. اگر درست باشد، جعبههای nmsed خروجی، امتیازها و کلاسها به طولmax_size_per_class
*num_classes
اضافه میشوند، مگر اینکه ازmax_total_size
بیشتر شود که در این صورت بهmax_total_size
بریده میشود. پیش فرض به نادرست. - clip_boxes: اگر درست است، فرض کنید مختصات کادر بین [0، 1] باشد و اگر از [0، 1] خارج شد، جعبههای خروجی را قطع کنید. اگر نادرست است، برش را انجام ندهید و مختصات جعبه را همانطور که هست خارج کنید.
برمیگرداند:
-
Output
nmsed_boxes: یک [batch_size, max_detections, 4] float32 تانسور حاوی جعبه های غیرحداکثر سرکوب شده. -
Output
nmsed_scores: تانسور [batch_size, max_detections] float32 حاوی امتیازات جعبه ها. -
Output
nmsed_classes: یک [batch_size, max_detections] تانسور float32 حاوی کلاسهای جعبهها. -
Output
valid_detections: یک تانسور [batch_size] int32 که تعداد شناساییهای معتبر در هر آیتم دستهای را نشان میدهد. فقط ورودیهای num_detections[i] برتر در nms_boxes[i]، nms_scores[i] و nms_class[i] معتبر هستند. بقیه ورودیها بدون بالشتک هستند.
سازندگان و ویرانگرها | |
---|---|
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold) | |
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs) |
صفات عمومی | |
---|---|
nmsed_boxes | |
nmsed_classes | |
nmsed_scores | |
operation | |
valid_detections |
توابع استاتیک عمومی | |
---|---|
ClipBoxes (bool x) | |
PadPerClass (bool x) |
سازه ها | |
---|---|
tensorflow:: ops:: CombinedNonMaxSuppression:: Attrs | تنظیم کننده های ویژگی اختیاری برای CombinedNonMaxSuppression . |
صفات عمومی
nmsed_boxes
::tensorflow::Output nmsed_boxes
nmsed_classes
::tensorflow::Output nmsed_classes
nmsed_scores
::tensorflow::Output nmsed_scores
عملیات
Operation operation
valid_detections
::tensorflow::Output valid_detections
توابع عمومی
CombinedNonMaxSuppression
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold )
CombinedNonMaxSuppression
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs )
توابع استاتیک عمومی
Clipboxes
Attrs ClipBoxes( bool x )
PadPerClass
Attrs PadPerClass( bool x )
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2024-11-18 بهوقت ساعت هماهنگ جهانی.