تدفق التوتر:: العمليات:: NonMaxSuppressionV5
#include <image_ops.h>
يختار بجشع مجموعة فرعية من المربعات المحيطة بترتيب تنازلي للنتيجة.
ملخص
تشذيب المربعات التي تحتوي على تقاطع عالي فوق الاتحاد (IOU) يتداخل مع المربعات المحددة مسبقًا. تتم إزالة المربعات المحيطة ذات النقاط الأقل من score_threshold
. يتم توفير المربعات المحيطة بالشكل [y1، x1، y2، x2]، حيث (y1، x1) و (y2، x2) هي إحداثيات أي زوج قطري من زوايا الصندوق ويمكن تقديم الإحداثيات بشكل طبيعي (على سبيل المثال، الكذب في الفاصل الزمني [0، 1]) أو المطلق. لاحظ أن هذه الخوارزمية لا تعرف مكان الأصل في نظام الإحداثيات وهي بشكل عام ثابتة بالنسبة للتحويلات المتعامدة وترجمات نظام الإحداثيات؛ وبالتالي فإن ترجمة أو انعكاسات نظام الإحداثيات تؤدي إلى تحديد نفس المربعات بواسطة الخوارزمية. مخرجات هذه العملية عبارة عن مجموعة من الأعداد الصحيحة المفهرسة في مجموعة الإدخال للمربعات المحيطة التي تمثل المربعات المحددة. ويمكن بعد ذلك الحصول على إحداثيات المربع المحيط المقابلة للمؤشرات المحددة باستخدام tf.gather operation
. على سبيل المثال: Selected_indices = tf.image.non_max_suppression_v2(boxes, Scores, max_output_size, iou_threshold, Score_threshold) Selected_boxes = tf.gather(boxes, Selected_indices) تدعم هذه العملية أيضًا وضع Soft-NMS (مع ترجيح غاوسي) (راجع Bodla et al ، https://arxiv.org/abs/1704.04503 ) حيث تقلل المربعات درجة المربعات المتداخلة الأخرى بدلاً من التسبب في تقليمها بشكل مباشر. لتمكين وضع Soft-NMS هذا، قم بتعيين المعلمة soft_nms_sigma
لتكون أكبر من 0.
الحجج:
- النطاق: كائن النطاق
- الصناديق: موتر عائم ثنائي الأبعاد ذو شكل
[num_boxes, 4]
. - الدرجات: موتر عائم أحادي الأبعاد ذو شكل
[num_boxes]
يمثل درجة واحدة تتوافق مع كل مربع (كل صف من المربعات). - max_output_size: موتر عددي صحيح يمثل الحد الأقصى لعدد المربعات التي سيتم تحديدها عن طريق القمع غير الأقصى.
- iou_threshold: موتر عائم ذو 0-D يمثل العتبة لتحديد ما إذا كانت الصناديق تتداخل كثيرًا فيما يتعلق بـ IOU.
- Score_threshold: موتر عائم ذو 0-D يمثل عتبة تحديد وقت إزالة المربعات بناءً على النتيجة.
- soft_nms_sigma: موتر عائم ذو أبعاد 0 يمثل معلمة sigma لنظام Soft NMS؛ انظر بودلا وآخرون (راجع https://arxiv.org/abs/1704.04503 ). عندما
soft_nms_sigma=0.0
(وهو الإعداد الافتراضي)، فإننا نعود إلى NMS القياسي (الصلب).
السمات الاختيارية (انظر Attrs
):
- Pad_to_max_output_size: إذا كان true، فسيتم تعبئة الناتج
selected_indices
ليكون بطولmax_output_size
. الافتراضيات كاذبة.
العوائد:
-
Output
Selected_indices: موتر عدد صحيح أحادي الأبعاد للشكل[M]
يمثل المؤشرات المحددة من موتر المربعات، حيثM <= max_output_size
. -
Output
Selected_scores: موتر عائم أحادي الأبعاد للشكل[M]
يمثل الدرجات المقابلة لكل مربع محدد، حيثM <= max_output_size
. تختلف النتائج فقط عن درجات الإدخال المقابلة عند استخدام Soft NMS (أي عندsoft_nms_sigma>0
) -
Output
valid_outputs: موتر عدد صحيح ذو 0D يمثل عدد العناصر الصالحة فيselected_indices
، مع ظهور العناصر الصالحة أولاً.
البنائين والمدمرين | |
---|---|
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma) | |
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs) |
الصفات العامة | |
---|---|
operation | |
selected_indices | |
selected_scores | |
valid_outputs |
وظائف ثابتة العامة | |
---|---|
PadToMaxOutputSize (bool x) |
الهياكل | |
---|---|
Tensorflow:: ops:: NonMaxSuppressionV5:: Attrs | محددات السمات الاختيارية لـ NonMaxSuppressionV5 . |
الصفات العامة
عملية
Operation operation
Selected_indices
::tensorflow::Output selected_indices
Selected_scores
::tensorflow::Output selected_scores
valid_outputs
::tensorflow::Output valid_outputs
الوظائف العامة
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma )
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs )
وظائف ثابتة العامة
PadToMaxOutputSize
Attrs PadToMaxOutputSize( bool x )
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2024-11-21 (حسب التوقيت العالمي المتفَّق عليه)