تدفق التوتر:: العمليات:: NonMaxSuppressionV5

#include <image_ops.h>

يختار بجشع مجموعة فرعية من المربعات المحيطة بترتيب تنازلي للنتيجة.

ملخص

تشذيب المربعات التي تحتوي على تقاطع عالي فوق الاتحاد (IOU) يتداخل مع المربعات المحددة مسبقًا. تتم إزالة المربعات المحيطة ذات النقاط الأقل من score_threshold . يتم توفير المربعات المحيطة بالشكل [y1، x1، y2، x2]، حيث (y1، x1) و (y2، x2) هي إحداثيات أي زوج قطري من زوايا الصندوق ويمكن تقديم الإحداثيات بشكل طبيعي (على سبيل المثال، الكذب في الفاصل الزمني [0، 1]) أو المطلق. لاحظ أن هذه الخوارزمية لا تعرف مكان الأصل في نظام الإحداثيات وهي بشكل عام ثابتة بالنسبة للتحويلات المتعامدة وترجمات نظام الإحداثيات؛ وبالتالي فإن ترجمة أو انعكاسات نظام الإحداثيات تؤدي إلى تحديد نفس المربعات بواسطة الخوارزمية. مخرجات هذه العملية عبارة عن مجموعة من الأعداد الصحيحة المفهرسة في مجموعة الإدخال للمربعات المحيطة التي تمثل المربعات المحددة. ويمكن بعد ذلك الحصول على إحداثيات المربع المحيط المقابلة للمؤشرات المحددة باستخدام tf.gather operation . على سبيل المثال: Selected_indices = tf.image.non_max_suppression_v2(boxes, Scores, max_output_size, iou_threshold, Score_threshold) Selected_boxes = tf.gather(boxes, Selected_indices) تدعم هذه العملية أيضًا وضع Soft-NMS (مع ترجيح غاوسي) (راجع Bodla et al ، https://arxiv.org/abs/1704.04503 ) حيث تقلل المربعات درجة المربعات المتداخلة الأخرى بدلاً من التسبب في تقليمها بشكل مباشر. لتمكين وضع Soft-NMS هذا، قم بتعيين المعلمة soft_nms_sigma لتكون أكبر من 0.

الحجج:

  • النطاق: كائن النطاق
  • الصناديق: موتر عائم ثنائي الأبعاد ذو شكل [num_boxes, 4] .
  • الدرجات: موتر عائم أحادي الأبعاد ذو شكل [num_boxes] يمثل درجة واحدة تتوافق مع كل مربع (كل صف من المربعات).
  • max_output_size: موتر عددي صحيح يمثل الحد الأقصى لعدد المربعات التي سيتم تحديدها عن طريق القمع غير الأقصى.
  • iou_threshold: موتر عائم ذو 0-D يمثل العتبة لتحديد ما إذا كانت الصناديق تتداخل كثيرًا فيما يتعلق بـ IOU.
  • Score_threshold: موتر عائم ذو 0-D يمثل عتبة تحديد وقت إزالة المربعات بناءً على النتيجة.
  • soft_nms_sigma: موتر عائم ذو أبعاد 0 يمثل معلمة sigma لنظام Soft NMS؛ انظر بودلا وآخرون (راجع https://arxiv.org/abs/1704.04503 ). عندما soft_nms_sigma=0.0 (وهو الإعداد الافتراضي)، فإننا نعود إلى NMS القياسي (الصلب).

السمات الاختيارية (انظر Attrs ):

  • Pad_to_max_output_size: إذا كان true، فسيتم تعبئة الناتج selected_indices ليكون بطول max_output_size . الافتراضيات كاذبة.

العوائد:

  • Output Selected_indices: موتر عدد صحيح أحادي الأبعاد للشكل [M] يمثل المؤشرات المحددة من موتر المربعات، حيث M <= max_output_size .
  • Output Selected_scores: موتر عائم أحادي الأبعاد للشكل [M] يمثل الدرجات المقابلة لكل مربع محدد، حيث M <= max_output_size . تختلف النتائج فقط عن درجات الإدخال المقابلة عند استخدام Soft NMS (أي عند soft_nms_sigma>0 )
  • Output valid_outputs: موتر عدد صحيح ذو 0D يمثل عدد العناصر الصالحة في selected_indices ، مع ظهور العناصر الصالحة أولاً.

البنائين والمدمرين

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

الصفات العامة

operation
selected_indices
selected_scores
valid_outputs

وظائف ثابتة العامة

PadToMaxOutputSize (bool x)

الهياكل

Tensorflow:: ops:: NonMaxSuppressionV5:: Attrs

محددات السمات الاختيارية لـ NonMaxSuppressionV5 .

الصفات العامة

عملية

Operation operation

Selected_indices

::tensorflow::Output selected_indices

Selected_scores

::tensorflow::Output selected_scores

valid_outputs

::tensorflow::Output valid_outputs

الوظائف العامة

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

وظائف ثابتة العامة

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)