تدفق التوتر:: العمليات:: CombinedNonMaxSuppression

#include <image_ops.h>

يختار بجشع مجموعة فرعية من المربعات المحيطة بترتيب تنازلي للنتيجة.

ملخص

تنفذ هذه العملية قمعًا غير أقصى على المدخلات لكل دفعة، عبر جميع الفئات. يزيل المربعات التي تحتوي على تقاطع عالي فوق الاتحاد (IOU) يتداخل مع المربعات المحددة مسبقًا. يتم توفير المربعات المحيطة بالشكل [y1، x1، y2، x2]، حيث (y1، x1) و (y2، x2) هي إحداثيات أي زوج قطري من زوايا الصندوق ويمكن تقديم الإحداثيات بشكل طبيعي (على سبيل المثال، الكذب في الفاصل الزمني [0، 1]) أو المطلق. لاحظ أن هذه الخوارزمية لا تعرف مكان الأصل في نظام الإحداثيات. لاحظ أيضًا أن هذه الخوارزمية ثابتة بالنسبة للتحويلات والترجمات المتعامدة لنظام الإحداثيات؛ وبالتالي فإن ترجمة أو انعكاسات نظام الإحداثيات تؤدي إلى تحديد نفس المربعات بواسطة الخوارزمية. مخرجات هذه العملية هي المربعات النهائية والدرجات وموتر الفئات التي تم إرجاعها بعد إجراء Non_max_suppression.

الحجج:

  • النطاق: كائن النطاق
  • الصناديق: موتر عائم رباعي الأبعاد ذو شكل [batch_size, num_boxes, q, 4] . إذا كانت q تساوي 1، فسيتم استخدام نفس المربعات لجميع الفئات، وإلا، إذا كانت q تساوي عدد الفئات، فسيتم استخدام المربعات الخاصة بفئة معينة.
  • الدرجات: موتر عائم ثلاثي الأبعاد ذو شكل [batch_size, num_boxes, num_classes] يمثل درجة واحدة تتوافق مع كل مربع (كل صف من المربعات).
  • max_output_size_per_class: موتر عددي صحيح يمثل الحد الأقصى لعدد المربعات التي سيتم تحديدها عن طريق القمع غير الأقصى لكل فئة
  • max_total_size: حجم عددي يمثل الحد الأقصى لعدد الصناديق المحتجزة في جميع الفئات.
  • iou_threshold: موتر عائم ذو 0-D يمثل العتبة لتحديد ما إذا كانت الصناديق تتداخل كثيرًا فيما يتعلق بـ IOU.
  • Score_threshold: موتر عائم ذو 0-D يمثل عتبة تحديد وقت إزالة المربعات بناءً على النتيجة.

السمات الاختيارية (انظر Attrs ):

  • Pad_per_class: إذا كان خطأ، فسيتم تعبئة/قص مربعات الإخراج والنتائج والفئات إلى max_total_size . إذا كان صحيحًا، فإن مربعات الإخراج والدرجات والفئات تكون مبطنة بطول max_size_per_class * num_classes ، ما لم تتجاوز max_total_size وفي هذه الحالة يتم قصها إلى max_total_size . الافتراضيات كاذبة.
  • clip_boxes: إذا كان صحيحًا، افترض أن إحداثيات الصندوق تقع بين [0، 1] وقم بقص مربعات الإخراج إذا كانت تتجاوز [0، 1]. إذا كان خطأ، فلا تقم بالقص وإخراج إحداثيات الصندوق كما هي.

العوائد:

  • Output nmsed_boxes: موتر [batch_size, max_detections, 4] float32 يحتوي على الصناديق المكبوتة غير القصوى.
  • Output nmsed_scores: موتر float32 [batch_size, max_detections] يحتوي على درجات الصناديق.
  • Output nmsed_classes: موتر float32 [batch_size, max_detections] يحتوي على فئات الصناديق.
  • اكتشافات صالحة Output : موتر int32 [batch_size] يشير إلى عدد الاكتشافات الصالحة لكل عنصر دفعة. فقط أفضل إدخالات num_detections[i] في nms_boxes[i] وnms_scores[i] وnms_class[i] صالحة. بقية الإدخالات هي صفر الحشوات.

البنائين والمدمرين

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

الصفات العامة

nmsed_boxes
nmsed_classes
nmsed_scores
operation
valid_detections

وظائف ثابتة العامة

ClipBoxes (bool x)
PadPerClass (bool x)

الهياكل

Tensorflow:: ops:: CombinedNonMaxSuppression:: Attrs

محددات السمات الاختيارية لـ CombinedNonMaxSuppression .

الصفات العامة

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_classes

::tensorflow::Output nmsed_classes

nmsed_scores

::tensorflow::Output nmsed_scores

عملية

Operation operation

valid_detections

::tensorflow::Output valid_detections

الوظائف العامة

CombinedNonMaxSuppression

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

CombinedNonMaxSuppression

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

وظائف ثابتة العامة

ClipBoxes

Attrs ClipBoxes(
  bool x
)

PadPerClass

Attrs PadPerClass(
  bool x
)