টেনসরফ্লো :: অপস:: সম্মিলিত ননম্যাক্স দমন

#include <image_ops.h>

লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে।

সারাংশ

এই ক্রিয়াকলাপটি সমস্ত শ্রেণীতে প্রতি ব্যাচের ইনপুটগুলিতে non_max_suppression সঞ্চালন করে। উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) পূর্বে নির্বাচিত বাক্সগুলির সাথে ওভারল্যাপযুক্ত বাক্সগুলিকে ছাঁটাই করে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। লক্ষ্য করুন যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি। এছাড়াও মনে রাখবেন যে এই অ্যালগরিদমটি অরথোগোনাল রূপান্তর এবং স্থানাঙ্ক সিস্টেমের অনুবাদের জন্য অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর যা non_max_suppression করার পরে ফেরত আসে।

যুক্তি:

  • স্কোপ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকৃতির একটি 4-ডি ফ্লোট টেনসর [batch_size, num_boxes, q, 4] । যদি q 1 হয় তবে একই বক্সগুলি সমস্ত শ্রেণীর জন্য ব্যবহার করা হয় অন্যথায়, যদি q শ্রেণীর সংখ্যার সমান হয়, শ্রেণী-নির্দিষ্ট বাক্সগুলি ব্যবহার করা হয়।
  • স্কোর: আকৃতির একটি 3-ডি ফ্লোট টেনসর [batch_size, num_boxes, num_classes] প্রতিটি বাক্সের (প্রতিটি বাক্সের সারি) একটি একক স্কোর প্রতিনিধিত্ব করে।
  • max_output_size_per_class: একটি স্কেলার পূর্ণসংখ্যার টেনসর যা সর্বোচ্চ সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা প্রতি শ্রেণীতে অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচন করা হবে
  • max_total_size: একটি স্কেলার যা সব শ্রেণীর সর্বোচ্চ সংখ্যক বক্সের প্রতিনিধিত্ব করে।
  • iou_threshold: একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।
  • স্কোর_থ্রেশহোল্ড: একটি 0-ডি ফ্লোট টেনসর স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।

ঐচ্ছিক বৈশিষ্ট্য (দেখুন Attrs ):

  • pad_per_class: মিথ্যা হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস প্যাড/ক্লিপ করা হয় max_total_size এ। সত্য হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস দৈর্ঘ্য max_size_per_class * num_classes , যদি না এটি max_total_size অতিক্রম করে যে ক্ষেত্রে এটি max_total_size এ ক্লিপ করা হয়। ডিফল্ট থেকে মিথ্যা.
  • clip_boxes: সত্য হলে, অনুমান করুন বক্স স্থানাঙ্কগুলি [0, 1] এর মধ্যে এবং আউটপুট বক্সগুলি ক্লিপ করুন যদি তারা [0, 1] এর বাইরে পড়ে। মিথ্যা হলে, ক্লিপিং করবেন না এবং বক্সের স্থানাঙ্ক যেমন আছে তেমন আউটপুট করবেন না।

রিটার্ন:

  • Output nmsed_boxes: A [batch_size, max_detections, 4] float32 টেনসর যার মধ্যে নন-সপ্রেসড বক্স রয়েছে।
  • Output nmsed_scores: একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।
  • Output nmsed_classes: A [batch_size, max_detections] float32 টেনসর যাতে বক্সের জন্য ক্লাস থাকে।
  • Output valid_detections: একটি [batch_size] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। nms_boxes[i], nms_scores[i] এবং nms_class[i]-এ শুধুমাত্র উপরের num_detections[i] এন্ট্রি বৈধ। বাকি এন্ট্রি শূন্য প্যাডিং হয়.

কনস্ট্রাক্টর এবং ডেস্ট্রাক্টর

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

পাবলিক বৈশিষ্ট্য

nmsed_boxes
nmsed_classes
nmsed_scores
operation
valid_detections

পাবলিক স্ট্যাটিক ফাংশন

ClipBoxes (bool x)
PadPerClass (bool x)

কাঠামো

tensorflow:: ops:: CombinedNonMaxSuppression:: Attrs

CombinedNonMaxSuppression- এর জন্য ঐচ্ছিক অ্যাট্রিবিউট সেটার।

পাবলিক বৈশিষ্ট্য

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_class

::tensorflow::Output nmsed_classes

nmsed_স্কোর

::tensorflow::Output nmsed_scores

অপারেশন

Operation operation

valid_detections

::tensorflow::Output valid_detections

পাবলিক ফাংশন

সম্মিলিত ননম্যাক্স দমন

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

সম্মিলিত ননম্যাক্স দমন

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

পাবলিক স্ট্যাটিক ফাংশন

ক্লিপবক্স

Attrs ClipBoxes(
  bool x
)

প্যাডপারক্লাস

Attrs PadPerClass(
  bool x
)