টেনসরফ্লো :: অপস:: ননম্যাক্স দমন V5

#include <image_ops.h>

লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে।

সারাংশ

পূর্বে নির্বাচিত বাক্সগুলির সাথে উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই। score_threshold চেয়ে কম স্কোর সহ বাউন্ডিং বাক্সগুলি সরানো হয়। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। উল্লেখ্য যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি এবং আরও সাধারণভাবে স্থানাঙ্ক ব্যবস্থার অর্থোগোনাল রূপান্তর এবং অনুবাদের ক্ষেত্রে অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল পূর্ণসংখ্যার একটি সেট যা নির্বাচিত বাক্সগুলির প্রতিনিধিত্বকারী বাউন্ডিং বাক্সগুলির ইনপুট সংগ্রহে সূচী করে। বাউন্ডিং বক্স স্থানাঙ্ক নির্বাচিত সূচকগুলির সাথে সম্পর্কিত তারপর tf.gather operation ব্যবহার করে প্রাপ্ত করা যেতে পারে। উদাহরণস্বরূপ: নির্বাচিত_সূচক = tf.image.non_max_suppression_v2( বক্স, স্কোর, max_output_size, iou_threshold, score_threshold) Selected_boxes = tf.gather(বক্স, নির্বাচিত_সূচক) এই অপটি একটি সফট-এনএমএস (গৌসিয়ান আল ওজন সহ) সমর্থন করে , https://arxiv.org/abs/1704.04503 ) যেখানে বক্সগুলি অন্যান্য ওভারল্যাপিং বাক্সের স্কোরকে সরাসরি ছাঁটাই করার পরিবর্তে কমিয়ে দেয়। এই সফ্ট-এনএমএস মোড সক্ষম করতে, soft_nms_sigma প্যারামিটারটিকে 0-এর থেকে বড় করতে সেট করুন৷

যুক্তি:

  • স্কোপ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকৃতির একটি 2-ডি ফ্লোট টেনসর [num_boxes, 4]
  • স্কোর: আকৃতির একটি 1-ডি ফ্লোট টেনসর [num_boxes] প্রতিটি বাক্সের (প্রতিটি বাক্সের সারি) সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে।
  • max_output_size: একটি স্কেলার পূর্ণসংখ্যা টেনসর যা সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচন করা হবে।
  • iou_threshold: একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।
  • স্কোর_থ্রেশহোল্ড: একটি 0-ডি ফ্লোট টেনসর স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।
  • soft_nms_sigma: একটি 0-D ফ্লোট টেনসর সফট এনএমএসের জন্য সিগমা পরামিতি প্রতিনিধিত্ব করে; বোদলা এট আল দেখুন (cf https://arxiv.org/abs/1704.04503 )। যখন soft_nms_sigma=0.0 (যা ডিফল্ট), তখন আমরা স্ট্যান্ডার্ড (হার্ড) NMS-এ ফিরে যাই।

ঐচ্ছিক বৈশিষ্ট্য (দেখুন Attrs ):

  • pad_to_max_output_size: সত্য হলে, আউটপুট selected_indices প্যাড করা হয় যাতে দৈর্ঘ্য max_output_size হয়। ডিফল্ট থেকে মিথ্যা.

রিটার্ন:

  • Output নির্বাচিত_সূচক: আকৃতির একটি 1-ডি পূর্ণসংখ্যা টেনসর [M] যা বক্স টেনসর থেকে নির্বাচিত সূচকগুলিকে প্রতিনিধিত্ব করে, যেখানে M <= max_output_size
  • Output নির্বাচিত_স্কোর: আকৃতির একটি 1-ডি ফ্লোট টেনসর [M] প্রতিটি নির্বাচিত বাক্সের জন্য সংশ্লিষ্ট স্কোরকে প্রতিনিধিত্ব করে, যেখানে M <= max_output_size । সফ্ট এনএমএস ব্যবহার করার সময় স্কোর শুধুমাত্র সংশ্লিষ্ট ইনপুট স্কোর থেকে আলাদা হয় (যেমন যখন soft_nms_sigma>0 )
  • Output বৈধ_আউটপুট: একটি 0-ডি পূর্ণসংখ্যা টেনসর যা selected_indices বৈধ উপাদানের সংখ্যা উপস্থাপন করে, বৈধ উপাদানগুলি প্রথমে উপস্থিত হয়।

কনস্ট্রাক্টর এবং ডেস্ট্রাক্টর

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

পাবলিক বৈশিষ্ট্য

operation
selected_indices
selected_scores
valid_outputs

পাবলিক স্ট্যাটিক ফাংশন

PadToMaxOutputSize (bool x)

কাঠামো

tensorflow:: ops:: NonMaxSuppressionV5:: Attrs

NonMaxSuppressionV5 এর জন্য ঐচ্ছিক অ্যাট্রিবিউট সেটার।

পাবলিক বৈশিষ্ট্য

অপারেশন

Operation operation

নির্বাচিত_সূচক

::tensorflow::Output selected_indices

নির্বাচিত_স্কোর

::tensorflow::Output selected_scores

বৈধ_আউটপুট

::tensorflow::Output valid_outputs

পাবলিক ফাংশন

ননম্যাক্স দমন V5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

ননম্যাক্স দমন V5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

পাবলিক স্ট্যাটিক ফাংশন

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)