টেনসরফ্লো :: অপস:: সম্মিলিত ননম্যাক্স দমন
#include <image_ops.h>
লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে।
সারাংশ
এই ক্রিয়াকলাপটি সমস্ত শ্রেণীতে প্রতি ব্যাচের ইনপুটগুলিতে non_max_suppression সঞ্চালন করে। উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) পূর্বে নির্বাচিত বাক্সগুলির সাথে ওভারল্যাপযুক্ত বাক্সগুলিকে ছাঁটাই করে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। লক্ষ্য করুন যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি। এছাড়াও মনে রাখবেন যে এই অ্যালগরিদমটি অরথোগোনাল রূপান্তর এবং স্থানাঙ্ক সিস্টেমের অনুবাদের জন্য অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর যা non_max_suppression করার পরে ফেরত আসে।
যুক্তি:
- স্কোপ: একটি স্কোপ অবজেক্ট
- বাক্স: আকৃতির একটি 4-ডি ফ্লোট টেনসর
[batch_size, num_boxes, q, 4]
। যদিq
1 হয় তবে একই বক্সগুলি সমস্ত শ্রেণীর জন্য ব্যবহার করা হয় অন্যথায়, যদিq
শ্রেণীর সংখ্যার সমান হয়, শ্রেণী-নির্দিষ্ট বাক্সগুলি ব্যবহার করা হয়। - স্কোর: আকৃতির একটি 3-ডি ফ্লোট টেনসর
[batch_size, num_boxes, num_classes]
প্রতিটি বাক্সের (প্রতিটি বাক্সের সারি) একটি একক স্কোর প্রতিনিধিত্ব করে। - max_output_size_per_class: একটি স্কেলার পূর্ণসংখ্যার টেনসর যা সর্বোচ্চ সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা প্রতি শ্রেণীতে অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচন করা হবে
- max_total_size: একটি স্কেলার যা সব শ্রেণীর সর্বোচ্চ সংখ্যক বক্সের প্রতিনিধিত্ব করে।
- iou_threshold: একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।
- স্কোর_থ্রেশহোল্ড: একটি 0-ডি ফ্লোট টেনসর স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।
ঐচ্ছিক বৈশিষ্ট্য (দেখুন Attrs
):
- pad_per_class: মিথ্যা হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস প্যাড/ক্লিপ করা হয়
max_total_size
এ। সত্য হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস দৈর্ঘ্যmax_size_per_class
*num_classes
, যদি না এটিmax_total_size
অতিক্রম করে যে ক্ষেত্রে এটিmax_total_size
এ ক্লিপ করা হয়। ডিফল্ট থেকে মিথ্যা. - clip_boxes: সত্য হলে, অনুমান করুন বক্স স্থানাঙ্কগুলি [0, 1] এর মধ্যে এবং আউটপুট বক্সগুলি ক্লিপ করুন যদি তারা [0, 1] এর বাইরে পড়ে। মিথ্যা হলে, ক্লিপিং করবেন না এবং বক্সের স্থানাঙ্ক যেমন আছে তেমন আউটপুট করবেন না।
রিটার্ন:
-
Output
nmsed_boxes: A [batch_size, max_detections, 4] float32 টেনসর যার মধ্যে নন-সপ্রেসড বক্স রয়েছে। -
Output
nmsed_scores: একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে। -
Output
nmsed_classes: A [batch_size, max_detections] float32 টেনসর যাতে বক্সের জন্য ক্লাস থাকে। -
Output
valid_detections: একটি [batch_size] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। nms_boxes[i], nms_scores[i] এবং nms_class[i]-এ শুধুমাত্র উপরের num_detections[i] এন্ট্রি বৈধ। বাকি এন্ট্রি শূন্য প্যাডিং হয়.
কনস্ট্রাক্টর এবং ডেস্ট্রাক্টর | |
---|---|
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold) | |
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs) |
পাবলিক বৈশিষ্ট্য | |
---|---|
nmsed_boxes | |
nmsed_classes | |
nmsed_scores | |
operation | |
valid_detections |
পাবলিক স্ট্যাটিক ফাংশন | |
---|---|
ClipBoxes (bool x) | |
PadPerClass (bool x) |
কাঠামো | |
---|---|
tensorflow:: ops:: CombinedNonMaxSuppression:: Attrs | CombinedNonMaxSuppression- এর জন্য ঐচ্ছিক অ্যাট্রিবিউট সেটার। |
পাবলিক বৈশিষ্ট্য
nmsed_boxes
::tensorflow::Output nmsed_boxes
nmsed_class
::tensorflow::Output nmsed_classes
nmsed_স্কোর
::tensorflow::Output nmsed_scores
অপারেশন
Operation operation
valid_detections
::tensorflow::Output valid_detections
পাবলিক ফাংশন
সম্মিলিত ননম্যাক্স দমন
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold )
সম্মিলিত ননম্যাক্স দমন
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs )
পাবলিক স্ট্যাটিক ফাংশন
ক্লিপবক্স
Attrs ClipBoxes( bool x )
প্যাডপারক্লাস
Attrs PadPerClass( bool x )