লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে,
এই ক্রিয়াকলাপটি সমস্ত শ্রেণীতে প্রতি ব্যাচের ইনপুটগুলিতে non_max_suppression সঞ্চালন করে। উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) পূর্বে নির্বাচিত বাক্সগুলির সাথে ওভারল্যাপযুক্ত বাক্সগুলিকে ছাঁটাই করে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। লক্ষ্য করুন যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি। এছাড়াও মনে রাখবেন যে এই অ্যালগরিদমটি অরথোগোনাল রূপান্তর এবং স্থানাঙ্ক সিস্টেমের অনুবাদের জন্য অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর যা non_max_suppression করার পরে ফেরত আসে।
নেস্টেড ক্লাস
ক্লাস | সম্মিলিতNonMaxSuppression.Options | CombinedNonMaxSuppression এর জন্য ঐচ্ছিক বৈশিষ্ট্য |
ধ্রুবক
স্ট্রিং | OP_NAME | এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত |
পাবলিক পদ্ধতি
স্ট্যাটিক CombinedNonMaxSuppression.Options | ক্লিপবক্স (বুলিয়ান ক্লিপবক্স) |
স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন | তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TFloat32 > বক্স, অপারেন্ড < TFloat32 > স্কোর, অপারেন্ড < TInt32 > maxOutputSizePerClass, অপারেন্ড < TInt32 > maxTotalSize, অপারেন্ড < TFloat32 > iouThreshold, OuThreshold, Operand 32 > অপশন, Operand 32 স্কোর ) একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি। |
আউটপুট < TFloat32 > | nmsedBoxes () একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে। |
আউটপুট < TFloat32 > | nmsed ক্লাস () একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে। |
আউটপুট < TFloat32 > | nmsedস্কোর () একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে। |
স্ট্যাটিক CombinedNonMaxSuppression.Options | padPerClass (বুলিয়ান প্যাডপারক্লাস) |
আউটপুট < TInt32 > | বৈধ সনাক্তকরণ () একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। |
উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি
ধ্রুবক
সর্বজনীন স্ট্যাটিক চূড়ান্ত স্ট্রিং OP_NAME
এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত
পাবলিক পদ্ধতি
সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন । বিকল্প ক্লিপবক্স (বুলিয়ান ক্লিপবক্স)
পরামিতি
ক্লিপবক্স | সত্য হলে, অনুমান করুন বক্স স্থানাঙ্কগুলি [0, 1] এর মধ্যে রয়েছে এবং আউটপুট বাক্সগুলি ক্লিপ করুন যদি তারা [0, 1] এর বাইরে পড়ে যায়। মিথ্যা হলে, ক্লিপিং করবেন না এবং বক্সের স্থানাঙ্ক যেমন আছে তেমন আউটপুট করবেন না। |
---|
সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TFloat32 > বক্স, অপারেন্ড < TFloat32 > স্কোর, অপারেন্ড < TInt32 > maxOutputSizePerClass, অপারেন্ড < TInt32 > maxTotalSize, <Floouath3 এবং > Operand 2 > Operand স্কোর থ্রেশহোল্ড, বিকল্প... বিকল্প)
একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
পরামিতি
সুযোগ | বর্তমান সুযোগ |
---|---|
বাক্স | আকৃতির একটি 4-D ফ্লোট টেনসর `[ব্যাচ_সাইজ, সংখ্যা_বক্স, q, 4]`। যদি `q` 1 হয় তাহলে একই বক্স সব শ্রেণীর জন্য ব্যবহার করা হয় অন্যথায়, যদি `q` ক্লাসের সংখ্যার সমান হয়, শ্রেণী-নির্দিষ্ট বাক্স ব্যবহার করা হয়। |
স্কোর | একটি 3-D ফ্লোট টেনসর আকৃতি `[batch_size, num_boxes, num_classes]` প্রতিটি বাক্সের (বাক্সের প্রতিটি সারি) সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে। |
maxOutputSizePerClass | একটি স্কেলার পূর্ণসংখ্যা টেনসর যা প্রতি শ্রেণীতে অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচিত সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে |
সর্বোচ্চ মোট আকার | একটি স্কেলার যা সব শ্রেণীর সর্বোচ্চ সংখ্যক বাক্সের প্রতিনিধিত্ব করে। |
iouThreshold | একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷ |
স্কোর থ্রেশহোল্ড | একটি 0-D ফ্লোট টেনসর যা স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷ |
বিকল্প | ঐচ্ছিক বৈশিষ্ট্য মান বহন করে |
রিটার্নস
- CombinedNonMaxSuppression এর একটি নতুন উদাহরণ
সর্বজনীন আউটপুট < TFloat32 > nmsedBoxes ()
একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।
সর্বজনীন আউটপুট < TFloat32 > nmsedClasses ()
একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে।
সর্বজনীন আউটপুট < TFloat32 > nmsedScores ()
একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।
পাবলিক স্ট্যাটিক CombinedNonMaxSuppression.Options padPerClass (বুলিয়ান প্যাডপারক্লাস)
পরামিতি
padPerClass | মিথ্যা হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস প্যাড/ক্লিপ করা হয় `max_total_size`-এ। যদি সত্য হয়, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস দৈর্ঘ্য `max_size_per_class`*`num_classes` এর জন্য প্যাড করা হয়, যদি না এটি `max_total_size` অতিক্রম করে যে ক্ষেত্রে এটি `max_total_size` এ ক্লিপ করা হয়। ডিফল্ট থেকে মিথ্যা. |
---|