टेंसरफ़्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV4
#include <image_ops.h>
लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है।
सारांश
पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को छांटना। score_threshold
से कम स्कोर वाले बाउंडिंग बॉक्स हटा दिए जाते हैं। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि मूल समन्वय प्रणाली में कहां है और आमतौर पर समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट चयनित बॉक्स का प्रतिनिधित्व करने वाले बाउंडिंग बॉक्स के इनपुट संग्रह में अनुक्रमित पूर्णांकों का एक सेट है। चयनित सूचकांकों के अनुरूप बाउंडिंग बॉक्स निर्देशांक tf.gather operation
उपयोग करके प्राप्त किए जा सकते हैं। उदाहरण के लिए: चयनित_सूचकांक = tf.image.non_max_suppression_v2( बॉक्स, स्कोर, अधिकतम_आउटपुट_आकार, iou_threshold, स्कोर_थ्रेशोल्ड) चयनित_बॉक्स = tf.gather(बॉक्स, चयनित_सूचकांक)
तर्क:
- स्कोप: एक स्कोप ऑब्जेक्ट
- बक्से: आकार का एक 2-डी फ्लोट टेंसर
[num_boxes, 4]
। - स्कोर: आकार का एक 1-डी फ्लोट टेंसर
[num_boxes]
प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है। - max_output_size: एक अदिश पूर्णांक टेंसर, जो गैर-अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है।
- iou_threshold: एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं या नहीं।
- स्कोर_थ्रेसहोल्ड: 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है।
वैकल्पिक विशेषताएँ (देखें Attrs
):
- पैड_टू_मैक्स_आउटपुट_साइज़: यदि सत्य है, तो आउटपुट
selected_indices
की लंबाईmax_output_size
है। डिफ़ॉल्ट से असत्य.
रिटर्न:
-
Output
चयनित_सूचकांक: आकार का एक 1-डी पूर्णांक टेंसर[M]
बॉक्स टेंसर से चयनित सूचकांकों का प्रतिनिधित्व करता है, जहांM <= max_output_size
। -
Output
वैध_आउटपुट: एक 0-डी पूर्णांक टेंसरselected_indices
में वैध तत्वों की संख्या का प्रतिनिधित्व करता है, जिसमें वैध तत्व पहले दिखाई देते हैं।
निर्माता और विध्वंसक | |
---|---|
NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold) | |
NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const NonMaxSuppressionV4::Attrs & attrs) |
सार्वजनिक गुण | |
---|---|
operation | |
selected_indices | |
valid_outputs |
सार्वजनिक स्थैतिक कार्य | |
---|---|
PadToMaxOutputSize (bool x) |
संरचनाएँ | |
---|---|
टेंसरफ्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV4:: एटर्स | NonMaxSuppressionV4 के लिए वैकल्पिक विशेषता सेटर्स। |
सार्वजनिक गुण
संचालन
Operation operation
चयनित_सूचकांक
::tensorflow::Output selected_indices
वैध_आउटपुट
::tensorflow::Output valid_outputs
सार्वजनिक समारोह
नॉनमैक्ससप्रेशनV4
NonMaxSuppressionV4( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold )
नॉनमैक्ससप्रेशनV4
NonMaxSuppressionV4( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, const NonMaxSuppressionV4::Attrs & attrs )
सार्वजनिक स्थैतिक कार्य
PadToMaxOutputSize
Attrs PadToMaxOutputSize( bool x )