टेंसरफ़्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV4

#include <image_ops.h>

लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है।

सारांश

पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को छांटना। score_threshold से कम स्कोर वाले बाउंडिंग बॉक्स हटा दिए जाते हैं। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि मूल समन्वय प्रणाली में कहां है और आमतौर पर समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट चयनित बॉक्स का प्रतिनिधित्व करने वाले बाउंडिंग बॉक्स के इनपुट संग्रह में अनुक्रमित पूर्णांकों का एक सेट है। चयनित सूचकांकों के अनुरूप बाउंडिंग बॉक्स निर्देशांक tf.gather operation उपयोग करके प्राप्त किए जा सकते हैं। उदाहरण के लिए: चयनित_सूचकांक = tf.image.non_max_suppression_v2( बॉक्स, स्कोर, अधिकतम_आउटपुट_आकार, iou_threshold, स्कोर_थ्रेशोल्ड) चयनित_बॉक्स = tf.gather(बॉक्स, चयनित_सूचकांक)

तर्क:

  • स्कोप: एक स्कोप ऑब्जेक्ट
  • बक्से: आकार का एक 2-डी फ्लोट टेंसर [num_boxes, 4]
  • स्कोर: आकार का एक 1-डी फ्लोट टेंसर [num_boxes] प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है।
  • max_output_size: एक अदिश पूर्णांक टेंसर, जो गैर-अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है।
  • iou_threshold: एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं या नहीं।
  • स्कोर_थ्रेसहोल्ड: 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है।

वैकल्पिक विशेषताएँ (देखें Attrs ):

  • पैड_टू_मैक्स_आउटपुट_साइज़: यदि सत्य है, तो आउटपुट selected_indices की लंबाई max_output_size है। डिफ़ॉल्ट से असत्य.

रिटर्न:

  • Output चयनित_सूचकांक: आकार का एक 1-डी पूर्णांक टेंसर [M] बॉक्स टेंसर से चयनित सूचकांकों का प्रतिनिधित्व करता है, जहां M <= max_output_size
  • Output वैध_आउटपुट: एक 0-डी पूर्णांक टेंसर selected_indices में वैध तत्वों की संख्या का प्रतिनिधित्व करता है, जिसमें वैध तत्व पहले दिखाई देते हैं।

निर्माता और विध्वंसक

NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const NonMaxSuppressionV4::Attrs & attrs)

सार्वजनिक गुण

operation
selected_indices
valid_outputs

सार्वजनिक स्थैतिक कार्य

PadToMaxOutputSize (bool x)

संरचनाएँ

टेंसरफ्लो:: ऑप्स:: नॉनमैक्ससप्रेशनV4:: एटर्स

NonMaxSuppressionV4 के लिए वैकल्पिक विशेषता सेटर्स।

सार्वजनिक गुण

संचालन

Operation operation

चयनित_सूचकांक

::tensorflow::Output selected_indices

वैध_आउटपुट

::tensorflow::Output valid_outputs

सार्वजनिक समारोह

नॉनमैक्ससप्रेशनV4

 NonMaxSuppressionV4(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

नॉनमैक्ससप्रेशनV4

 NonMaxSuppressionV4(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const NonMaxSuppressionV4::Attrs & attrs
)

सार्वजनिक स्थैतिक कार्य

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)