tensorflow :: operaciones :: NonMaxSuppressionV5

#include <image_ops.h>

Selecciona codiciosamente un subconjunto de cuadros delimitadores en orden descendente de puntuación.

Resumen

las cajas de poda que tienen una alta intersección sobre unión (IOU) se superponen con las cajas seleccionadas previamente. Se eliminan los cuadros score_threshold con una puntuación inferior a score_threshold . Los cuadros delimitadores se proporcionan como [y1, x1, y2, x2], donde (y1, x1) y (y2, x2) son las coordenadas de cualquier par diagonal de esquinas de cuadro y las coordenadas se pueden proporcionar como normalizadas (es decir, situadas en el intervalo [0, 1]) o absoluto. Tenga en cuenta que este algoritmo es independiente de dónde está el origen en el sistema de coordenadas y, en general, es invariante a las transformaciones y traslaciones ortogonales del sistema de coordenadas; por lo tanto, la traducción o las reflexiones del sistema de coordenadas dan como resultado que el algoritmo seleccione las mismas cajas. El resultado de esta operación es un conjunto de números enteros que se indexan en la colección de entrada de cuadros delimitadores que representan los cuadros seleccionados. Las coordenadas del cuadro delimitador correspondientes a los índices seleccionados se pueden obtener usando la tf.gather operation . Por ejemplo: selected_indices = tf.image.non_max_suppression_v2 (boxes, scores, max_output_size, iou_threshold, score_threshold) selected_boxes = tf.gather (boxes, selected_indices) Esta operación también admite un modo Soft-NMS (con ponderación gaussiana) (cf Bodla et al. , https://arxiv.org/abs/1704.04503 ) donde los cuadros reducen la puntuación de otros cuadros superpuestos en lugar de hacer que se poden directamente. Para habilitar este modo Soft-NMS, configure el parámetro soft_nms_sigma para que sea mayor que 0.

Argumentos:

  • alcance: un objeto de alcance
  • cajas: Un tensor flotante 2-D de forma [num_boxes, 4] .
  • puntuaciones: un tensor flotante 1-D de forma [num_boxes] representa una única puntuación correspondiente a cada casilla (cada fila de cajas).
  • max_output_size: un tensor entero escalar que representa el número máximo de casillas que se seleccionarán mediante la supresión no máxima.
  • iou_threshold: un tensor flotante 0-D que representa el umbral para decidir si las cajas se superponen demasiado con respecto a IOU.
  • score_threshold: un tensor flotante 0-D que representa el umbral para decidir cuándo quitar casillas en función de la puntuación.
  • soft_nms_sigma: Un tensor flotante 0-D que representa el parámetro sigma para Soft NMS; véase Bodla et al (véase https://arxiv.org/abs/1704.04503 ). Cuando soft_nms_sigma=0.0 (que es el predeterminado), recurrimos al NMS estándar (duro).

Atributos opcionales (consulte Attrs ):

  • pad_to_max_output_size: si es verdadero, la salida selected_indices se rellena para que tenga la longitud max_output_size . El valor predeterminado es falso.

Devoluciones:

  • Output selected_indices: Un tensor entero 1-D de forma [M] representa los índices seleccionados del tensor de cajas, donde M <= max_output_size .
  • Output selected_scores: Un tensor flotante 1-D de forma [M] representa las puntuaciones correspondientes para cada casilla seleccionada, donde M <= max_output_size . Las puntuaciones solo difieren de las puntuaciones de entrada correspondientes cuando se utiliza Soft NMS (es decir, cuando soft_nms_sigma>0 )
  • Output valid_outputs: un tensor entero 0-D que representa el número de elementos válidos en selected_indices , con los elementos válidos que aparecen primero.

Constructores y Destructores

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

Atributos públicos

operation
selected_indices
selected_scores
valid_outputs

Funciones estáticas públicas

PadToMaxOutputSize (bool x)

Estructuras

tensorflow :: ops :: NonMaxSuppressionV5 :: Attrs

Establecedores de atributos opcionales para NonMaxSuppressionV5 .

Atributos públicos

operación

Operation operation

índices_seleccionados

::tensorflow::Output selected_indices

selected_scores

::tensorflow::Output selected_scores

salidas_validas

::tensorflow::Output valid_outputs

Funciones publicas

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

Funciones estáticas públicas

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)