tensorflow :: ops :: NonMaxSuppressionV5
#include <image_ops.h>
Avidamente seleciona um subconjunto de caixas delimitadoras em ordem decrescente de pontuação.
Resumo
podar as caixas que têm alta sobreposição de intersecção sobre união (IOU) com as caixas previamente selecionadas. Caixas delimitadoras com pontuação inferior a score_threshold
são removidas. As caixas delimitadoras são fornecidas como [y1, x1, y2, x2], onde (y1, x1) e (y2, x2) são as coordenadas de qualquer par diagonal de cantos da caixa e as coordenadas podem ser fornecidas como normalizadas (ou seja, situadas em o intervalo [0, 1]) ou absoluto. Observe que este algoritmo é agnóstico em relação a onde a origem está no sistema de coordenadas e, mais geralmente, é invariante para transformações ortogonais e traduções do sistema de coordenadas; assim, a tradução ou reflexos do sistema de coordenadas resulta nas mesmas caixas sendo selecionadas pelo algoritmo. A saída dessa operação é um conjunto de números inteiros indexados na coleção de entrada de caixas delimitadoras que representam as caixas selecionadas. As coordenadas da caixa delimitadora correspondentes aos índices selecionados podem então ser obtidas usando a tf.gather operation
. Por exemplo: selected_indices = tf.image.non_max_suppression_v2 (caixas, pontuações, max_output_size, iou_threshold, score_threshold) selected_boxes = tf.gather (boxes, selected_indices) Este op também suporta um modo Soft-NMS (com ponderação gaussiana) (cf Bodla et al , https://arxiv.org/abs/1704.04503 ) em que as caixas reduzem a pontuação de outras caixas sobrepostas em vez de causar diretamente a poda delas. Para habilitar este modo Soft-NMS, defina o parâmetro soft_nms_sigma
para ser maior que 0.
Argumentos:
- escopo: um objeto Scope
- caixas: Um tensor flutuante 2-D de forma
[num_boxes, 4]
. - pontuações: Um tensor flutuante 1-D de forma
[num_boxes]
representando uma única pontuação correspondente a cada caixa (cada linha de caixas). - max_output_size: Um tensor escalar inteiro que representa o número máximo de caixas a serem selecionadas por supressão não máxima.
- iou_threshold: Um tensor flutuante 0-D que representa o limite para decidir se as caixas se sobrepõem demais em relação ao IOU.
- score_threshold: Um tensor flutuante 0-D que representa o limite para decidir quando remover as caixas com base na pontuação.
- soft_nms_sigma: Um tensor flutuante 0-D que representa o parâmetro sigma para Soft NMS; consulte Bodla et al (cf https://arxiv.org/abs/1704.04503 ). Quando
soft_nms_sigma=0.0
(que é o padrão), voltamos ao NMS padrão (rígido).
Atributos opcionais (consulte Attrs
):
- pad_to_max_output_size: se verdadeiro, a saída
selected_indices
é preenchida para ter o comprimentomax_output_size
. O padrão é falso.
Retorna:
-
Output
selected_indices: Um tensor inteiro 1-D de forma[M]
representa os índices selecionados do tensor de caixas, ondeM <= max_output_size
. -
Output
selected_scores: Um tensor flutuante 1-D de forma[M]
representa as pontuações correspondentes para cada caixa selecionada, ondeM <= max_output_size
. As pontuações diferem apenas das pontuações de entrada correspondentes ao usar Soft NMS (ou seja, quandosoft_nms_sigma>0
) -
Output
valid_outputs: Um tensor inteiro 0-D representando o número de elementos válidos emselected_indices
, com os elementos válidos aparecendo primeiro.
Construtores e Destruidores | |
---|---|
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma) | |
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs) |
Atributos públicos | |
---|---|
operation | |
selected_indices | |
selected_scores | |
valid_outputs |
Funções estáticas públicas | |
---|---|
PadToMaxOutputSize (bool x) |
Structs | |
---|---|
tensorflow :: ops :: NonMaxSuppressionV5 :: Attrs | Configuradores de atributos opcionais para NonMaxSuppressionV5 . |
Atributos públicos
Operação
Operation operation
índices_elecionados
::tensorflow::Output selected_indices
selected_scores
::tensorflow::Output selected_scores
saídas_válidas
::tensorflow::Output valid_outputs
Funções públicas
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma )
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs )
Funções estáticas públicas
PadToMaxOutputSize
Attrs PadToMaxOutputSize( bool x )