Esta operación produce una región de intereses a partir de cuadros delimitadores dados (bbox_deltas) codificados con anclajes wrt de acuerdo con la ecuación 2 en arXiv:1506.01497
La operación selecciona los cuadros de puntuación superiores `pre_nms_topn`, los decodifica con respecto a los anclajes, aplica supresión no máxima en cuadros superpuestos con un valor de intersección sobre unión (iou) superior a `nms_threshold`, descartando cuadros donde el lado más corto es menor que ` tamaño_mínimo`. Entradas: `scores`: un tensor de forma 4D [Lote, Alto, Ancho, Núm. Anclajes] que contiene las puntuaciones por ancla en la posición dada `bbox_deltas`: es un tensor de forma [Lote, Alto, Ancho, 4 x Núm. Anclajes] cajas codificadas para cada ancla `anclas`: un tensor de forma 1D [4 x Num Anchors], que representa las anclas. Salidas: `rois`: RoI de salida, un tensor de forma 3D [Batch, post_nms_topn, 4], rellenado con 0 si se encuentran menos de los candidatos post_nms_topn. `roi_probabilities`: puntuaciones de probabilidad de cada roi en 'rois', un tensor de forma 2D [Batch,post_nms_topn], completado con 0 si es necesario, ordenado por puntuaciones.
Clases anidadas
clase | GenerarBoundingBoxProposals.Options | Atributos opcionales para GenerateBoundingBoxProposals |
Métodos públicos
Generar propuestas estáticas de BoundingBox | crear ( alcance alcance , puntuaciones de operando <Float>, operando <Float> bboxDeltas, operando <Float> imageInfo, operando <Float> anclajes, operando <Float> nmsThreshold, operando <Integer> preNmsTopn, operando <Float> minSize, opciones.. . opciones) Método de fábrica para crear una clase que envuelve una nueva operación GenerateBoundingBoxProposals. |
Estático GenerateBoundingBoxProposals.Options | postNmsTopn (postNmsTopn largo) |
Salida <Flotante> | roiProbabilidades () Un tensor flotante 2-D de forma `[num_images, post_nms_topn]` que representa la puntuación del cuadro de región de interés en el tensor `rois` en el mismo índice. |
Salida <Flotante> | reyes () Un tensor flotante 3-D con forma `[num_images,post_nms_topn,4]` que representa los cuadros de región de interés seleccionados. |
Métodos heredados
Métodos públicos
public static GenerateBoundingBoxProposals create ( Alcance alcance, Operando <Float> puntuaciones, Operando <Float> bboxDeltas, Operando <Float> imageInfo, Operando <Float> anclajes, Operando <Float> nmsThreshold, Operando <Integer> preNmsTopn, Operando <Float> minSize, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación GenerateBoundingBoxProposals.
Parámetros
alcance | alcance actual |
---|---|
puntuaciones | Un tensor flotante 4-D de forma `[num_images, height, width, num_achors]` que contiene puntuaciones de los cuadros para anclajes determinados se puede desordenar. |
bboxDeltas | Un tensor flotante 4-D de forma `[num_images, alto, ancho, 4 x num_anchors]`. cajas de codificación con respecto a cada ancla. Las coordenadas se dan en la forma [dy, dx, dh, dw]. |
información de la imagen | Un tensor flotante 2-D con forma `[num_images, 5]` que contiene información de la imagen Alto, Ancho y Escala. |
anclas | Un tensor flotante 2-D con forma `[num_anchors, 4]` que describe los cuadros de anclaje. Los cuadros tienen el formato [y1, x1, y2, x2]. |
nmsUmbral | Un tensor flotante escalar para un umbral de supresión no máxima. |
preNmsTopn | Un tensor int escalar para el número de cuadros de puntuación superior que se utilizarán como entrada. |
tamaño mínimo | Un tensor flotante escalar. Cualquier casilla que tenga un tamaño menor que min_size será descartada. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de GenerateBoundingBoxProposals
público estático GenerateBoundingBoxProposals.Options postNmsTopn (postNmsTopn largo)
Parámetros
postNmsTopn | Un número entero. Número máximo de rois en la salida. |
---|
Salida pública <Float> roiProbabilities ()
Un tensor flotante 2-D de forma `[num_images, post_nms_topn]` que representa la puntuación del cuadro de región de interés en el tensor `rois` en el mismo índice.
Salida pública <Float> rois ()
Un tensor flotante 3-D con forma `[num_images,post_nms_topn,4]` que representa los cuadros de región de interés seleccionados. Ordenados en orden descendente en puntuaciones.