Cette opération produit une région d'intérêts à partir de boîtes englobantes données (bbox_deltas) codées par rapport aux ancres selon l'équation 2 dans arXiv : 1506.01497.
L'opération sélectionne les boîtes de notation `pre_nms_topn` supérieures, les décode par rapport aux ancres, applique une suppression non maximale sur les boîtes qui se chevauchent avec une valeur d'intersection sur union (iou) supérieure à `nms_threshold`, rejetant les boîtes dont le côté le plus court est inférieur à ` min_size`. Entrées : `scores` : Un tenseur de forme 4D [Batch, Height, width, Num Anchors] contenant les scores par ancre à une position donnée `bbox_deltas` : est un tenseur de forme [Batch, Height, width, 4 x Num Anchors] cases codées pour chaque ancre `anchors` : Un tenseur 1D de forme [4 x Num Anchors], représentant les ancres. Sorties : `rois` : sortie RoIs, un tenseur 3D de forme [Batch, post_nms_topn, 4], complété par 0 si moins de candidats post_nms_topn trouvés. `roi_probabilities` : scores de probabilité de chaque roi dans 'rois', un tenseur 2D de forme [Batch,post_nms_topn], complété par 0 si nécessaire, trié par scores.
Classes imbriquées
classe | GénérerBoundingBoxProposals.Options | Attributs facultatifs pour GenerateBoundingBoxProposals |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
statique GenerateBoundingBoxProposals | créer ( Portée de portée , Opérande < TFloat32 > scores, Opérande < TFloat32 > bboxDeltas, Opérande < TFloat32 > imageInfo, Opérande < TFloat32 > ancres, Opérande < TFloat32 > nmsThreshold, Opérande < TInt32 > preNmsTopn, Opérande < TFloat32 > minSize, Options.. .options ) Méthode d'usine pour créer une classe encapsulant une nouvelle opération GenerateBoundingBoxProposals. |
statique GenerateBoundingBoxProposals.Options | postNmsTopn (postNmsTopn long) |
Sortie < TFloat32 > | roiProbabilités () Un tenseur flottant 2D de forme `[num_images, post_nms_topn]` représentant le score de la zone d'intérêt en tenseur `rois` au même index. |
Sortie < TFloat32 > | rois () Un tenseur flottant 3D de forme `[num_images,post_nms_topn,4]` représentant la région d'intérêt sélectionnée. |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
public static GenerateBoundingBoxProposals créer ( Portée de portée , Opérande < TFloat32 > scores, Opérande < TFloat32 > bboxDeltas, Opérande < TFloat32 > imageInfo, Opérande < TFloat32 > ancres, Opérande < TFloat32 > nmsThreshold, Opérande < TInt32 > preNmsTopn, Opérande < TFloat32 > minSize, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération GenerateBoundingBoxProposals.
Paramètres
portée | portée actuelle |
---|---|
partitions | Un tenseur flottant 4D de forme `[num_images, height, width, num_achors]` contenant des scores de boîtes pour des ancres données, peut être non trié. |
bboxDeltas | Un tenseur flottant 4D de forme `[num_images, height, width, 4 x num_anchors]`. boîtes d'encodage en fonction de chaque ancre. Les coordonnées sont données sous la forme [dy, dx, dh, dw]. |
imageInfo | Un tenseur flottant 2D de forme `[num_images, 5]` contenant les informations sur l'image Hauteur, Largeur et Échelle. |
ancres | Un tenseur flottant 2D de forme `[num_anchors, 4]` décrivant les boîtes d'ancrage. Les boîtes sont formatées sous la forme [y1, x1, y2, x2]. |
nmsSeuil | Un tenseur flottant scalaire pour le seuil de suppression non maximale. |
preNmsTopn | Un tenseur int scalaire pour le nombre de cases avec les meilleurs scores à utiliser comme entrée. |
Taille min | Un tenseur flottant scalaire. Toute boîte dont la taille est inférieure à min_size sera supprimée. |
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de GenerateBoundingBoxProposals
public static GenerateBoundingBoxProposals.Options postNmsTopn (Long postNmsTopn)
Paramètres
postNmsTopn | Un nombre entier. Nombre maximum de rois dans la sortie. |
---|
Sortie publique < TFloat32 > roiProbabilities ()
Un tenseur flottant 2D de forme `[num_images, post_nms_topn]` représentant le score de la zone d'intérêt en tenseur `rois` au même index.