GenerateBoundingBoxProposals

publiczna klasa końcowa GenerateBoundingBoxProposals

Ta operacja tworzy obszar zainteresowań z podanych obwiedni (bbox_deltas) zakodowanych kotwic wrt zgodnie z równaniem 2 w arXiv:1506.01497

Operacja wybiera górne pola punktacji `pre_nms_topn`, dekoduje je w odniesieniu do kotwic, stosuje niemaksymalne tłumienie nakładających się pól o wartości przecięcia przez związek (iou) wyższej niż `nms_threshold`, odrzucając pola, w których krótszy bok jest mniejszy niż ` min_rozmiar`. Dane wejściowe: `scores`: tensor kształtu 4D [partia, wysokość, szerokość, liczba kotwic] zawierający wyniki na kotwicę w danej pozycji `bbox_deltas`: jest tensor kształtu [partia, wysokość, szerokość, 4 x liczba kotwic] ramki zakodowane w każdej kotwicy „kotwice”: Tensor 1D kształtu [4 x Num Anchors], reprezentujący kotwice. Wyniki: `rois`: wyjściowe RoI, tensor 3D kształtu [Batch, post_nms_topn, 4], uzupełniony o 0, jeśli znaleziono mniej niż kandydatów post_nms_topn. „roi_probabilities”: wyniki prawdopodobieństwa każdego roi w „rois”, dwuwymiarowy tensor kształtu [Batch,post_nms_topn], w razie potrzeby uzupełniony wartością 0, posortowany według wyników.

Klasy zagnieżdżone

klasa GenerateBoundingBoxProposals.Options Opcjonalne atrybuty dla GenerateBoundingBoxProposals

Stałe

Strunowy OP_NAME Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Metody publiczne

statyczny GenerateBoundingBoxProposals
utwórz (Zakres zasięgu , Operand < TFloat32 > wyniki, Operand < TFloat32 > bboxDeltas, Operand < TFloat32 > imageInfo, Operand < TFloat32 > kotwice, Operand < TFloat32 > nmsThreshold, Operand < TInt32 > preNmsTopn, Operand < TFloat32 > minSize, Opcje.. .opcje )
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację GenerateBoundingBoxProposals.
statyczny GenerateBoundingBoxProposals.Options
postNmsTopn (Długi postNmsTopn)
Dane wyjściowe <TFloat32>
prawdopodobieństwa roi ()
Dwuwymiarowy tensor zmiennoprzecinkowy o kształcie „[num_images, post_nms_topn]” reprezentujący wynik pola obszaru zainteresowania w tensorze „Rois” przy tym samym indeksie.
Dane wyjściowe <TFloat32>
rois ()
Trójwymiarowy tensor zmiennoprzecinkowy o kształcie „[num_images,post_nms_topn,4]” reprezentujący wybrany obszar pól zainteresowań.

Metody dziedziczone

Stałe

publiczny statyczny końcowy ciąg znaków OP_NAME

Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Wartość stała: „GenerateBoundingBoxProposals”

Metody publiczne

Publiczne statyczne generowania statyczne pudełka Pokrywa ( zakres zakresu , operand <tfloat32> wyniki, operand <tfloat32> bboxdeltas, operand <Tfloat32> ImageInfo, operand <Tfloat32> kotwice, operand <Tfloat32> nmsthrreshold, operand <Tint32> Prenmstopn, operand <Tfloat32> MinSize Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację GenerateBoundingBoxProposals.

Parametry
zakres aktualny zakres
wyniki 4-D tensor zmiennoprzecinkowy o kształcie „[liczba_obrazów, wysokość, szerokość, liczba_achors]” zawierający wyniki pól dla danych kotwic może być nieposortowany.
bboxDelty 4-D tensor zmiennoprzecinkowy o kształcie „[num_images, wysokość, szerokość, 4 x num_anchors]”. pola kodowania dotyczące każdej kotwicy. Współrzędne podaje się w postaci [dy, dx, dh, dw].
Informacje o obrazie Dwuwymiarowy tensor zmiennoprzecinkowy o kształcie „[num_images, 5]” zawierający informacje o obrazie: wysokość, szerokość i skala.
kotwice Dwuwymiarowy tensor zmiennoprzecinkowy o kształcie „[num_anchors, 4]” opisujący skrzynki zakotwiczenia. Pudełka są formatowane w postaci [y1, x1, y2, x2].
Próg nms Skalarny tensor float dla progu tłumienia niemaksymalnego.
preNmsTopn Skalarny tensor int określający liczbę pól o najwyższym wyniku, które mają być używane jako dane wejściowe.
minRozmiar Skalarny tensor float. Każde pudełko o rozmiarze mniejszym niż min_size zostanie odrzucone.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja GenerateBoundingBoxProposals

public static GenerateBoundingBoxProposals.Options postNmsTopn (Długi postNmsTopn)

Parametry
postNmsTopn Liczba całkowita. Maksymalna liczba rois na wyjściu.

publiczne dane wyjściowe < TFloat32 > roiProbabilities ()

Dwuwymiarowy tensor zmiennoprzecinkowy o kształcie „[num_images, post_nms_topn]” reprezentujący wynik pola obszaru zainteresowania w tensorze „Rois” przy tym samym indeksie.

publiczne wyjście < TFloat32 > rois ()

Trójwymiarowy tensor zmiennoprzecinkowy o kształcie „[num_images,post_nms_topn,4]” reprezentujący wybrany obszar pól zainteresowań. Posortowane w kolejności malejącej według punktów.