Эта операция создает область интересов из заданных ограничивающих рамок (bbox_deltas), закодированных относительно привязок в соответствии с уравнением 2 в arXiv: 1506.01497.
Оператор выбирает верхние поля оценки `pre_nms_topn`, декодирует их относительно привязок, применяет немаксимальное подавление к перекрывающимся полям со значением пересечения через объединение (iou) выше `nms_threshold`, отбрасывая поля, где короткая сторона меньше ` min_size`. Входные данные: `scores`: 4D-тензор формы [Пакет, Высота, Ширина, Число Якорей], содержащий оценки на якорь в заданной позиции. `bbox_deltas`: тензор формы [Пакет, Высота, Ширина, 4 x Количество Якорей] поля, закодированные для каждого якоря «якоря»: одномерный тензор формы [4 x Num Anchors], представляющий якоря. Выходные данные: `rois`: выходные RoI, трехмерный тензор формы [Batch, post_nms_topn, 4], дополненный 0, если найдено меньше кандидатов post_nms_topn. `roi_probabilities`: оценки вероятности каждой ROI в ROIS, двумерном тензоре формы [Batch,post_nms_topn], дополненном 0 при необходимости, отсортированном по баллам.
Вложенные классы
сорт | GenerateBoundingBoxProposals.Options | Дополнительные атрибуты для GenerateBoundingBoxProposals |
Константы
Нить | OP_NAME | Название этой операции, известное основному движку TensorFlow. |
Публичные методы
статический GenerateBoundingBoxProposals | create ( Область видимости , Операнд < TFloat32 > оценки, Операнд < TFloat32 > bboxDeltas, Операнд < TFloat32 > imageInfo, Операнд < TFloat32 > привязки, Операнд < TFloat32 > nmsThreshold, Операнд < TInt32 > preNmsTopn, Операнд < TFloat32 > minSize, Параметры.. . параметры) Фабричный метод для создания класса, обертывающего новую операцию GenerateBoundingBoxProposals. |
статический GenerateBoundingBoxProposals.Options | postNmsTopn (длинный postNmsTopn) |
Вывод <TFloat32> | рентабельность вероятностей () Двумерный тензор с плавающей точкой формы `[num_images, post_nms_topn]`, представляющий оценку поля интересующей области в тензоре `rois` с тем же индексом. |
Вывод <TFloat32> | Ройс () Трехмерный плавающий тензор формы `[num_images,post_nms_topn,4]`, представляющий выбранную область интереса. |
Унаследованные методы
Константы
общедоступная статическая финальная строка OP_NAME
Название этой операции, известное основному движку TensorFlow.
Публичные методы
public static GenerateBoundingBoxProposals create ( Область действия, Operand < TFloat32 > оценки, Operand < TFloat32 > bboxDeltas, Operand < TFloat32 > imageInfo, Operand < TFloat32 > привязки, Operand < TFloat32 > nmsThreshold, Operand < TInt32 > preNmsTopn, Operand < TFloat32 > minSize, Варианты... варианты)
Фабричный метод для создания класса, обертывающего новую операцию GenerateBoundingBoxProposals.
Параметры
объем | текущий объем |
---|---|
баллы | Четырехмерный плавающий тензор формы `[num_images, height, width, num_achors]`, содержащий множество блоков для заданных привязок, может быть несортирован. |
bboxDeltas | Четырехмерный плавающий тензор формы `[num_images, height, width, 4 x num_anchors]`. поля кодирования с учетом каждого якоря. Координаты задаются в виде [dy, dx, dh, dw]. |
изображениеИнформация | Двумерный плавающий тензор формы `[num_images, 5]`, содержащий информацию об изображении: высоту, ширину и масштаб. |
якоря | Двумерный тензор с плавающей запятой формы `[num_anchors, 4]`, описывающий поля привязки. Поля форматируются в виде [y1, x1, y2, x2]. |
нмспорог | Скалярный тензор с плавающей запятой для порога немаксимального подавления. |
преНмстопн | Скалярный целочисленный тензор для количества полей с наибольшим количеством очков, которые будут использоваться в качестве входных данных. |
минразмер | Скалярный плавающий тензор. Любое поле, размер которого меньше min_size, будет отброшено. |
параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр GenerateBoundingBoxProposals
общедоступный статический GenerateBoundingBoxProposals.Options postNmsTopn (Long postNmsTopn)
Параметры
постНмстопн | Целое число. Максимальное количество rois в выводе. |
---|
публичный вывод <TFloat32> roiProbabilities ()
Двумерный тензор с плавающей точкой формы `[num_images, post_nms_topn]`, представляющий оценку поля интересующей области в тензоре `rois` с тем же индексом.
публичный вывод <TFloat32> rois ()
Трехмерный плавающий тензор формы `[num_images,post_nms_topn,4]`, представляющий выбранную область интереса. Сортировка по убыванию баллов.