dòng chảy căng:: ôi:: NonMaxSuppressionV5

#include <image_ops.h>

Tham lam chọn một tập hợp con các hộp giới hạn theo thứ tự điểm giảm dần.

Bản tóm tắt

cắt bỏ các hộp có sự chồng chéo cao (IOU) với các hộp đã chọn trước đó. Các hộp giới hạn có số điểm nhỏ hơn score_threshold sẽ bị xóa. Các hộp giới hạn được cung cấp dưới dạng [y1, x1, y2, x2], trong đó (y1, x1) và (y2, x2) là tọa độ của bất kỳ cặp góc chéo nào của hộp và tọa độ có thể được cung cấp dưới dạng chuẩn hóa (nghĩa là nằm trong khoảng [0, 1]) hoặc tuyệt đối. Lưu ý rằng thuật toán này không xác định được gốc tọa độ ở đâu và nói chung là bất biến đối với các phép biến đổi trực giao và tịnh tiến của hệ tọa độ; do đó việc dịch hoặc phản ánh của hệ tọa độ dẫn đến các hộp giống nhau được thuật toán chọn. Đầu ra của thao tác này là một tập hợp các số nguyên được lập chỉ mục vào tập hợp đầu vào của các hộp giới hạn đại diện cho các hộp đã chọn. Sau đó, tọa độ hộp giới hạn tương ứng với các chỉ số đã chọn có thể được lấy bằng cách sử dụng tf.gather operation . Ví dụ: selected_indices = tf.image.non_max_suppression_v2( hộp, điểm, max_output_size, iou_threshold, Score_threshold) selected_boxes = tf.gather(boxes, selected_indices) Op này cũng hỗ trợ chế độ Soft-NMS (với trọng số Gaussian) (cf Bodla et al , https://arxiv.org/abs/1704.04503 ) trong đó các hộp làm giảm điểm của các hộp chồng chéo khác thay vì trực tiếp khiến chúng bị cắt bớt. Để bật chế độ Soft-NMS này, hãy đặt tham số soft_nms_sigma lớn hơn 0.

Lập luận:

  • phạm vi: Một đối tượng Phạm vi
  • hộp: Một tensor nổi 2-D có hình dạng [num_boxes, 4] .
  • điểm số: Một tenxơ float 1-D có hình dạng [num_boxes] biểu thị một điểm duy nhất tương ứng với mỗi hộp (mỗi hàng hộp).
  • max_output_size: Một tenxơ số nguyên vô hướng biểu thị số lượng hộp tối đa được chọn bằng cách triệt tiêu không tối đa.
  • iou_threshold: Một tenxơ float 0-D biểu thị ngưỡng để quyết định xem các hộp có chồng chéo quá nhiều so với IOU hay không.
  • Score_threshold: Một tensor float 0-D biểu thị ngưỡng để quyết định thời điểm loại bỏ các hộp dựa trên điểm số.
  • soft_nms_sigma: Một tenxơ float 0-D biểu thị tham số sigma cho Soft NMS; xem Bodla và cộng sự (xem https://arxiv.org/abs/1704.04503 ). Khi soft_nms_sigma=0.0 (là mặc định), chúng tôi quay lại NMS tiêu chuẩn (cứng).

Thuộc tính tùy chọn (xem Attrs ):

  • pad_to_max_output_size: Nếu đúng, đầu ra selected_indices sẽ được đệm để có độ dài max_output_size . Mặc định là sai.

Trả về:

  • Output selected_indices: Một tenxơ số nguyên 1-D có hình dạng [M] biểu thị các chỉ số đã chọn từ tenxơ hộp, trong đó M <= max_output_size .
  • Output đã chọn_scores: Một tenxơ float 1-D có hình dạng [M] biểu thị điểm tương ứng cho mỗi hộp được chọn, trong đó M <= max_output_size . Điểm chỉ khác với điểm đầu vào tương ứng khi sử dụng Soft NMS (tức là khi soft_nms_sigma>0 )
  • Output valid_outputs: Một tenxơ số nguyên 0-D biểu thị số phần tử hợp lệ trong selected_indices , với các phần tử hợp lệ xuất hiện đầu tiên.

Hàm tạo và hàm hủy

NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma)
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs)

Thuộc tính công khai

operation
selected_indices
selected_scores
valid_outputs

Các hàm tĩnh công khai

PadToMaxOutputSize (bool x)

Cấu trúc

tensorflow:: ops:: NonMaxSuppressionV5:: Attrs

Bộ cài đặt thuộc tính tùy chọn cho NonMaxSuppressionV5 .

Thuộc tính công khai

hoạt động

Operation operation

đã chọn_chỉ số

::tensorflow::Output selected_indices

đã chọn_scores

::tensorflow::Output selected_scores

hợp lệ_outputs

::tensorflow::Output valid_outputs

Chức năng công cộng

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma
)

NonMaxSuppressionV5

 NonMaxSuppressionV5(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  ::tensorflow::Input soft_nms_sigma,
  const NonMaxSuppressionV5::Attrs & attrs
)

Các hàm tĩnh công khai

PadToMaxKích thước đầu ra

Attrs PadToMaxOutputSize(
  bool x
)