dòng chảy căng:: ôi:: NonMaxSuppressionV5
#include <image_ops.h>
Tham lam chọn một tập hợp con các hộp giới hạn theo thứ tự điểm giảm dần.
Bản tóm tắt
cắt bỏ các hộp có sự chồng chéo cao (IOU) với các hộp đã chọn trước đó. Các hộp giới hạn có số điểm nhỏ hơn score_threshold
sẽ bị xóa. Các hộp giới hạn được cung cấp dưới dạng [y1, x1, y2, x2], trong đó (y1, x1) và (y2, x2) là tọa độ của bất kỳ cặp góc chéo nào của hộp và tọa độ có thể được cung cấp dưới dạng chuẩn hóa (nghĩa là nằm trong khoảng [0, 1]) hoặc tuyệt đối. Lưu ý rằng thuật toán này không xác định được gốc tọa độ ở đâu và nói chung là bất biến đối với các phép biến đổi trực giao và tịnh tiến của hệ tọa độ; do đó việc dịch hoặc phản ánh của hệ tọa độ dẫn đến các hộp giống nhau được thuật toán chọn. Đầu ra của thao tác này là một tập hợp các số nguyên được lập chỉ mục vào tập hợp đầu vào của các hộp giới hạn đại diện cho các hộp đã chọn. Sau đó, tọa độ hộp giới hạn tương ứng với các chỉ số đã chọn có thể được lấy bằng cách sử dụng tf.gather operation
. Ví dụ: selected_indices = tf.image.non_max_suppression_v2( hộp, điểm, max_output_size, iou_threshold, Score_threshold) selected_boxes = tf.gather(boxes, selected_indices) Op này cũng hỗ trợ chế độ Soft-NMS (với trọng số Gaussian) (cf Bodla et al , https://arxiv.org/abs/1704.04503 ) trong đó các hộp làm giảm điểm của các hộp chồng chéo khác thay vì trực tiếp khiến chúng bị cắt bớt. Để bật chế độ Soft-NMS này, hãy đặt tham số soft_nms_sigma
lớn hơn 0.
Lập luận:
- phạm vi: Một đối tượng Phạm vi
- hộp: Một tensor nổi 2-D có hình dạng
[num_boxes, 4]
. - điểm số: Một tenxơ float 1-D có hình dạng
[num_boxes]
biểu thị một điểm duy nhất tương ứng với mỗi hộp (mỗi hàng hộp). - max_output_size: Một tenxơ số nguyên vô hướng biểu thị số lượng hộp tối đa được chọn bằng cách triệt tiêu không tối đa.
- iou_threshold: Một tenxơ float 0-D biểu thị ngưỡng để quyết định xem các hộp có chồng chéo quá nhiều so với IOU hay không.
- Score_threshold: Một tenxơ float 0-D biểu thị ngưỡng quyết định thời điểm loại bỏ các hộp dựa trên điểm số.
- soft_nms_sigma: Một tenxơ float 0-D biểu thị tham số sigma cho Soft NMS; xem Bodla và cộng sự (xem https://arxiv.org/abs/1704.04503 ). Khi
soft_nms_sigma=0.0
(là mặc định), chúng tôi quay lại NMS tiêu chuẩn (cứng).
Thuộc tính tùy chọn (xem Attrs
):
- pad_to_max_output_size: Nếu đúng, đầu ra
selected_indices
sẽ được đệm để có độ dàimax_output_size
. Mặc định là sai.
Trả về:
-
Output
selected_indices: Một tenxơ số nguyên 1-D có hình dạng[M]
biểu thị các chỉ số đã chọn từ tenxơ hộp, trong đóM <= max_output_size
. -
Output
đã chọn_scores: Một tenxơ float 1-D có hình dạng[M]
biểu thị điểm tương ứng cho mỗi hộp được chọn, trong đóM <= max_output_size
. Điểm chỉ khác với điểm đầu vào tương ứng khi sử dụng Soft NMS (tức là khisoft_nms_sigma>0
) -
Output
valid_outputs: Một tenxơ số nguyên 0-D biểu thị số phần tử hợp lệ trongselected_indices
, với các phần tử hợp lệ xuất hiện đầu tiên.
Hàm tạo và hàm hủy | |
---|---|
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma) | |
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs) |
Thuộc tính công khai | |
---|---|
operation | |
selected_indices | |
selected_scores | |
valid_outputs |
Các hàm tĩnh công khai | |
---|---|
PadToMaxOutputSize (bool x) |
Cấu trúc | |
---|---|
tensorflow:: ops:: NonMaxSuppressionV5:: Attrs | Bộ cài đặt thuộc tính tùy chọn cho NonMaxSuppressionV5 . |
Thuộc tính công khai
hoạt động
Operation operation
đã chọn_chỉ số
::tensorflow::Output selected_indices
đã chọn_scores
::tensorflow::Output selected_scores
hợp lệ_outputs
::tensorflow::Output valid_outputs
Chức năng công cộng
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma )
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs )
Các hàm tĩnh công khai
PadToMaxKích thước đầu ra
Attrs PadToMaxOutputSize( bool x )