Thực hiện phép nhân ma trận lượng tử hóa của `a` với ma trận `b` với phép cộng độ lệch và relu và kết hợp lại lượng tử hóa.
Đầu vào phải là ma trận hai chiều và vectơ sai lệch 1D. Và chiều bên trong của `a` (sau khi được chuyển đổi nếu `transpose_a` khác 0) phải khớp với chiều bên ngoài của `b` (sau khi được chuyển đổi nếu `transpose_b` khác 0). Sau đó thực hiện thao tác cộng quảng bá với các giá trị sai lệch trên kết quả nhân ma trận. Kích thước thiên vị phải khớp với kích thước bên trong của `b`. Sau đó thực hiện kích hoạt relu để có kết quả không âm. Sau đó thực hiện thao tác định lượng lại để có kết quả uint8 cuối cùng.
Các lớp lồng nhau
lớp học | Lượng tử hóaMatMulWithBiasAndReluAndRequantize.Options | Thuộc tính tùy chọn cho QuantizedMatMulWithBiasAndReluAndRequantize |
Hằng số
Sợi dây | OP_NAME | Tên của op này, được biết đến bởi công cụ lõi TensorFlow |
Phương pháp công khai
tĩnh <W mở rộng TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | tạo ( Phạm vi phạm vi, Toán hạng <? mở rộng TType > a, Toán hạng <? mở rộng TType > b, Toán hạng <? mở rộng TType > thiên vị, Toán hạng < TFloat32 > minA, Toán hạng < TFloat32 > maxA, Toán hạng < TFloat32 > minB, Toán hạng < TFloat32 > maxB, Toán hạng < TFloat32 > minFreezedOutput, Toán hạng < TFloat32 > maxFreezedOutput, Class<W> Toutput, Tùy chọn... tùy chọn) Phương thức gốc để tạo một lớp bao bọc một hoạt động QuantizedMatMulWithBiasAndReluAndRequantize mới. |
tĩnh QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (Chuỗi đầu vàoQuantMode) |
Đầu ra < TFloat32 > | maxOut () Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện. |
Đầu ra < TFloat32 > | phútOut () Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện. |
Đầu ra <W> | ngoài () |
tĩnh QuantizedMatMulWithBiasAndReluAndRequantize.Options | chuyển vịA (chuyển đổi BooleanA) |
tĩnh QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (chuyển đổi BooleanB) |
Phương pháp kế thừa
Hằng số
Chuỗi cuối cùng tĩnh công khai OP_NAME
Tên của op này, được biết đến bởi công cụ lõi TensorFlow
Phương pháp công khai
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> tạo ( Phạm vi phạm vi , Toán hạng <? mở rộng TType > a, Toán hạng <? mở rộng TType > b, Toán hạng <? mở rộng TType > thiên vị, Toán hạng < TFloat32 > minA, Toán hạng < TFloat32 > maxA, Toán hạng < TFloat32 > minB, Toán hạng < TFloat32 > maxB, Toán hạng < TFloat32 > minFreezedOutput, Toán hạng < TFloat32 > maxFreezedOutput, Lớp<W> Toutput, Tùy chọn... tùy chọn)
Phương thức gốc để tạo một lớp bao bọc một hoạt động QuantizedMatMulWithBiasAndReluAndRequantize mới.
Thông số
phạm vi | phạm vi hiện tại |
---|---|
Một | Một ma trận được nhân. Phải là tensor hai chiều thuộc loại `quint8`. |
b | Ma trận cần nhân và phải là tensor hai chiều thuộc loại `qint8`. |
Thiên kiến | Một tenxơ thiên vị 1D có kích thước khớp với kích thước bên trong của `b` (sau khi được hoán vị nếu `transpose_b` khác 0). |
phútA | Giá trị float mà giá trị `a` được lượng tử hóa thấp nhất đại diện. |
tối đaA | Giá trị float mà giá trị `a` được lượng tử hóa cao nhất đại diện. |
phútB | Giá trị float mà giá trị `b` được lượng tử hóa thấp nhất đại diện. |
tối đaB | Giá trị float mà giá trị `b` được lượng tử hóa cao nhất đại diện. |
phútĐóng băngĐầu ra | Giá trị float có giá trị đầu ra được lượng tử hóa cao nhất sau khi lượng tử hóa lại. |
tùy chọn | mang các giá trị thuộc tính tùy chọn |
Trả lại
- một phiên bản mới của QuantizedMatMulWithBiasAndReluAndRequantize
tĩnh công khai QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (Chuỗi đầu vàoQuantMode)
Thông số
đầu vàoQuantMode | Chế độ lượng tử hóa dữ liệu đầu vào. MIN_FIRST(mặc định) hoặc SCALED. |
---|
Đầu ra công khai < TFloat32 > maxOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.
Đầu ra công khai < TFloat32 > minOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.
tĩnh công khai QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)
Thông số
chuyển vịA | Nếu đúng, `a` được hoán vị trước khi nhân. |
---|
tĩnh công khai QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)
Thông số
chuyển vịB | Nếu đúng, `b` được chuyển đổi trước khi nhân. |
---|