Thực hiện phép nhân ma trận lượng tử hóa của `a` với ma trận `b` với phép cộng độ lệch.
Đầu vào phải là ma trận hai chiều và vectơ sai lệch 1D. Và chiều bên trong của `a` (sau khi được chuyển đổi nếu `transpose_a` khác 0) phải khớp với chiều bên ngoài của `b` (sau khi được chuyển đổi nếu `transpose_b` khác 0). Sau đó thực hiện thao tác cộng quảng bá với các giá trị sai lệch trên kết quả nhân ma trận. Kích thước thiên vị phải khớp với kích thước bên trong của `b`.
Các lớp lồng nhau
lớp học | Lượng tử hóaMatMulWithBias.Options | Thuộc tính tùy chọn cho QuantizedMatMulWithBias |
Hằng số
Sợi dây | OP_NAME | Tên của op này, được biết đến bởi công cụ lõi TensorFlow |
Phương pháp công khai
tĩnh <W mở rộng TType > QuantizedMatMulWithBias <W> | tạo ( Phạm vi phạm vi, Toán hạng <? mở rộng TType > a, Toán hạng <? mở rộng TType > b, Toán hạng <? mở rộng TType > thiên vị, Toán hạng < TFloat32 > minA, Toán hạng < TFloat32 > maxA, Toán hạng < TFloat32 > minB, Toán hạng < TFloat32 > maxB, Class<W> Toutput, Tùy chọn... tùy chọn) Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác QuantizedMatMulWithBias mới. |
tĩnh QuantizedMatMulWithBias.Options | inputQuantMode (Chuỗi đầu vàoQuantMode) |
Đầu ra < TFloat32 > | maxOut () Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện. |
Đầu ra < TFloat32 > | phútOut () Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện. |
Đầu ra <W> | ngoài () |
tĩnh QuantizedMatMulWithBias.Options | chuyển vịA (chuyển đổi BooleanA) |
tĩnh QuantizedMatMulWithBias.Options | transposeB (chuyển đổi BooleanB) |
Phương pháp kế thừa
Hằng số
Chuỗi cuối cùng tĩnh công khai OP_NAME
Tên của op này, được biết đến bởi công cụ lõi TensorFlow
Phương pháp công khai
public static QuantizedMatMulWithBias <W> create ( Phạm vi phạm vi , Toán hạng <? mở rộng TType > a, Toán hạng <? mở rộng TType > b, Toán hạng <? mở rộng TType > thiên vị, Toán hạng < TFloat32 > minA, Toán hạng < TFloat32 > maxA, Toán hạng < TFloat32 > minB, Toán hạng < TFloat32 > maxB, Lớp<W> Toutput, Tùy chọn... tùy chọn)
Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác QuantizedMatMulWithBias mới.
Thông số
phạm vi | phạm vi hiện tại |
---|---|
Một | Một ma trận được nhân. Phải là tensor hai chiều thuộc loại `quint8`. |
b | Ma trận cần nhân và phải là tensor hai chiều thuộc loại `qint8`. |
Thiên kiến | Một tenxơ thiên vị 1D có kích thước khớp với kích thước bên trong của `b` (sau khi được hoán vị nếu `transpose_b` khác 0). |
phútA | Giá trị float mà giá trị `a` được lượng tử hóa thấp nhất đại diện. |
tối đaA | Giá trị float mà giá trị `a` được lượng tử hóa cao nhất đại diện. |
phútB | Giá trị float mà giá trị `b` được lượng tử hóa thấp nhất đại diện. |
tối đaB | Giá trị float mà giá trị `b` được lượng tử hóa cao nhất đại diện. |
tùy chọn | mang các giá trị thuộc tính tùy chọn |
Trả lại
- một phiên bản mới của QuantizedMatMulWithBias
tĩnh công khai QuantizedMatMulWithBias.Options inputQuantMode (Chuỗi đầu vàoQuantMode)
Thông số
đầu vàoQuantMode | Chế độ lượng tử hóa dữ liệu đầu vào. MIN_FIRST(mặc định) hoặc SCALED. |
---|
Đầu ra công khai < TFloat32 > maxOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.
Đầu ra công khai < TFloat32 > minOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.
tĩnh công khai QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)
Thông số
chuyển vịA | Nếu đúng, `a` được chuyển đổi trước khi nhân. |
---|
tĩnh công khai QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)
Thông số
chuyển vịB | Nếu đúng, `b` được chuyển đổi trước khi nhân. |
---|