Выполняет квантованное матричное умножение a на матрицу b с добавлением смещения.
Входные данные должны быть двумерными матрицами и одномерным вектором смещения. А внутреннее измерение `a` (после транспонирования, если `transpose_a` не равно нулю) должно соответствовать внешнему измерению `b` (после транспонирования, если `transpose_b` не равно нулю). Затем выполните операцию широковещательного сложения со значениями смещения результата умножения матрицы. Размер смещения должен соответствовать внутреннему размеру b.
Вложенные классы
сорт | QuantizedMatMulWithBias.Options | Дополнительные атрибуты для QuantizedMatMulWithBias |
Константы
Нить | OP_NAME | Название этой операции, известное основному движку TensorFlow. |
Публичные методы
static <W расширяет TType > QuantizedMatMulWithBias <W> | create ( Область видимости , Операнд <? расширяет TType > a, Операнд <? расширяет TType > b, Операнд <? расширяет TType > смещения, Операнд < TFloat32 > minA, Операнд < TFloat32 > maxA, Операнд < TFloat32 > minB, Операнд < TFloat32 > maxB, Class<W> Toutput, Options... options) Фабричный метод для создания класса, обертывающего новую операцию QuantizedMatMulWithBias. |
статический QuantizedMatMulWithBias.Options | inputQuantMode (строка inputQuantMode) |
Вывод <TFloat32> | использовать полностью () Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение. |
Вывод <TFloat32> | минаут () Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение. |
Выход <Вт> | вне () |
статический QuantizedMatMulWithBias.Options | transposeA (логическое значение transposeA) |
статический QuantizedMatMulWithBias.Options | transposeB (логическое значение transposeB) |
Унаследованные методы
Константы
общедоступная статическая финальная строка OP_NAME
Название этой операции, известное основному движку TensorFlow.
Публичные методы
public static QuantizedMatMulWithBias <W> create ( Область видимости , Операнд <? расширяет TType > a, Операнд <? расширяет TType > b, Операнд <? расширяет TType > смещения, Операнд < TFloat32 > minA, Операнд < TFloat32 > maxA, Операнд < TFloat32 > minB, Операнд < TFloat32 > maxB, Класс<W> Toutput, Опции... опции)
Фабричный метод для создания класса, обертывающего новую операцию QuantizedMatMulWithBias.
Параметры
объем | текущий объем |
---|---|
а | Матрица, которую нужно умножить. Должен быть двумерным тензором типа «quint8». |
б | Матрица, подлежащая умножению, должна быть двумерным тензором типа qint8. |
предвзятость | Одномерный тензор смещения, размер которого соответствует внутреннему размеру `b` (после транспонирования, если `transpose_b` не равно нулю). |
минА | Значение с плавающей запятой, которое представляет наименьшее квантованное значение a. |
МаксА | Значение с плавающей запятой, которое представляет наибольшее квантованное значение `a`. |
минБ | Значение с плавающей запятой, которое представляет наименьшее квантованное значение `b`. |
МаксБ | Значение с плавающей запятой, которое представляет наибольшее квантованное значение `b`. |
параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр QuantizedMatMulWithBias
общедоступный статический QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
Параметры
вводQuantMode | Режим квантования входных данных. Либо MIN_FIRST (по умолчанию), либо SCALED. |
---|
публичный вывод <TFloat32> maxOut ()
Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение.
публичный вывод <TFloat32> minOut ()
Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение.
public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)
Параметры
транспонироватьА | Если это правда, `a` транспонируется перед умножением. |
---|
public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)
Параметры
транспонировать Б | Если это правда, `b` транспонируется перед умножением. |
---|