Realice una multiplicación de matriz cuantificada de `a` por la matriz `b` con suma sesgada y fusión relu y recuantificación.
Las entradas deben ser matrices bidimensionales y un vector de polarización 1D. Y la dimensión interna de "a" (después de ser transpuesta si "transpose_a" no es cero) debe coincidir con la dimensión externa de "b" (después de ser transpuesta si "transpose_b" no es cero). Luego transmita la operación de suma con valores de sesgo en el resultado de la multiplicación de matrices. El tamaño del sesgo debe coincidir con la dimensión interior de "b". Luego realice la activación relu para obtener un resultado no negativo. Luego, vuelva a cuantificar la operación para obtener el resultado final de uint8.
Clases anidadas
clase | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Atributos opcionales para QuantizedMatMulWithBiasAndReluAndRequantize |
Constantes
Cadena | OP_NOMBRE | El nombre de esta operación, como lo conoce el motor central de TensorFlow. |
Métodos públicos
estático <W extiende TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | crear ( Alcance alcance, Operando <? extiende TType > a, Operando <? extiende TType > b, Operando <? extiende TType > sesgo, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Operando < TFloat32 > minFreezedOutput, Operando < TFloat32 > maxFreezedOutput, Clase<W> Toutput, Opciones... opciones) Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBiasAndReluAndRequantize. |
estático QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (cadena de entradaQuantMode) |
Salida <TFloat32> | máximo fuera () El valor flotante que representa el valor de salida cuantificado más alto. |
Salida <TFloat32> | minOut () El valor flotante que representa el valor de salida cuantificado más bajo. |
Salida <W> | afuera () |
estático QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (transposeA booleana) |
estático QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposiciónB (transposición booleanaB) |
Métodos heredados
Constantes
Cadena final estática pública OP_NAME
El nombre de esta operación, como lo conoce el motor central de TensorFlow.
Métodos públicos
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Alcance alcance, Operando <? extiende TType > a, Operando <? extiende TType > b, Operando <? extiende TType > sesgo, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Operando < TFloat32 > minFreezedOutput, Operando < TFloat32 > maxFreezedOutput, Class<W> Toutput, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBiasAndReluAndRequantize.
Parámetros
alcance | alcance actual |
---|---|
a | Una matriz para multiplicar. Debe ser un tensor bidimensional de tipo "quint8". |
b | Una matriz que se va a multiplicar y debe ser un tensor bidimensional de tipo `qint8`. |
inclinación | Un tensor de polarización 1D con un tamaño que coincide con la dimensión interna de `b` (después de ser transpuesto si `transposed_b` no es cero). |
minA | El valor flotante que representa el valor "a" cuantificado más bajo. |
máxA | El valor flotante que representa el valor "a" cuantificado más alto. |
minB | El valor flotante que representa el valor "b" cuantificado más bajo. |
máxB | El valor flotante que representa el valor "b" cuantificado más alto. |
minFreezedSalida | El valor flotante que es el valor de salida cuantificado más alto después de la recuantización. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de QuantizedMatMulWithBiasAndReluAndRequantize
público estático QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Parámetros
entradaQuantMode | Modo de cuantificación de datos de entrada. Ya sea MIN_FIRST (predeterminado) o SCALED. |
---|
Salida pública <TFloat32> maxOut ()
El valor flotante que representa el valor de salida cuantificado más alto.
Salida pública <TFloat32> minOut ()
El valor flotante que representa el valor de salida cuantificado más bajo.
pública estática QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (transposeA booleana)
Parámetros
transponerA | Si es verdadero, "a" se transpone antes de la multiplicación. |
---|
pública estática QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (transposeB booleana)
Parámetros
transponerB | Si es verdadero, "b" se transpone antes de la multiplicación. |
---|