Realice una multiplicación de matriz cuantificada de `a` por la matriz` b` con sesgo de adición y relu y recantización de la fusión.
Las entradas deben ser matrices bidimensionales y vector de sesgo 1D. Y la dimensión interna de `a` (después de ser transpuesta si` transpose_a` no es cero) debe coincidir con la dimensión externa de `b` (después de ser transpuesta si` transposed_b` es diferente de cero). Luego, difunda la operación de suma con valores de sesgo en el resultado de la multiplicación de matrices. El tamaño del sesgo debe coincidir con la dimensión interna de "b". Luego, realice la activación de relu para obtener un resultado no negativo. Luego, vuelva a cuantificar la operación para obtener el resultado final de uint8.
Clases anidadas
clase | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Los atributos opcionales para QuantizedMatMulWithBiasAndReluAndRequantize |
Constantes
Cuerda | OP_NAME | El nombre de esta operación, como lo conoce el motor central de TensorFlow |
Métodos públicos
estática <W extiende Ttype > QuantizedMatMulWithBiasAndReluAndRequantize <W> | crear ( Alcance alcance, operando <? extiende Ttype > a, operando <? extiende Ttype > b, operando <? extiende Ttype > sesgo, operando < TFloat32 > Mina, operando < TFloat32 > MAXA, operando < TFloat32 > Minb, operando < TFloat32 > maxb, operando < TFloat32 > minFreezedOutput, operando < TFloat32 > maxFreezedOutput, Clase <W> TOutput, opciones ... opciones) Método de fábrica para crear una clase que envuelva una nueva operación QuantizedMatMulWithBiasAndReluAndRequantize. |
estáticas QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (String inputQuantMode) |
Salida < TFloat32 > | MAXOUT () El valor flotante que representa el valor de salida cuantificado más alto. |
Salida < TFloat32 > | MinOut () El valor flotante que representa el valor de salida cuantificado más bajo. |
Salida <W> | fuera () |
estáticas QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (Boolean transposeA) |
estáticas QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (Boolean transposeB) |
Métodos heredados
Constantes
OP_NAME pública final static String
El nombre de esta operación, como lo conoce el motor central de TensorFlow
Métodos públicos
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> crear ( Alcance alcance, operando <? extiende Ttype > a, operando <? extiende Ttype > b, operando <? extiende Ttype > sesgo, operando < TFloat32 > Mina, operando < TFloat32 > MAXA, operando < TFloat32 > Minb, operando < TFloat32 > maxb, operando < TFloat32 > minFreezedOutput, operando < TFloat32 > maxFreezedOutput, Clase <W> TOutput, opciones ... opciones)
Método de fábrica para crear una clase que envuelva una nueva operación QuantizedMatMulWithBiasAndReluAndRequantize.
Parámetros
alcance | alcance actual |
---|---|
a | Una matriz para multiplicar. Debe ser un tensor bidimensional de tipo `quint8`. |
B | Una matriz a multiplicar y debe ser un tensor bidimensional de tipo `qint8`. |
parcialidad | Un tensor de sesgo 1D con tamaño que coincide con la dimensión interna de `b` (después de ser transpuesto si` transposed_b` es distinto de cero). |
minA | El valor flotante que representa el valor "a" cuantificado más bajo. |
maxA | El valor flotante que representa el valor "a" cuantificado más alto. |
minB | El valor flotante que representa el valor "b" cuantificado más bajo. |
maxB | El valor flotante que representa el valor "b" cuantificado más alto. |
minFreezedOutput | El valor flotante que el valor de salida cuantificado más alto después de recantizar. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de QuantizedMatMulWithBiasAndReluAndRequantize
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Parámetros
inputQuantMode | Modo de cuantificación de datos de entrada. MIN_FIRST (predeterminado) o SCALED. |
---|
pública de salida < TFloat32 > MAXOUT ()
El valor flotante que representa el valor de salida cuantificado más alto.
pública de salida < TFloat32 > MinOut ()
El valor flotante que representa el valor de salida cuantificado más bajo.
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (booleano transposeA)
Parámetros
transposeA | Si es verdadero, se transpone `a` antes de la multiplicación. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (booleano transposeB)
Parámetros
transposeB | Si es verdadero, se transpone `b` antes de la multiplicación. |
---|