Executa uma multiplicação de matriz quantizada de `a` pela matriz` b` com adição de polarização.
As entradas devem ser matrizes bidimensionais e vetor de polarização 1D. E a dimensão interna de `a` (após ser transposta se` transpose_a` for diferente de zero) deve corresponder à dimensão externa de `b` (após ser transposta se` transposed_b` for diferente de zero). Em seguida, execute a operação de adição de broadcast com valores de polarização no resultado da multiplicação da matriz. O tamanho da polarização deve corresponder à dimensão interna de `b`.
Classes aninhadas
classe | QuantizedMatMulWithBias.Options | Atributos opcionais para QuantizedMatMulWithBias |
Constantes
Fragmento | OP_NAME | O nome desta operação, conforme conhecido pelo motor principal TensorFlow |
Métodos Públicos
estática <W estende TType > QuantizedMatMulWithBias <W> | criar ( Âmbito âmbito, Operando <? estende TType > um, Operando <? estende TType > b, Operando <? estende TType > viés, Operando < TFloat32 > mina, Operando < TFloat32 > maxa, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Class <W> TOutput, Options ... opções) Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBias. |
estáticos QuantizedMatMulWithBias.Options | inputQuantMode (String inputQuantMode) |
Output < TFloat32 > | MAXOUT () O valor flutuante que o valor de saída quantizado mais alto representa. |
Output < TFloat32 > | minOut () O valor flutuante que o menor valor de saída quantizado representa. |
Output <W> | a () |
estáticos QuantizedMatMulWithBias.Options | transposeA (booleano transposeA) |
estáticos QuantizedMatMulWithBias.Options | transposeB (booleano transposeB) |
Métodos herdados
Constantes
nome_op final String public static
O nome desta operação, conforme conhecido pelo motor principal TensorFlow
Métodos Públicos
public static QuantizedMatMulWithBias <W> create ( Scope escopo, Operando <? estende TType > a, Operando <? estende TType > b, Operando <? estende TType > viés, Operando < TFloat32 > Mina, Operando < TFloat32 > MÁXIMOA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Class <W> TOutput, Options ... opções)
Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBias.
Parâmetros
alcance | escopo atual |
---|---|
uma | Uma matriz a ser multiplicada. Deve ser um tensor bidimensional do tipo `quint8`. |
b | Uma matriz a ser multiplicada e deve ser um tensor bidimensional do tipo `qint8`. |
tendência | Um tensor de polarização 1D com tamanho correspondente à dimensão interna de `b` (após ser transposto se` transposed_b` for diferente de zero). |
minA | O valor flutuante que o menor valor `a` quantizado representa. |
maxA | O valor flutuante que o valor `a` quantizado mais alto representa. |
minB | O valor flutuante que o menor valor quantizado de `b` representa. |
maxB | O valor flutuante que o valor `b` quantizado mais alto representa. |
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de QuantizedMatMulWithBias
public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
Parâmetros
inputQuantMode | Modo de quantização de dados de entrada. MIN_FIRST (padrão) ou SCALED. |
---|
pública Output < TFloat32 > MAXOUT ()
O valor flutuante que o valor de saída quantizado mais alto representa.
pública Output < TFloat32 > minOut ()
O valor flutuante que o menor valor de saída quantizado representa.
public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)
Parâmetros
transporA | Se verdadeiro, `a` é transposto antes da multiplicação. |
---|
public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)
Parâmetros
transporB | Se verdadeiro, `b` é transposto antes da multiplicação. |
---|