Execute uma multiplicação de matriz quantizada de `a` pela matriz `b` com adição de polarização e fusão relu.
As entradas devem ser matrizes bidimensionais e vetor de polarização 1D. E a dimensão interna de `a` (após ser transposta se `transpose_a` for diferente de zero) deve corresponder à dimensão externa de `b` (após ser transposta se `transpose_b` for diferente de zero). Em seguida, faça a operação de adição de broadcast com valores de polarização no resultado da multiplicação da matriz. O tamanho de polarização deve corresponder à dimensão interna de `b`. Em seguida, faça a ativação do relu para obter um resultado não negativo.
Classes aninhadas
| aula | QuantizedMatMulWithBiasAndRelu.Options | Atributos opcionais para QuantizedMatMulWithBiasAndRelu | |
Métodos públicos
| estático <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | create ( Escopo do escopo, Operando <T> a, Operando <U> b, Operando <Float> bias, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float> maxB, Class<V > Saída, Opções... opções) Método de fábrica para criar uma classe envolvendo uma nova operação QuantizedMatMulWithBiasAndRelu. |
| static QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (String inputQuantMode) |
| Saída <Float> | maxOut () O valor flutuante que o valor de saída quantizado mais alto representa. |
| Saída <Float> | minOut () O valor flutuante que o valor de saída quantizado mais baixo representa. |
| Saída <V> | fora () |
| static QuantizedMatMulWithBiasAndRelu.Options | transposeA (Boolean transposeA) |
| static QuantizedMatMulWithBiasAndRelu.Options | transposeB (transposição booleana B) |
Métodos Herdados
Métodos públicos
public static QuantizedMatMulWithBiasAndRelu <V> create ( Escopo do escopo, Operando <T> a, Operando <U> b, Operando <Float> bias, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float > maxB, Class<V> Saída, Opções... opções)
Método de fábrica para criar uma classe envolvendo uma nova operação QuantizedMatMulWithBiasAndRelu.
Parâmetros
| alcance | escopo atual |
|---|---|
| uma | Uma matriz a ser multiplicada. Deve ser um tensor bidimensional do tipo `quint8`. |
| b | Uma matriz a ser multiplicada e deve ser um tensor bidimensional do tipo `qint8`. |
| viés | Um tensor de polarização 1D com correspondência de tamanho com dimensão interna de `b` (após ser transposto se `transposed_b` for diferente de zero). |
| minA | O valor flutuante que o menor valor quantizado de `a` representa. |
| maxA | O valor float que o valor `a` quantizado mais alto representa. |
| minB | O valor flutuante que o menor valor quantizado `b` representa. |
| maxB | O valor float que o valor `b` quantizado mais alto representa. |
| opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de QuantizedMatMulWithBiasAndRelu
public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parâmetros
| inputQuantMode | Modo de quantização de dados de entrada. Ou MIN_FIRST(padrão) ou SCALED. |
|---|
Public Output <Float> maxOut ()
O valor flutuante que o valor de saída quantizado mais alto representa.
Public Output <Float> minOut ()
O valor flutuante que o valor de saída quantizado mais baixo representa.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parâmetros
| transporA | Se verdadeiro, `a` é transposto antes da multiplicação. |
|---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parâmetros
| transpor B | Se verdadeiro, `b` é transposto antes da multiplicação. |
|---|