Execute uma multiplicação de matriz quantizada de `a` pela matriz `b` com adição de polarização e fusão relu.
As entradas devem ser matrizes bidimensionais e vetor de polarização 1D. E a dimensão interna de `a` (após ser transposta se `transpose_a` for diferente de zero) deve corresponder à dimensão externa de `b` (após ser transposta se `transpose_b` for diferente de zero). Em seguida, faça a operação de adição de transmissão com valores de polarização no resultado da multiplicação da matriz. O tamanho da polarização deve corresponder à dimensão interna de `b`. Em seguida, faça a ativação relu para obter um resultado não negativo.
Classes aninhadas
aula | QuantizedMatMulWithBiasAndRelu.Options | Atributos opcionais para QuantizedMatMulWithBiasAndRelu |
Métodos Públicos
estático <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | create ( Escopo do escopo , Operando <T> a, Operando <U> b, Operando <Float> polarização, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float> maxB, Classe<V > Saída, Opções... opções) Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBiasAndRelu. |
QuantizedMatMulWithBiasAndRelu.Options estático | inputQuantMode (string inputQuantMode) |
Saída <flutuante> | maxOut () O valor flutuante que o valor de saída quantizado mais alto representa. |
Saída <flutuante> | minOut () O valor flutuante que o valor de saída quantizado mais baixo representa. |
Saída <V> | fora () |
QuantizedMatMulWithBiasAndRelu.Options estático | transposeA (transposeA booleana) |
QuantizedMatMulWithBiasAndRelu.Options estático | transposeB (booleano transposeB) |
Métodos herdados
Métodos Públicos
public static QuantizedMatMulWithBiasAndRelu <V> create (Escopo escopo , Operando <T> a, Operando <U> b, Operando <Float> polarização, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float> > maxB, Class<V> Toutput, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBiasAndRelu.
Parâmetros
escopo | escopo atual |
---|---|
a | Uma matriz a ser multiplicada. Deve ser um tensor bidimensional do tipo `quint8`. |
b | Uma matriz a ser multiplicada e deve ser um tensor bidimensional do tipo `qint8`. |
viés | Um tensor de polarização 1D com tamanho correspondente à dimensão interna de `b` (após ser transposto se `transposed_b` for diferente de zero). |
minA | O valor flutuante que o valor `a` quantizado mais baixo representa. |
máxA | O valor flutuante que o valor `a` quantizado mais alto representa. |
minB | O valor flutuante que o valor `b` quantizado mais baixo representa. |
máxB | O valor flutuante que o valor `b` quantizado mais alto representa. |
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de QuantizedMatMulWithBiasAndRelu
público estático QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parâmetros
entradaQuantMode | Modo de quantização de dados de entrada. MIN_FIRST(padrão) ou SCALED. |
---|
Saída pública <Float> maxOut ()
O valor flutuante que o valor de saída quantizado mais alto representa.
Saída pública <Float> minOut ()
O valor flutuante que o valor de saída quantizado mais baixo representa.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parâmetros
transporA | Se for verdade, `a` é transposto antes da multiplicação. |
---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parâmetros
transporB | Se for verdade, `b` é transposto antes da multiplicação. |
---|