Wykonaj skwantowane mnożenie macierzy „a” przez macierz „b” z dodatkiem obciążenia i fuzją relu.
Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”. Następnie wykonaj aktywację relu, aby uzyskać wynik nieujemny.
Klasy zagnieżdżone
klasa | QuantizedMatMulWithBiasAndRelu.Options | Opcjonalne atrybuty dla QuantizedMatMulWithBiasAndRelu |
Stałe
Strunowy | OP_NAME | Nazwa tej operacji znana silnikowi rdzenia TensorFlow |
Metody publiczne
statyczny <V rozszerza TType > QuantizedMatMulWithBiasAndRelu <V> | utwórz ( Zakres zasięgu , Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand < TFloat32 > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB , Class<V> Toutput, Opcje... opcje) Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu. |
statyczne QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (ciąg znaków inputQuantMode) |
Dane wyjściowe <TFloat32> | maxOut () Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa. |
Dane wyjściowe <TFloat32> | MinOut () Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową. |
Wyjście <V> | na zewnątrz () |
statyczne QuantizedMatMulWithBiasAndRelu.Options | transpozycjaA (logiczna transpozycjaA) |
statyczne QuantizedMatMulWithBiasAndRelu.Options | transpozycja B (logiczna transpozycja B) |
Metody dziedziczone
Stałe
publiczny statyczny końcowy ciąg znaków OP_NAME
Nazwa tej operacji znana silnikowi rdzenia TensorFlow
Metody publiczne
public static QuantizedMatMulWithBiasAndRelu <V> create ( Zakres zakresu, Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand < TFloat32 > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB , Operand < TFloat32 > maxB, Class<V> Toutput, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu.
Parametry
zakres | aktualny zakres |
---|---|
A | Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”. |
B | Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`. |
stronniczość | Tensor odchylenia 1D z dopasowaniem rozmiaru do wewnętrznego wymiaru „b” (po transpozycji, jeśli „transponowany_b” jest niezerowy). |
minA | Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”. |
maksA | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”. |
minB | Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”. |
maks. B | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”. |
opcje | przenosi opcjonalne wartości atrybutów |
Zwroty
- nowa instancja QuantizedMatMulWithBiasAndRelu
public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parametry
tryb wejściowyQuant | Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED. |
---|
publiczne wyjście < TFloat32 > maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
publiczne wyjście < TFloat32 > minOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parametry
transponowaćA | Jeśli to prawda, „a” jest transponowane przed mnożeniem. |
---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parametry
transponowaćB | Jeśli prawda, „b” jest transponowane przed mnożeniem. |
---|