Wykonuje skwantowane mnożenie macierzy „a” przez macierz „b” z dodatkiem obciążenia.
Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”.
Klasy zagnieżdżone
klasa | QuantizedMatMulWithBias.Options | Opcjonalne atrybuty dla QuantizedMatMulWithBias |
Stałe
Strunowy | OP_NAME | Nazwa tej operacji znana silnikowi rdzenia TensorFlow |
Metody publiczne
statyczny <W rozszerza TType > QuantizedMatMulWithBias <W> | utwórz (Zakres zasięgu , Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand <? rozszerza TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Class<W> Toutput, Opcje... opcje) Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBias. |
statyczne QuantizedMatMulWithBias.Options | inputQuantMode (ciąg znaków inputQuantMode) |
Dane wyjściowe <TFloat32> | maxOut () Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa. |
Dane wyjściowe <TFloat32> | MinOut () Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową. |
Wyjście <W> | na zewnątrz () |
statyczne QuantizedMatMulWithBias.Options | transpozycjaA (logiczna transpozycjaA) |
statyczne QuantizedMatMulWithBias.Options | transpozycja B (logiczna transpozycja B) |
Metody dziedziczone
Stałe
publiczny statyczny końcowy ciąg znaków OP_NAME
Nazwa tej operacji znana silnikowi rdzenia TensorFlow
Metody publiczne
public static QuantizedMatMulWithBias <W> create ( Zakres zakresu, Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand <? rozszerza TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Class<W> Toutput, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBias.
Parametry
zakres | aktualny zakres |
---|---|
A | Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”. |
B | Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`. |
stronniczość | Tensor odchylenia 1D o rozmiarze odpowiadającym wewnętrznemu wymiarowi „b” (po transpozycji, jeśli „transponowany_b” jest różny od zera). |
minA | Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”. |
maksA | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”. |
minB | Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”. |
maks. B | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”. |
opcje | przenosi opcjonalne wartości atrybutów |
Zwroty
- nowa instancja QuantizedMatMulWithBias
public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
Parametry
tryb wejściowyQuant | Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED. |
---|
publiczne wyjście < TFloat32 > maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
publiczne wyjście < TFloat32 > minOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)
Parametry
transponowaćA | Jeśli to prawda, „a” jest transponowane przed mnożeniem. |
---|
public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)
Parametry
transponowaćB | Jeśli prawda, „b” jest transponowane przed mnożeniem. |
---|