QuantizedMatMulWithBias

שיעור הגמר הציבורי QuantizedMatMulWithBias

מבצע כפל מטריצה ​​כמותית של 'a' במטריצה ​​'b' עם הטיה add.

הכניסות חייבות להיות מטריצות דו מימדיות ווקטור הטיה 1D. והממד הפנימי של `a` (לאחר המעבר אם `transposed_a` אינו אפס) חייב להתאים למימד החיצוני של `b` (לאחר ההעברה אם `transposed_b` אינו אפס). לאחר מכן בצע את פעולת הוספה של שידור עם ערכי הטיה על תוצאת הכפל המטריצה. גודל ההטיה חייב להתאים לממד הפנימי של 'b'.

כיתות מקוננות

מעמד QuantizedMatMulWithBias.Options תכונות אופציונליות עבור QuantizedMatMulWithBias

קבועים

חוּט OP_NAME השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

שיטות ציבוריות

static <W מרחיב את TType > QuantizedMatMulWithBias <W>
create ( scope scope, Operand <? מרחיב את TType > a, Operand <? מרחיב את TType > b, Operand <? מרחיב את TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Class<W> Toutput, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת QuantizedMatMulWithBias חדשה.
static QuantizedMatMulWithBias.Options
inputQuantMode (מחרוזת inputQuantMode)
פלט < TFloat32 >
maxOut ()
הערך הצף שערך הפלט המקוונטי הגבוה ביותר מייצג.
פלט < TFloat32 >
minOut ()
הערך הצף שערך הפלט הקוונטי הנמוך ביותר מייצג.
פלט <W>
static QuantizedMatMulWithBias.Options
transposeA (בוליאני transposeA)
static QuantizedMatMulWithBias.Options
transposeB (טרנספוזי בוליאני)

שיטות בירושה

קבועים

מחרוזת סופית סטטית ציבורית OP_NAME

השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

ערך קבוע: "QuantizedMatMulWithBias"

שיטות ציבוריות

public static QuantizedMatMulWithBias <W> create ( scope scope, Operand <? מרחיב את TType > a, Operand <? מרחיב את TType > b, Operand <? מרחיב את TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Class<W> Toutput, Options... options)

שיטת מפעל ליצירת מחלקה העוטפת פעולת QuantizedMatMulWithBias חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
א מטריצה ​​שיש להכפיל. חייב להיות טנזור דו מימדי מסוג 'quint8'.
ב מטריצה ​​שיש להכפיל וחייבת להיות טנזור דו מימדי מסוג `qint8`.
הֲטָיָה טנזור הטיה 1D עם ממד פנימי תואם גודל של 'b' (לאחר המעבר אם 'transposed_b' אינו אפס).
minA הערך הצף שערך ה-a' הקוונטי הנמוך ביותר מייצג.
maxA הערך הצף שערך ה-a' המכומת הגבוה ביותר מייצג.
minB הערך הצף שערך ה-'b' הקוונטי הנמוך ביותר מייצג.
maxB הערך הצף שערך ה-'b' המקוונטי הגבוה ביותר מייצג.
אפשרויות נושא ערכי תכונות אופציונליות
החזרות
  • מופע חדש של QuantizedMatMulWithBias

public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)

פרמטרים
inputQuantMode מצב כימות נתונים של קלט. MIN_FIRST (ברירת מחדל) או SCALED.

פלט ציבורי < TFloat32 > maxOut ()

הערך הצף שערך הפלט המקוונטי הגבוה ביותר מייצג.

פלט ציבורי < TFloat32 > minOut ()

הערך הצף שערך הפלט הקוונטי הנמוך ביותר מייצג.

פלט ציבורי <W> out ()

public static QuantizedMatMulWithBias.Options transposeA (בוליאני transposeA)

פרמטרים
transposeA אם זה נכון, 'a' עובר טרנספוזיציה לפני הכפל.

public static QuantizedMatMulWithBias.Options transposeB (בוליאני transposeB)

פרמטרים
transposeB אם זה נכון, 'b' עובר טרנספוזיציה לפני הכפל.