בצע כפל מטריצה כמותית של 'a' במטריצה 'b' עם הטיה add ו-relu ו-requantize fusion.
הכניסות חייבות להיות מטריצות דו מימדיות ווקטור הטיה 1D. והממד הפנימי של `a` (לאחר המעבר אם `transposed_a` אינו אפס) חייב להתאים למימד החיצוני של `b` (לאחר ההעברה אם `transposed_b` אינו אפס). לאחר מכן בצע את פעולת הוספה של שידור עם ערכי הטיה על תוצאת הכפל המטריצה. גודל ההטיה חייב להתאים לממד הפנימי של 'b'. לאחר מכן בצע הפעלה מחדש כדי לקבל תוצאה לא שלילית. לאחר מכן, בצע כימות מחדש כדי לקבל תוצאת uint8 הסופית.
כיתות מקוננות
מעמד | QuantizedMatMulWithBiasAndReluAndRequantize.Options | תכונות אופציונליות עבור QuantizedMatMulWithBiasAndReluAndRequantize |
קבועים
חוּט | OP_NAME | השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow |
שיטות ציבוריות
סטטי <W מרחיב את TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | create ( scope scope, Operand <? מרחיב את TType > a, Operand <? מרחיב את TType > b, Operand <? מרחיב את TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, Options... options) שיטת מפעל ליצירת מחלקה העוטפת פעולת QuantizedMatMulWithBiasAndReluAndRequantize חדשה. |
static QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (מחרוזת inputQuantMode) |
פלט < TFloat32 > | maxOut () הערך הצף שערך הפלט המקוונטי הגבוה ביותר מייצג. |
פלט < TFloat32 > | minOut () הערך הצף שערך הפלט הקוונטי הנמוך ביותר מייצג. |
פלט <W> | החוצה () |
static QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (בוליאני transposeA) |
static QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (טרנספוזי בוליאני) |
שיטות בירושה
קבועים
מחרוזת סופית סטטית ציבורית OP_NAME
השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow
שיטות ציבוריות
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( scope scope, Operand <? מרחיב את TType > a, Operand <? מרחיב את TType > b, Operand <? מרחיב את TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand > minB, Operand < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת QuantizedMatMulWithBiasAndReluAndRequantize חדשה.
פרמטרים
תְחוּם | ההיקף הנוכחי |
---|---|
א | מטריצה שיש להכפיל. חייב להיות טנזור דו מימדי מסוג 'quint8'. |
ב | מטריצה שיש להכפיל וחייבת להיות טנזור דו מימדי מסוג `qint8`. |
הֲטָיָה | טנזור הטיה 1D עם התאמת גודל לממד הפנימי של 'b' (לאחר המעבר אם 'transposed_b' אינו אפס). |
minA | הערך הצף שערך ה-a' הקוונטי הנמוך ביותר מייצג. |
maxA | הערך הצף שערך ה-a' המכומת הגבוה ביותר מייצג. |
minB | הערך הצף שערך ה-'b' הקוונטי הנמוך ביותר מייצג. |
maxB | הערך הצף שערך ה-'b' המקוונטי הגבוה ביותר מייצג. |
minFreezedOutput | הערך הצף שערך הפלט המכומתי הגבוה ביותר לאחר כיבוי מחדש. |
אפשרויות | נושא ערכי תכונות אופציונליות |
החזרות
- מופע חדש של QuantizedMatMulWithBiasAndReluAndRequantize
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
פרמטרים
inputQuantMode | מצב כימות נתונים של קלט. MIN_FIRST (ברירת מחדל) או SCALED. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolian transposeA)
פרמטרים
transposeA | אם זה נכון, 'a' עובר טרנספוזיציה לפני הכפל. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (בוליאני transposeB)
פרמטרים
transposeB | אם זה נכון, 'b' עובר טרנספוזיציה לפני הכפל. |
---|