ضرب ماتریس کوانتیزه «a» در ماتریس «b» را با بایاس جمع انجام می دهد.
ورودی ها باید ماتریس های دو بعدی و بردار بایاس 1 بعدی باشند. و بعد داخلی «a» (پس از جابجایی اگر «transpose_a» غیر صفر باشد) باید با بعد بیرونی «b» مطابقت داشته باشد (بعد از جابجایی اگر «transposed_b» غیر صفر باشد). سپس عملیات اضافه کردن پخش را با مقادیر بایاس در نتیجه ضرب ماتریس انجام دهید. اندازه بایاس باید با بعد داخلی «b» مطابقت داشته باشد.
کلاس های تو در تو
کلاس | QuantizedMatMulWithBias.Options | ویژگی های اختیاری برای QuantizedMatMulWithBias |
ثابت ها
رشته | OP_NAME | نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود |
روش های عمومی
static <W TType > QuantizedMatMulWithBias <W> را گسترش می دهد | ایجاد ( دامنه دامنه ، عملوند <? گسترش TType > a، عملوند <? گسترش TType > b، عملوند <? گسترش TType > تعصب، عملوند < TFloat32 > minA، عملوند < TFloat32 > maxA، عملوند < TFloat32 > minB، عملوند < TFloat32 > maxB، Class<W> Toutput، گزینهها... گزینهها) روش کارخانه برای ایجاد کلاسی که یک عملیات جدید QuantizedMatMulWithBias را بسته بندی می کند. |
استاتیک QuantizedMatMulWithBias.Options | inputQuantMode (رشته ورودیQuantMode) |
خروجی < TFloat32 > | حداکثر کردن () مقدار شناور که بالاترین مقدار خروجی کوانتیزه شده نشان دهنده آن است. |
خروجی < TFloat32 > | minOut () مقدار شناوری که کمترین مقدار خروجی کوانتیزه شده نشان دهنده آن است. |
خروجی <W> | بیرون () |
استاتیک QuantizedMatMulWithBias.Options | transposeA (transposeA Boolean) |
استاتیک QuantizedMatMulWithBias.Options | transposeB (transposeB) |
روش های ارثی
ثابت ها
رشته نهایی ثابت عمومی OP_NAME
نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود
روش های عمومی
عمومی static QuantizedMatMulWithBias <W> ایجاد ( دامنه دامنه ، عملوند <? گسترش TType > a، عملوند <? گسترش TType > b، عملوند <? گسترش TType > تعصب، عملوند < TFloat32 > minA، عملوند < TFloat32 > maxAloat، عملوند T < > minB، عملوند < TFloat32 > maxB، Class<W> Toutput، گزینهها... گزینهها)
روش کارخانه برای ایجاد کلاسی که یک عملیات جدید QuantizedMatMulWithBias را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
آ | ماتریسی که باید ضرب شود. باید یک تانسور دو بعدی از نوع «quiint8» باشد. |
ب | ماتریسی که باید ضرب شود و باید یک تانسور دو بعدی از نوع 'qint8' باشد. |
جانبداری | یک تانسور بایاس 1 بعدی با ابعاد داخلی «b» منطبق بر اندازه (اگر «transposed_b» غیرصفر باشد، پس از جابجایی). |
minA | مقدار شناور که کمترین مقدار «a» کوانتیزه شده نشان دهنده آن است. |
maxA | مقدار شناور که بالاترین مقدار «a» کوانتیزه شده نشان دهنده آن است. |
minB | مقدار شناور که کمترین مقدار «b» کوانتیزه شده نشان دهنده آن است. |
maxB | مقدار شناور که بالاترین مقدار «b» کوانتیزه شده نشان دهنده آن است. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از QuantizedMatMulWithBias
عمومی استاتیک QuantizedMatMulWithBias.Options inputQuantMode (رشته ورودیQuantMode)
مولفه های
inputQuantMode | حالت کوانتیزاسیون داده های ورودی MIN_FIRST (پیشفرض) یا SCALED. |
---|
خروجی عمومی < TFloat32 > maxOut ()
مقدار شناور که بالاترین مقدار خروجی کوانتیزه شده نشان دهنده آن است.
خروجی عمومی < TFloat32 > minOut ()
مقدار شناوری که کمترین مقدار خروجی کوانتیزه شده نشان دهنده آن است.
عمومی استاتیک QuantizedMatMulWithBias.Options transposeA (transposeA Boolean)
مولفه های
انتقال A | اگر درست باشد، «a» قبل از ضرب جابهجا میشود. |
---|
عمومی استاتیک QuantizedMatMulWithBias.Options transposeB (transposeB بولی)
مولفه های
transposeB | اگر درست باشد، «b» قبل از ضرب جابهجا میشود. |
---|