یک ضرب ماتریس کوانتیزه «a» در ماتریس «b» را با بایاس جمع و relu انجام دهید و همجوشی را دوباره کوانتیزه کنید.
ورودی ها باید ماتریس های دو بعدی و بردار بایاس 1 بعدی باشند. و بعد داخلی «a» (پس از جابجایی اگر «transpose_a» غیر صفر باشد) باید با بعد بیرونی «b» مطابقت داشته باشد (بعد از جابجایی اگر «transposed_b» غیر صفر باشد). سپس عملیات اضافه کردن پخش را با مقادیر بایاس در نتیجه ضرب ماتریس انجام دهید. اندازه بایاس باید با بعد داخلی «b» مطابقت داشته باشد. سپس Relu activation را انجام دهید تا نتیجه غیر منفی بگیرید. سپس عملیات requantize را انجام دهید تا نتیجه نهایی uint8 به دست آید.
کلاس های تو در تو
کلاس | QuantizedMatMulWithBiasAndReluAndRequantize.Options | ویژگی های اختیاری برای QuantizedMatMulWithBiasAndReluAndRequantize |
ثابت ها
رشته | OP_NAME | نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود |
روش های عمومی
static <W گسترش TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | ایجاد ( دامنه دامنه ، عملوند <? گسترش TType > a، عملوند <? گسترش TType > b، عملوند <? گسترش TType > تعصب، عملوند < TFloat32 > minA، عملوند < TFloat32 > maxA، عملوند < TFloat32 > minB، عملوند < TFloat32 > maxB، Operand < TFloat32 > minFreezedOutput، Operand < TFloat32 > maxFreezedOutput، Class<W> Toutput، Options... گزینهها) روش Factory برای ایجاد کلاسی که یک عملیات QuantizedMatMulWithBiasAndReluAndRequantize جدید را بسته بندی می کند. |
Static QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (رشته ورودیQuantMode) |
خروجی < TFloat32 > | حداکثر کردن () مقدار شناور که بالاترین مقدار خروجی کوانتیزه شده نشان دهنده آن است. |
خروجی < TFloat32 > | minOut () مقدار شناوری که کمترین مقدار خروجی کوانتیزه شده نشان دهنده آن است. |
خروجی <W> | بیرون () |
Static QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (transposeA Boolean) |
Static QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (transposeB) |
روش های ارثی
ثابت ها
رشته نهایی ثابت عمومی OP_NAME
نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود
روش های عمومی
عمومی استاتیک QuantizedMatMulWithBiasAndReluAndRequantize <W> ایجاد ( دامنه دامنه ، عملوند <? TType را گسترش می دهد > a، عملوند <? گسترش TType > b، عملوند <? گسترش TType > تعصب، عملوند < TFloat32 > minA، عملوند < > TFloat3 ، عملوند < TFloat3 > minB، Operand < TFloat32 > maxB، Operand < TFloat32 > minFreezedOutput، Operand < TFloat32 > maxFreezedOutput، Class<W> Toutput، Options... گزینهها)
روش Factory برای ایجاد کلاسی که یک عملیات QuantizedMatMulWithBiasAndReluAndRequantize جدید را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
آ | ماتریسی که باید ضرب شود. باید یک تانسور دو بعدی از نوع «quiint8» باشد. |
ب | ماتریسی که باید ضرب شود و باید یک تانسور دو بعدی از نوع 'qint8' باشد. |
جانبداری | یک تانسور بایاس 1 بعدی با تطبیق اندازه با بعد داخلی «b» (پس از انتقال اگر «transposed_b» غیر صفر باشد). |
minA | مقدار شناور که کمترین مقدار «a» کوانتیزه شده نشان دهنده آن است. |
maxA | مقدار شناور که بالاترین مقدار «a» کوانتیزه شده نشان دهنده آن است. |
minB | مقدار شناور که کمترین مقدار «b» کوانتیزه شده نشان دهنده آن است. |
maxB | مقدار شناور که بالاترین مقدار «b» کوانتیزه شده نشان دهنده آن است. |
minFreezedOutput | مقدار شناور که بالاترین مقدار خروجی کمی پس از requantize. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از QuantizedMatMulWithBiasAndReluAndRequantize
عمومی static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (رشته ورودیQuantMode)
مولفه های
inputQuantMode | حالت کوانتیزاسیون داده های ورودی MIN_FIRST (پیشفرض) یا SCALED. |
---|
خروجی عمومی < TFloat32 > maxOut ()
مقدار شناور که بالاترین مقدار خروجی کوانتیزه شده نشان دهنده آن است.
خروجی عمومی < TFloat32 > minOut ()
مقدار شناوری که کمترین مقدار خروجی کوانتیزه شده نشان دهنده آن است.
عمومی static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (transposeA Boolean)
مولفه های
انتقال A | اگر درست باشد، «a» قبل از ضرب جابهجا میشود. |
---|
عمومی static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (transposeB)
مولفه های
transposeB | اگر درست باشد، «b» قبل از ضرب جابهجا میشود. |
---|