テンソルフロー::作戦::クオンタイズV2
#include <array_ops.h>
float 型の '入力' テンソルを 'T' 型の '出力' テンソルに量子化します。
まとめ
[min_range, max_range] は、「入力」データの範囲を指定するスカラー浮動小数点数です。 「mode」属性は、float 値を量子化された同等の値に変換するためにどの計算が使用されるかを正確に制御します。 「round_mode」属性は、float 値を量子化された値に丸めるときにどの丸めタイブレーク アルゴリズムを使用するかを制御します。
「MIN_COMBINED」モードでは、テンソルの各値は次の処理を受けます。
out[i] = (in[i] - min_range) * range(T) / (max_range - min_range) if T == qint8: out[i] -= (range(T) + 1) / 2.0
ここでrange(T) = numeric_limits ::max() - numeric_limits ::min()
range(T) = numeric_limits ::max() - numeric_limits ::min()
range(T) = numeric_limits ::max() - numeric_limits ::min()
MIN_COMBINED モードの例
入力は float 型で、可能な範囲は [0.0, 6.0]、出力型は quint8 ([0, 255]) であると仮定します。 min_range 値と max_range 値は 0.0 と 6.0 として指定する必要があります。 float から quint8 に量子化すると、入力の各値が 255/6 で乗算され、quint8 にキャストされます。
出力タイプが qint8 ([-128, 127]) の場合、この演算では、値の範囲が qint8 の範囲と一致するように、キャスト前にさらに各値を 128 減算します。
モードが 'MIN_FIRST' の場合、次のアプローチが使用されます。
num_discrete_values = 1 << (# of bits in T) range_adjust = num_discrete_values / (num_discrete_values - 1) range = (range_max - range_min) * range_adjust range_scale = num_discrete_values / range quantized = round(input * range_scale) - round(range_min * range_scale) + numeric_limits::min() quantized = max(quantized, numeric_limits ::min()) quantized = min(quantized, numeric_limits ::max())
これと MIN_COMBINED の最大の違いは、最小範囲が丸められた値から減算される前に、最初に丸められることです。 MIN_COMBINED を使用すると、量子化と逆量子化を繰り返すと、小さなバイアスが発生し、誤差がますます大きくなります。
SCALEモードの例
SCALED
モードはQuantizeAndDequantize{V2|V3}
で使用される量子化アプローチと一致します。
モードがSCALED
の場合、出力タイプの全範囲を使用せず、対称性の可能な最小値を無視することを選択します (たとえば、符号付き 8 ビット量子化の出力範囲は -128 ~ 127 ではなく、-127 ~ 127 です)。 0.0 が 0 にマッピングされるようにします。
まず、テンソル内の値の範囲を見つけます。使用する範囲は常に 0 を中心とするため、次のような m を見つけます。
m = max(abs(input_min), abs(input_max))
入力テンソル範囲は[-m, m]
になります。
次に、固定小数点量子化バケット[min_fixed, max_fixed]
を選択します。 T が符号付きの場合、これは次のようになります。
num_bits = sizeof(T) * 8 [min_fixed, max_fixed] = [-(1 << (num_bits - 1) - 1), (1 << (num_bits - 1)) - 1]
それ以外の場合、T が符号なしの場合、固定小数点範囲は次のようになります。
[min_fixed, max_fixed] = [0, (1 << num_bits) - 1]
これから、スケーリング係数 s を計算します。
s = (max_fixed - min_fixed) / (2 * m)
これで、テンソルの要素を量子化できます。
result = round(input * s)
注意すべき点の 1 つは、オペレータが量子化プロセス中に要求された最小値と最大値をわずかに調整することを選択する可能性があるため、以降の計算の範囲として常に出力ポートを使用する必要があることです。たとえば、要求された最小値と最大値が等しい場合、不正な形式の量子化バッファが作成されるのを防ぐために、小さなイプシロン値で区切られます。そうしないと、すべての量子化値が同じ浮動小数点値にマップされるバッファーが作成され、バッファーに対してさらに計算を実行する必要がある操作で問題が発生する可能性があります。
引数:
- スコープ:スコープオブジェクト
- min_range: 入力に対して生成される可能性のある最小スカラー値。
- max_range: 入力に対して生成される可能性のある最大スカラー値。
戻り値:
-
Output
出力: float 入力から生成された量子化データ。 -
Output
Output_min: 出力に使用される実際の最小スカラー値。 -
Output
Output_max: 出力に使用される実際の最大スカラー値。
コンストラクターとデストラクター | |
---|---|
QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T) | |
QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T, const QuantizeV2::Attrs & attrs) |
パブリック属性 | |
---|---|
operation | |
output | |
output_max | |
output_min |
パブリック静的関数 | |
---|---|
Mode (StringPiece x) | |
RoundMode (StringPiece x) |
構造体 | |
---|---|
tensorflow:: ops:: QuantizeV2:: Attrs | QuantizeV2のオプションの属性セッター。 |
パブリック属性
手術
Operation operation
出力
::tensorflow::Output output
出力最大値
::tensorflow::Output output_max
出力_分
::tensorflow::Output output_min
公共機能
クオンタイズV2
QuantizeV2( const ::tensorflow::Scope & scope, ::tensorflow::Input input, ::tensorflow::Input min_range, ::tensorflow::Input max_range, DataType T )
クオンタイズV2
QuantizeV2( const ::tensorflow::Scope & scope, ::tensorflow::Input input, ::tensorflow::Input min_range, ::tensorflow::Input max_range, DataType T, const QuantizeV2::Attrs & attrs )
パブリック静的関数
モード
Attrs Mode( StringPiece x )
ラウンドモード
Attrs RoundMode( StringPiece x )