przepływ tensorowy:: ops:: QuantizeV2

#include <array_ops.h>

Kwantyzuj tensor „wejściowy” typu float do tensora „wyjściowego” typu „T”.

Streszczenie

[min_range, max_range] to skalarne liczby zmiennoprzecinkowe, które określają zakres danych „wejściowych”. Atrybut „mode” dokładnie kontroluje, które obliczenia są używane do konwersji wartości zmiennoprzecinkowych na ich skwantowane odpowiedniki. Atrybut „round_mode” kontroluje, który algorytm zaokrąglania rozstrzygania remisów jest używany podczas zaokrąglania wartości zmiennoprzecinkowych do ich skwantowanych odpowiedników.

W trybie „MIN_COMBINED” każda wartość tensora zostanie poddana następującym czynnościom:

out[i] = (in[i] - min_range) * range(T) / (max_range - min_range)
if T == qint8: out[i] -= (range(T) + 1) / 2.0

tutaj range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min()

Przykład trybu MIN_COMBINED

Załóżmy, że wejście jest typu float i ma możliwy zakres [0,0, 6,0], a typ wyjścia to quint8 ([0, 255]). Wartości min_range i max_range należy określić jako 0,0 i 6,0. Kwantyzacja od float do quint8 spowoduje pomnożenie każdej wartości wejściowej przez 255/6 i rzutowanie do quint8.

Jeśli typem wyniku był qint8 ([-128, 127]), operacja dodatkowo odejmie każdą wartość o 128 przed rzutowaniem, tak aby zakres wartości pokrywał się z zakresem qint8.

Jeśli tryb to „MIN_FIRST”, stosowane jest następujące podejście:

num_discrete_values = 1 << (# of bits in T)
range_adjust = num_discrete_values / (num_discrete_values - 1)
range = (range_max - range_min) * range_adjust
range_scale = num_discrete_values / range
quantized = round(input * range_scale) - round(range_min * range_scale) +
  numeric_limits::min()
quantized = max(quantized, numeric_limits::min())
quantized = min(quantized, numeric_limits::max())

Największą różnicą między tym a MIN_COMBINED jest to, że minimalny zakres jest najpierw zaokrąglany, a następnie odjęty od zaokrąglonej wartości. W przypadku MIN_COMBINED wprowadzane jest małe odchylenie, w którym powtarzane iteracje kwantyzacji i dekwantyzacji będą wprowadzać coraz większy błąd.

Tryb SKALOWANY Przykład

Tryb SCALED odpowiada podejściu kwantyzacji stosowanemu w QuantizeAndDequantize{V2|V3} .

Jeśli trybem jest SCALED , nie wykorzystujemy pełnego zakresu typu wyjścia, decydując się na pominięcie najniższej możliwej wartości symetrii (np. zakres wyjściowy wynosi -127 do 127, a nie -128 do 127 dla 8-bitowej kwantyzacji ze znakiem), tak, że 0.0 jest odwzorowane na 0.

Najpierw znajdujemy zakres wartości w naszym tensorze. Zakres, którego używamy, jest zawsze wyśrodkowany na 0, więc znajdujemy m takie, że

  m = max(abs(input_min), abs(input_max))

Nasz zakres tensora wejściowego wynosi wówczas [-m, m] .

Następnie wybieramy nasze zestawy kwantyzacji stałoprzecinkowej [min_fixed, max_fixed] . Jeśli T jest podpisane, tak jest

  num_bits = sizeof(T) * 8
  [min_fixed, max_fixed] =
      [-(1 << (num_bits - 1) - 1), (1 << (num_bits - 1)) - 1]

W przeciwnym razie, jeśli T jest bez znaku, zakres stałoprzecinkowy jest

  [min_fixed, max_fixed] = [0, (1 << num_bits) - 1]

Na tej podstawie obliczamy nasz współczynnik skalowania, s:

  s = (max_fixed - min_fixed) / (2 * m)

Teraz możemy skwantyzować elementy naszego tensora:

result = round(input * s)

Jedną z rzeczy, na którą należy zwrócić uwagę, jest to, że operator może zdecydować się na nieznaczne dostosowanie żądanych wartości minimalnych i maksymalnych podczas procesu kwantyzacji, dlatego należy zawsze używać portów wyjściowych jako zakresu do dalszych obliczeń. Na przykład, jeśli żądane wartości minimalne i maksymalne są prawie równe, zostaną oddzielone małą wartością epsilon, aby zapobiec tworzeniu się źle utworzonych skwantowanych buforów. W przeciwnym razie możesz otrzymać bufory, w których wszystkie skwantowane wartości są odwzorowywane na tę samą wartość zmiennoprzecinkową, co powoduje problemy dla operacji, które muszą wykonywać na nich dalsze obliczenia.

Argumenty:

  • zakres: Obiekt Scope
  • min_range: Minimalna wartość skalarna, jaka może zostać wygenerowana dla wejścia.
  • max_range: Maksymalna wartość skalarna, jaką można uzyskać dla wejścia.

Zwroty:

  • Wyjście Output : skwantowane dane generowane z wejścia pływającego.
  • Output Output_min: Rzeczywista minimalna wartość skalarna używana na wyjściu.
  • Output Output_max: Rzeczywista maksymalna wartość skalarna używana na wyjściu.

Konstruktory i destruktory

QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T)
QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T, const QuantizeV2::Attrs & attrs)

Atrybuty publiczne

operation
output
output_max
output_min

Publiczne funkcje statyczne

Mode (StringPiece x)
RoundMode (StringPiece x)

Struktury

tensorflow:: ops:: QuantizeV2:: Atrybuty

Opcjonalne narzędzia ustawiające atrybuty dla QuantizeV2 .

Atrybuty publiczne

działanie

Operation operation

wyjście

::tensorflow::Output output

wyjście_maks

::tensorflow::Output output_max

wyjście_min

::tensorflow::Output output_min

Funkcje publiczne

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T
)

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T,
  const QuantizeV2::Attrs & attrs
)

Publiczne funkcje statyczne

Tryb

Attrs Mode(
  StringPiece x
)

Tryb okrągły

Attrs RoundMode(
  StringPiece x
)