fluxo tensor:: ops:: QuantizeV2

#include <array_ops.h>

Quantize o tensor de 'entrada' do tipo float para o tensor de 'saída' do tipo 'T'.

Resumo

[min_range, max_range] são valores flutuantes escalares que especificam o intervalo para os dados de 'entrada'. O atributo 'mode' controla exatamente quais cálculos são usados ​​para converter os valores flutuantes em seus equivalentes quantizados. O atributo 'round_mode' controla qual algoritmo de desempate de arredondamento é usado ao arredondar valores flutuantes para seus equivalentes quantizados.

No modo 'MIN_COMBINED', cada valor do tensor passará pelo seguinte:

out[i] = (in[i] - min_range) * range(T) / (max_range - min_range)
if T == qint8: out[i] -= (range(T) + 1) / 2.0

aqui range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min()

Exemplo de modo MIN_COMBINED

Suponha que a entrada seja do tipo float e tenha um intervalo possível de [0,0, 6,0] e o tipo de saída seja quint8 ([0, 255]). Os valores min_range e max_range devem ser especificados como 0,0 e 6,0. A quantização de float para quint8 multiplicará cada valor da entrada por 255/6 e será convertida em quint8.

Se o tipo de saída for qint8 ([-128, 127]), a operação subtrairá adicionalmente cada valor por 128 antes da conversão, para que o intervalo de valores se alinhe com o intervalo de qint8.

Se o modo for 'MIN_FIRST', esta abordagem será usada:

num_discrete_values = 1 << (# of bits in T)
range_adjust = num_discrete_values / (num_discrete_values - 1)
range = (range_max - range_min) * range_adjust
range_scale = num_discrete_values / range
quantized = round(input * range_scale) - round(range_min * range_scale) +
  numeric_limits::min()
quantized = max(quantized, numeric_limits::min())
quantized = min(quantized, numeric_limits::max())

A maior diferença entre este e MIN_COMBINED é que o intervalo mínimo é arredondado primeiro, antes de ser subtraído do valor arredondado. Com MIN_COMBINED, um pequeno viés é introduzido onde repetidas iterações de quantização e desquantização introduzirão um erro cada vez maior.

Exemplo de modo ESCALADO

O modo SCALED corresponde à abordagem de quantização usada em QuantizeAndDequantize{V2|V3} .

Se o modo for SCALED , não usamos toda a faixa do tipo de saída, optando por omitir o valor mais baixo possível para simetria (por exemplo, a faixa de saída é -127 a 127, não -128 a 127 para quantização de 8 bits com sinal), então 0,0 mapeia para 0.

Primeiro encontramos o intervalo de valores em nosso tensor. O intervalo que usamos é sempre centrado em 0, então encontramos m tal que

  m = max(abs(input_min), abs(input_max))

Nosso intervalo de tensores de entrada é então [-m, m] .

A seguir, escolhemos nossos intervalos de quantização de ponto fixo, [min_fixed, max_fixed] . Se T estiver assinado, isso é

  num_bits = sizeof(T) * 8
  [min_fixed, max_fixed] =
      [-(1 << (num_bits - 1) - 1), (1 << (num_bits - 1)) - 1]

Caso contrário, se T não tiver sinal, o intervalo do ponto fixo é

  [min_fixed, max_fixed] = [0, (1 << num_bits) - 1]

A partir disso calculamos nosso fator de escala, s:

  s = (max_fixed - min_fixed) / (2 * m)

Agora podemos quantizar os elementos do nosso tensor:

result = round(input * s)

Uma coisa a observar é que o operador pode optar por ajustar ligeiramente os valores mínimos e máximos solicitados durante o processo de quantização, portanto, você deve sempre usar as portas de saída como intervalo para cálculos posteriores. Por exemplo, se os valores mínimo e máximo solicitados forem próximos de iguais, eles serão separados por um pequeno valor épsilon para evitar a criação de buffers quantizados mal formados. Caso contrário, você pode acabar com buffers onde todos os valores quantizados são mapeados para o mesmo valor flutuante, o que causa problemas para operações que precisam realizar cálculos adicionais sobre eles.

Argumentos:

  • escopo: um objeto Escopo
  • min_range: O valor escalar mínimo possivelmente produzido para a entrada.
  • max_range: O valor escalar máximo possivelmente produzido para a entrada.

Retorna:

  • Output : Os dados quantizados produzidos a partir da entrada flutuante.
  • Output output_min: O valor escalar mínimo real usado para a saída.
  • Output output_max: O valor escalar máximo real usado para a saída.

Construtores e Destruidores

QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T)
QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T, const QuantizeV2::Attrs & attrs)

Atributos públicos

operation
output
output_max
output_min

Funções estáticas públicas

Mode (StringPiece x)
RoundMode (StringPiece x)

Estruturas

tensorflow:: ops:: QuantizeV2:: Attrs

Configuradores de atributos opcionais para QuantizeV2 .

Atributos públicos

operação

Operation operation

saída

::tensorflow::Output output

saída_max

::tensorflow::Output output_max

saída_min

::tensorflow::Output output_min

Funções públicas

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T
)

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T,
  const QuantizeV2::Attrs & attrs
)

Funções estáticas públicas

Modo

Attrs Mode(
  StringPiece x
)

Modo redondo

Attrs RoundMode(
  StringPiece x
)