텐서플로우:: 작전:: QuantizeDownAndShrinkRange

#include <math_ops.h>

다음을 사용하여 양자화된 '입력' 텐서를 낮은 정밀도의 '출력'으로 변환합니다.

요약

낮은 비트 깊이의 사용을 최대화하고 이에 따라 출력 최소 및 최대 범위를 조정하기 위해 값을 실제 분포합니다.

[input_min, input_max]는 '입력' 데이터의 부동 소수점 해석 범위를 지정하는 스칼라 부동 소수점입니다. 예를 들어 input_min이 -1.0f이고 input_max가 1.0f이고 quint16 양자화된 데이터를 처리하는 경우 16비트 데이터의 0 값은 -1.0f로 해석되어야 하며 65535는 1.0f를 의미합니다.

이 연산자는 데이터에서 발견된 실제 최소값과 최대값을 계산하여 비트 심도가 낮은 출력에 최대한 높은 정밀도를 적용하려고 합니다. 예를 들어, 해당 quint16 입력에는 16,384보다 낮은 값이 없고 49,152보다 높은 값이 없을 수 있습니다. 즉, 실제로는 범위의 절반만 필요하고 모든 부동 소수점 해석은 -0.5f에서 0.5f 사이이므로 데이터를 quint8 출력으로 압축하려면 이론적으로 -1.0f에서 1.0이 아닌 해당 범위를 사용할 수 있습니다. f는 입력 min과 max에 의해 제안됩니다.

실제로 이는 입력보다 더 높은 비트 심도 출력을 생성할 수 있고 잠재적 출력 범위가 클 수 있는 QuantizedMatMul 과 같은 작업에서 출력을 가져오는 데 가장 유용합니다. 그러나 실제로는 입력 값의 작은 부분만 사용하는 입력 값 분포가 있습니다. 가능한 범위. 해당 출력을 이 연산자에 입력하면 정확도 손실을 최소화하면서 출력을 32비트에서 8비트로 줄일 수 있습니다.

인수:

  • 범위: 범위 개체
  • input_min: 최소 양자화된 입력 값이 나타내는 부동 소수점 값입니다.
  • input_max: 양자화된 최대 입력값이 나타내는 float 값입니다.
  • out_type: 출력 유형입니다. Tinput보다 비트 깊이가 낮아야 합니다.

보고:

  • Output 출력
  • Output 출력_최소: 양자화된 최소 출력 값이 나타내는 부동 소수점 값입니다.
  • Output 출력_최대: 양자화된 최대 출력 값이 나타내는 부동 소수점 값입니다.

생성자와 소멸자

QuantizeDownAndShrinkRange (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input input_min, :: tensorflow::Input input_max, DataType out_type)

공개 속성

operation
output
output_max
output_min

공개 속성

작업

Operation operation

산출

::tensorflow::Output output

출력_최대

::tensorflow::Output output_max

출력_최소

::tensorflow::Output output_min

공공 기능

QuantizeDownAndShrinkRange

 QuantizeDownAndShrinkRange(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input input_min,
  ::tensorflow::Input input_max,
  DataType out_type
)