Nicelenmiş 'giriş' tensörünü kullanarak daha düşük hassasiyetli bir 'çıkışa' dönüştürün.
daha düşük bit derinliğinin kullanımını en üst düzeye çıkarmak ve çıkışın minimum ve maksimum aralıklarını buna göre ayarlamak için değerlerin gerçek dağıtımı.
[input_min, input_max], 'giriş' verilerinin kayan nokta yorumlanmasına ilişkin aralığı belirten skaler değişkenlerdir. Örneğin, eğer girdi_min -1.0f ve girdi_maks 1.0f ise ve quint16 kuantize edilmiş verilerle ilgileniyorsak, 16 bitlik verilerdeki 0 değeri -1.0f olarak yorumlanmalıdır ve 65535, 1.0f anlamına gelir.
Bu operatör, veride bulunan gerçek minimum ve maksimum değerleri hesaplayarak, daha düşük bit derinliğine sahip bir çıktıya mümkün olduğunca fazla hassasiyet sıkıştırmaya çalışır. Örneğin, belki de quint16 girişinin 16.384'ten düşük ve 49.152'den yüksek değeri yoktur. Bu, aslında aralığın yalnızca yarısının gerekli olduğu anlamına gelir; tüm kayan noktalı yorumlamalar -0,5f ile 0,5f arasındadır, dolayısıyla verileri bir quint8 çıktısına sıkıştırmak istiyorsak, teorik -1,0f ila 1,0 yerine bu aralığı kullanabiliriz. f, min ve max girişi tarafından önerilen değerdir.
Pratikte bu, girişlerinden daha yüksek bit derinliğinde çıkışlar üretebilen ve büyük potansiyel çıkış aralıklarına sahip olabilen, ancak pratikte girdi değerlerinin yalnızca küçük bir kısmını kullanan bir giriş değerleri dağılımına sahip olan QuantizedMatMul gibi işlemlerden çıktı almak için en kullanışlıdır. olası aralık. Bu çıktıyı bu operatöre besleyerek, minimum doğruluk kaybıyla onu 32 bitten 8'e düşürebiliriz.
Sabitler
Sicim | OP_NAME | Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı |
Genel Yöntemler
static <U extends TType > QuantizeDownAndShrinkRange <U> | |
Çıkış <U> | çıktı () |
Çıkış < TFloat32 > | çıktıMaksimum () Maksimum nicelenmiş çıkış değerinin temsil ettiği kayan değer. |
Çıkış < TFloat32 > | çıktıMin () Minimum nicelenmiş çıkış değerinin temsil ettiği kayan değer. |
Kalıtsal Yöntemler
Sabitler
genel statik son Dize OP_NAME
Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı
Genel Yöntemler
public static QuantizeDownAndShrinkRange <U> create ( Kapsam kapsamı, Operand <? extends TType > input, Operand < TFloat32 > inputMin, Operand < TFloat32 > inputMax, Class<U> outType)
Yeni bir QuantizeDownAndShrinkRange işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
Parametreler
kapsam | mevcut kapsam |
---|---|
girişMin | Minimum nicelenmiş giriş değerinin temsil ettiği kayan değer. |
girişMaksimum | Maksimum nicelenmiş giriş değerinin temsil ettiği kayan değer. |
çıkış türü | Çıktının türü. Tinput'tan daha düşük bir bit derinliği olmalıdır. |
İadeler
- QuantizeDownAndShrinkRange'ın yeni bir örneği