Perbarui entri yang relevan di '*var' dan '*accum' sesuai dengan skema momentum.
Tetapkan use_nesterov = True jika Anda ingin menggunakan momentum Nesterov.
Itu untuk baris yang memiliki grad, kami memperbarui var dan accum sebagai berikut:
akumulasi = akumulasi * momentum - lr * lulusan var += akumulasi
Kelas Bersarang
kelas | ResourceSparseApplyKerasMomentum.Options | Atribut opsional untuk ResourceSparseApplyKerasMomentum |
Konstanta
Rangkaian | OP_NAME | Nama operasi ini dikenal dengan mesin inti TensorFlow |
Metode Publik
statis <T memperluas TType > ResourceSparseApplyKerasMomentum | |
ResourceSparseApplyKerasMomentum.Options statis | useLocking (penguncian penggunaan Boolean) |
ResourceSparseApplyKerasMomentum.Options statis | useNesterov (Boolean useNesterov) |
Metode Warisan
Konstanta
String akhir statis publik OP_NAME
Nama operasi ini dikenal dengan mesin inti TensorFlow
Metode Publik
public static ResourceSparseApplyKerasMomentum buat ( Lingkup cakupan , Operand <?> var, Operand <?> accum, Operand <T> lr, Operand <T> grad, Operand <? extends TNumber > indeks, Operand <T> momentum, Opsi... pilihan)
Metode pabrik untuk membuat kelas yang membungkus operasi ResourceSparseApplyKerasMomentum baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
var | Harus dari Variabel(). |
akumulasi | Harus dari Variabel(). |
lr | Kecepatan pembelajaran. Pasti skalar. |
lulusan | Gradien. |
indeks | Vektor indeks ke dalam dimensi pertama var dan accum. |
momentum | momentum. Pasti skalar. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru ResourceSparseApplyKerasMomentum
ResourceSparseApplyKerasMomentum.Options statis publik useLocking (Boolean useLocking)
Parameter
gunakan Penguncian | Jika `True`, pembaruan tensor var dan accum akan dilindungi oleh kunci; jika tidak, perilaku tersebut tidak terdefinisikan, namun mungkin menunjukkan lebih sedikit pertentangan. |
---|
ResourceSparseApplyKerasMomentum.Options statis publik useNesterov (Boolean useNesterov)
Parameter
gunakanNesterov | Jika `True`, tensor yang diteruskan ke komputasi grad akan menjadi var + momentum * accum, sehingga pada akhirnya, var yang Anda dapatkan sebenarnya adalah var + momentum * accum. |
---|