Atualize '* var' de acordo com o algoritmo AdaMax.
m_t <- beta1 * m_ {t-1} + (1 - beta1) * g v_t <- max (beta2 * v_ {t-1}, abs (g)) variável <- variável - learning_rate / (1 - beta1 ^ t) * m_t / (v_t + epsilon)
Classes aninhadas
classe | ApplyAdaMax.Options | Atributos opcionais para ApplyAdaMax |
Constantes
Fragmento | OP_NAME | O nome desta operação, conforme conhecido pelo motor principal TensorFlow |
Métodos Públicos
Output <T> | asOutput () Retorna o identificador simbólico do tensor. |
estática <T estende TType > ApplyAdaMax <T> | |
Output <T> | a () O mesmo que "var". |
estáticos ApplyAdaMax.Options | useLocking (booleano useLocking) |
Métodos herdados
Constantes
nome_op final String public static
O nome desta operação, conforme conhecido pelo motor principal TensorFlow
Métodos Públicos
pública Output <T> asOutput ()
Retorna o identificador simbólico do tensor.
As entradas para as operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.
public static ApplyAdaMax <T> create ( Scope escopo, Operando <T> var, Operando <T> m, Operando <T> v, Operando <T> beta1Power, Operando <T> lr, Operando <T> beta1, Operando <T > beta2, Operando <T> epsilon, Operando <T> grad, Options ... opções)
Método de fábrica para criar uma classe envolvendo uma nova operação ApplyAdaMax.
Parâmetros
alcance | escopo atual |
---|---|
var | Deve ser de uma variável (). |
m | Deve ser de uma variável (). |
v | Deve ser de uma variável (). |
beta1Power | Deve ser um escalar. |
lr | Fator de escala. Deve ser um escalar. |
beta1 | Fator de momentum. Deve ser um escalar. |
beta2 | Fator de momentum. Deve ser um escalar. |
épsilon | Termo de cume. Deve ser um escalar. |
grad | O gradiente. |
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de ApplyAdaMax
public static ApplyAdaMax.Options useLocking (Boolean useLocking)
Parâmetros
useLocking | Se for `True`, a atualização dos tensores var, m e v será protegida por um bloqueio; caso contrário, o comportamento é indefinido, mas pode exibir menos contenção. |
---|