fluxo tensor:: ops:: SparseApplyProximalAdagrad
#include <training_ops.h>
Entradas de atualização esparsas em '*var' e '*accum' de acordo com o algoritmo FOBOS.
Resumo
Ou seja, para as linhas para as quais graduamos, atualizamos var e accum da seguinte forma:
$$accum += grad * grad$$
$$prox_v = var$$
$$prox_v -= lr * grad * (1 / sqrt(accum))$$
$$var = sign(prox_v)/(1+lr*l2) * max{|prox_v|-lr*l1,0}$$
Argumentos:
- escopo: um objeto Escopo
- var: Deve ser de uma variável().
- accum: Deve ser de uma variável().
- lr: Taxa de aprendizagem. Deve ser um escalar.
- l1: regularização L1. Deve ser um escalar.
- l2: regularização L2. Deve ser um escalar.
- graduação: O gradiente.
- índices: Um vetor de índices na primeira dimensão de var e accum.
Atributos opcionais (veja Attrs
):
- use_locking: Se True, a atualização dos tensores var e accum será protegida por um bloqueio; caso contrário, o comportamento será indefinido, mas poderá apresentar menos contenção.
Retorna:
-
Output
: igual a "var".
Construtores e Destruidores | |
---|---|
SparseApplyProximalAdagrad (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input accum, :: tensorflow::Input lr, :: tensorflow::Input l1, :: tensorflow::Input l2, :: tensorflow::Input grad, :: tensorflow::Input indices) | |
SparseApplyProximalAdagrad (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input accum, :: tensorflow::Input lr, :: tensorflow::Input l1, :: tensorflow::Input l2, :: tensorflow::Input grad, :: tensorflow::Input indices, const SparseApplyProximalAdagrad::Attrs & attrs) |
Atributos públicos | |
---|---|
operation | |
out |
Funções públicas | |
---|---|
node () const | ::tensorflow::Node * |
operator::tensorflow::Input () const | |
operator::tensorflow::Output () const |
Funções estáticas públicas | |
---|---|
UseLocking (bool x) |
Estruturas | |
---|---|
tensorflow:: ops:: SparseApplyProximalAdagrad:: Attrs | Configuradores de atributos opcionais para SparseApplyProximalAdagrad . |
Atributos públicos
operação
Operation operation
fora
::tensorflow::Output out
Funções públicas
SparseApplyProximalAdagrad
SparseApplyProximalAdagrad( const ::tensorflow::Scope & scope, ::tensorflow::Input var, ::tensorflow::Input accum, ::tensorflow::Input lr, ::tensorflow::Input l1, ::tensorflow::Input l2, ::tensorflow::Input grad, ::tensorflow::Input indices )
SparseApplyProximalAdagrad
SparseApplyProximalAdagrad( const ::tensorflow::Scope & scope, ::tensorflow::Input var, ::tensorflow::Input accum, ::tensorflow::Input lr, ::tensorflow::Input l1, ::tensorflow::Input l2, ::tensorflow::Input grad, ::tensorflow::Input indices, const SparseApplyProximalAdagrad::Attrs & attrs )
nó
::tensorflow::Node * node() const
operador::tensorflow::Input
operator::tensorflow::Input() const
operador::tensorflow::Saída
operator::tensorflow::Output() const
Funções estáticas públicas
UseLocking
Attrs UseLocking( bool x )