tensorflow :: operaciones :: EscasaApplyProximalAdagrad
#include <training_ops.h>
Entradas de actualización dispersas en '* var' y '* acumula' según el algoritmo FOBOS.
Resumen
Es decir, para las filas para las que hemos graduado, actualizamos var y acumulamos de la siguiente manera:
$$accum += grad * grad$$
$$prox_v = var$$
$$prox_v -= lr * grad * (1 / sqrt(accum))$$
$$var = sign(prox_v)/(1+lr*l2) * max{|prox_v|-lr*l1,0}$$
Argumentos:
- alcance: un objeto de alcance
- var: debe ser de una variable ().
- acum: debe ser de una variable ().
- lr: tasa de aprendizaje. Debe ser un escalar.
- l1: Regularización L1. Debe ser un escalar.
- l2: Regularización L2. Debe ser un escalar.
- grad: El gradiente.
- índices: Un vector de índices en la primera dimensión de var y acum.
Atributos opcionales (consulte Attrs
):
- use_locking: Si es True, la actualización de los tensores var y acumuladores estará protegida por un bloqueo; de lo contrario, el comportamiento no está definido, pero puede mostrar menos contención.
Devoluciones:
-
Output
: Igual que "var".
Constructores y Destructores | |
---|---|
SparseApplyProximalAdagrad (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input accum, :: tensorflow::Input lr, :: tensorflow::Input l1, :: tensorflow::Input l2, :: tensorflow::Input grad, :: tensorflow::Input indices) | |
SparseApplyProximalAdagrad (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input accum, :: tensorflow::Input lr, :: tensorflow::Input l1, :: tensorflow::Input l2, :: tensorflow::Input grad, :: tensorflow::Input indices, const SparseApplyProximalAdagrad::Attrs & attrs) |
Atributos públicos | |
---|---|
operation | |
out |
Funciones publicas | |
---|---|
node () const | ::tensorflow::Node * |
operator::tensorflow::Input () const | |
operator::tensorflow::Output () const |
Funciones estáticas públicas | |
---|---|
UseLocking (bool x) |
Estructuras | |
---|---|
tensorflow :: ops :: SparseApplyProximalAdagrad :: Attrs | Establecedores de atributos opcionales para SparseApplyProximalAdagrad . |
Atributos públicos
operación
Operation operation
fuera
::tensorflow::Output out
Funciones publicas
EscasaApplyProximalAdagrad
SparseApplyProximalAdagrad( const ::tensorflow::Scope & scope, ::tensorflow::Input var, ::tensorflow::Input accum, ::tensorflow::Input lr, ::tensorflow::Input l1, ::tensorflow::Input l2, ::tensorflow::Input grad, ::tensorflow::Input indices )
EscasaApplyProximalAdagrad
SparseApplyProximalAdagrad( const ::tensorflow::Scope & scope, ::tensorflow::Input var, ::tensorflow::Input accum, ::tensorflow::Input lr, ::tensorflow::Input l1, ::tensorflow::Input l2, ::tensorflow::Input grad, ::tensorflow::Input indices, const SparseApplyProximalAdagrad::Attrs & attrs )
nodo
::tensorflow::Node * node() const
operador :: tensorflow :: Entrada
operator::tensorflow::Input() const
operador :: tensorflow :: Salida
operator::tensorflow::Output() const
Funciones estáticas públicas
UseLocking
Attrs UseLocking( bool x )