Aggiorna '*var' secondo l'algoritmo AdaMax.
m_t <- beta1 * m_{t-1} + (1 - beta1) * g v_t <- max(beta2 * v_{t-1}, abs(g)) variabile <- variabile - tasso_apprendimento / (1 - beta1^ t) * m_t / (v_t + epsilon)
Classi nidificate
classe | ResourceApplyAdaMax.Options | Attributi facoltativi per ResourceApplyAdaMax |
Costanti
Corda | OP_NAME | Il nome di questa operazione, come noto al motore principale di TensorFlow |
Metodi pubblici
statico <T estende TType > ResourceApplyAdaMax | create ( Ambito ambito , Operando <?> var, Operando <?> m, Operando <?> v, Operando <T> beta1Power, Operando <T> lr, Operando <T> beta1, Operando <T> beta2, Operando <T > epsilon, Operando <T> grad, Opzioni... opzioni) Metodo factory per creare una classe che racchiude una nuova operazione ResourceApplyAdaMax. |
static ResourceApplyAdaMax.Options | useLocking (useLocking booleano) |
Metodi ereditati
Costanti
Stringa finale statica pubblica OP_NAME
Il nome di questa operazione, come noto al motore principale di TensorFlow
Metodi pubblici
public static ResourceApplyAdaMax create ( Ambito ambito , Operando <?> var, Operando <?> m, Operando <?> v, Operando <T> beta1Power, Operando <T> lr, Operando <T> beta1, Operando <T> beta2, Operando <T> epsilon, Operando <T> grad, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione ResourceApplyAdaMax.
Parametri
scopo | ambito attuale |
---|---|
var | Dovrebbe provenire da una variabile(). |
M | Dovrebbe provenire da una variabile(). |
v | Dovrebbe provenire da una variabile(). |
beta1Power | Deve essere uno scalare. |
lr | Fattore di scala. Deve essere uno scalare. |
beta1 | Fattore di slancio. Deve essere uno scalare. |
beta2 | Fattore di slancio. Deve essere uno scalare. |
epsilon | Termine di cresta. Deve essere uno scalare. |
grado | Il gradiente. |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di ResourceApplyAdaMax
public static ResourceApplyAdaMax.Options useLocking (useLocking booleano)
Parametri
utilizzareBlocco | Se "True", l'aggiornamento dei tensori var, m e v sarà protetto da un blocco; altrimenti il comportamento non è definito, ma può mostrare meno contesa. |
---|