Actualice las entradas relevantes en '*var' y '*accum' según el esquema de impulso.
Establezca use_nesterov = True si desea utilizar el impulso de Nesterov.
Es decir, para las filas para las que tenemos grad, actualizamos var y accum de la siguiente manera:
acumulación = acumulación * impulso - lr * grad var += acumulación
Clases anidadas
| clase | ResourceSparseApplyKerasMomentum.Options | Atributos opcionales para ResourceSparseApplyKerasMomentum | |
Métodos públicos
| estático <T, U extiende Número> ResourceSparseApplyKerasMomentum | |
| estático ResourceSparseApplyKerasMomentum.Options | useLocking (uso booleano Locking) |
| estático ResourceSparseApplyKerasMomentum.Options | useNesterov (uso booleanoNesterov) |
Métodos heredados
Métodos públicos
creación pública estática de ResourceSparseApplyKerasMomentum (alcance del alcance , operando <?> var, operando <?> accum, operando <T> lr, operando <T> grad, operando <U> índices, operando <T> impulso, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación ResourceSparseApplyKerasMomentum.
Parámetros
| alcance | alcance actual |
|---|---|
| var | Debe ser de una Variable(). |
| acumular | Debe ser de una Variable(). |
| lr | Tasa de aprendizaje. Debe ser un escalar. |
| graduado | El gradiente. |
| índices | Un vector de índices en la primera dimensión de var y accum. |
| impulso | Impulso. Debe ser un escalar. |
| opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de ResourceSparseApplyKerasMomentum
ResourceSparseApplyKerasMomentum.Options estático público useLocking (useLocking booleano)
Parámetros
| utilizarBloqueo | Si es "True", la actualización de los tensores var y accum estará protegida por un bloqueo; de lo contrario, el comportamiento no está definido, pero puede presentar menos contención. |
|---|
público estático ResourceSparseApplyKerasMomentum.Options useNesterov (uso booleanoNesterov)
Parámetros
| utilizarNesterov | Si es "Verdadero", el tensor pasado para calcular grad será var + impulso * accum, por lo que al final, el var que obtienes es en realidad var + impulso * accum. |
|---|