публичный финальный класс ResourceApplyAdaMax
Обновите *var в соответствии с алгоритмом AdaMax.
m_t <- beta1 * m_{t-1} + (1 - beta1) * g v_t <- max(beta2 * v_{t-1}, abs(g)) переменная <- переменная - скорость_обучения / (1 - beta1^ t) *m_t/(v_t + эпсилон)
Вложенные классы
сорт | ResourceApplyAdaMax.Options | Дополнительные атрибуты для ResourceApplyAdaMax |
Константы
Нить | OP_NAME | Название этой операции, известное основному движку TensorFlow. |
Публичные методы
статический <T расширяет TType > ResourceApplyAdaMax | |
статический ResourceApplyAdaMax.Options | useLocking (логическое значение useLocking) |
Унаследованные методы
Константы
общедоступная статическая финальная строка OP_NAME
Название этой операции, известное основному движку TensorFlow.
Постоянное значение: «ResourceApplyAdaMax».
Публичные методы
public static ResourceApplyAdaMax create ( Область действия, Операнд <?> var, Операнд <?> m, Операнд <?> v, Операнд <T> beta1Power, Операнд <T> lr, Операнд <T> beta1, Операнд <T> beta2, Операнд <T> эпсилон, Операнд <T> град, Опции... опции)
Фабричный метод для создания класса, обертывающего новую операцию ResourceApplyAdaMax.
Параметры
объем | текущий объем |
---|---|
вар | Должно быть из переменной(). |
м | Должно быть из переменной(). |
в | Должно быть из переменной(). |
бета1Power | Должно быть скаляр. |
лр | Коэффициент масштабирования. Должно быть скаляр. |
бета1 | Фактор импульса. Должно быть скаляр. |
бета2 | Фактор импульса. Должно быть скаляр. |
эпсилон | Риджовый термин. Должно быть скаляр. |
выпускник | Градиент. |
параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр ResourceApplyAdaMax
общедоступный статический ResourceApplyAdaMax.Options useLocking (логическое значение useLocking)
Параметры
использоватьLocking | Если «True», обновление тензоров var, m и v будет защищено блокировкой; в противном случае поведение не определено, но может вызывать меньше конфликтов. |
---|