Zaktualizuj „*var” zgodnie z algorytmem RMSProp.
Należy zauważyć, że w gęstej implementacji tego algorytmu ms i mama zostaną zaktualizowane, nawet jeśli grad będzie wynosić zero, ale w tej rzadkiej implementacji ms i mama nie będą aktualizować się w iteracjach, podczas których grad będzie wynosić zero.
średnia_kwadrat = zanik * średnia_kwadrat + (1-zanik) * gradient ** 2 Delta = szybkość_uczenia się * gradient / sqrt(średnia_kwadrat + epsilon)
$$ms <- rho * ms_{t-1} + (1-rho) * grad * grad$$$$mom <- momentum * mom_{t-1} + lr * grad / sqrt(ms + epsilon)$$$$var <- var - mom$$
Klasy zagnieżdżone
klasa | Opcje SparseApplyRmsProp | Opcjonalne atrybuty dla SparseApplyRmsProp |
Stałe
Smyczkowy | OP_NAME | Nazwa tej operacji znana silnikowi rdzenia TensorFlow |
Metody publiczne
Wyjście <T> | jako wyjście () Zwraca symboliczny uchwyt tensora. |
statyczny <T rozszerza TType > SparseApplyRmsProp <T> | utwórz (Zakres zasięgu , Operand <T> var, Operand <T> ms, Operand <T> mama, Operand <T> lr, Operand <T> rho, Operand <T> pęd, Operand <T> epsilon, Argument <T > grad, Operand <? rozszerza TNumber > indeksy, Opcje... opcje) Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację SparseApplyRmsProp. |
Wyjście <T> | na zewnątrz () To samo co „var”. |
statyczne SparseApplyRmsProp.Options | useLocking (boolowski useLocking) |
Metody dziedziczone
Stałe
publiczny statyczny końcowy ciąg znaków OP_NAME
Nazwa tej operacji znana silnikowi rdzenia TensorFlow
Metody publiczne
publiczne wyjście <T> asOutput ()
Zwraca symboliczny uchwyt tensora.
Dane wejściowe operacji TensorFlow są wynikami innej operacji TensorFlow. Ta metoda służy do uzyskania symbolicznego uchwytu reprezentującego obliczenia danych wejściowych.
public static SparseApplyRmsProp <T> utwórz (Zakres zakresu , Operand <T> var, Operand <T> ms, Operand <T> mama, Operand <T> lr, Operand <T> rho, Operand <T> pęd, Argument <T > epsilon, Operand <T> grad, Operand <? rozszerza TNumber > indeksy, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację SparseApplyRmsProp.
Parametry
zakres | aktualny zakres |
---|---|
odm | Powinno pochodzić ze zmiennej (). |
SM | Powinno pochodzić ze zmiennej (). |
mama | Powinno pochodzić ze zmiennej (). |
lr | Współczynnik skalowania. Musi być skalarem. |
rho | Szybkość rozpadu. Musi być skalarem. |
epsilon | Termin grzbietowy. Musi być skalarem. |
absolwent | Gradient. |
indeksy | Wektor indeksów pierwszego wymiaru var, ms i mama. |
opcje | przenosi opcjonalne wartości atrybutów |
Powroty
- nowa instancja SparseApplyRmsProp
public static SparseApplyRmsProp.Options useLocking (boolean useLocking)
Parametry
użyjBlokowanie | Jeśli `True`, aktualizacja tensorów var, ms i mama jest chroniona blokadą; w przeciwnym razie zachowanie jest niezdefiniowane, ale może wykazywać mniejszą rywalizację. |
---|