Zaktualizuj odpowiednie wpisy w „*var” i „*accum” zgodnie ze schematem pędu.
Ustaw use_nesterov = True, jeśli chcesz użyć pędu Niestierowa.
Oznacza to, że dla wierszy, dla których mamy grad, aktualizujemy var i accum w następujący sposób:
accum = accum * pęd - lr * grad var += accum
Klasy zagnieżdżone
klasa | ResourceSparseApplyKerasMomentum.Opcje | Opcjonalne atrybuty ResourceSparseApplyKerasMomentum |
Stałe
Strunowy | OP_NAME | Nazwa tej operacji znana silnikowi rdzenia TensorFlow |
Metody publiczne
static <T rozszerza TType > ResourceSparseApplyKerasMomentum | |
statyczny ResourceSparseApplyKerasMomentum.Options | useLocking (boolowski useLocking) |
statyczny ResourceSparseApplyKerasMomentum.Options | useNesterov (Boolean useNesterov) |
Metody dziedziczone
Stałe
publiczny statyczny końcowy ciąg znaków OP_NAME
Nazwa tej operacji znana silnikowi rdzenia TensorFlow
Metody publiczne
public static ResourceSparseApplyKerasMomentum create ( Zakres zasięgu, Operand <?> var, Operand <?> accum, Operand <T> lr, Operand <T> grad, Operand <? rozszerza TNumber > indeksy, Operand <T> pęd, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację ResourceSparseApplyKerasMomentum.
Parametry
zakres | aktualny zakres |
---|---|
odm | Powinno pochodzić ze zmiennej (). |
gromadzić | Powinno pochodzić ze zmiennej (). |
lr | Szybkość uczenia się. Musi być skalarem. |
absolwent | Gradient. |
indeksy | Wektor indeksów do pierwszego wymiaru var i accum. |
pęd | Pęd. Musi być skalarem. |
opcje | przenosi opcjonalne wartości atrybutów |
Zwroty
- nowa instancja ResourceSparseApplyKerasMomentum
publiczny statyczny ResourceSparseApplyKerasMomentum.Options useLocking (boolean useLocking)
Parametry
użyjBlokowanie | Jeśli `True`, aktualizacja tensorów var i accum będzie zabezpieczona blokadą; w przeciwnym razie zachowanie jest niezdefiniowane, ale może wykazywać mniejszą rywalizację. |
---|
public static ResourceSparseApplyKerasMomentum.Options useNesterov (Boolean useNesterov)
Parametry
użyj Niestierowa | Jeśli „True”, tensor przekazany do obliczenia grad będzie miał postać var + pęd * accum, więc ostatecznie otrzymana wartość var będzie wynosić w rzeczywistości var + pęd * accum. |
---|