przepływ tensorowy:: ops:: ZastosujWyśrodkowanyRMSPProp

#include <training_ops.h>

Zaktualizuj „*var” zgodnie z wyśrodkowanym algorytmem RMSProp.

Streszczenie

Wyśrodkowany algorytm RMSProp wykorzystuje oszacowanie wyśrodkowanego drugiego momentu (tj. wariancji) do normalizacji, w przeciwieństwie do zwykłego RMSProp, który wykorzystuje (niewyśrodkowany) drugi moment. Często pomaga to w treningu, ale jest nieco droższe pod względem obliczeń i pamięci.

Należy zauważyć, że w gęstej implementacji tego algorytmu mg, ms i mama zostaną zaktualizowane, nawet jeśli grad wynosi zero, ale w tej rzadkiej implementacji mg, ms i mama nie będą aktualizowane w iteracjach, podczas których grad wynosi zero.

średnia_kwadrat = zanik * średnia_kwadrat + (1-zanik) * gradient ** 2 średnia_grad = zanik * średnia_grad + (1-zanik) * gradient

Delta = współczynnik_uczenia się * gradient / sqrt(średnia_kwadrat + epsilon - średnia_grad** 2)

mg <- rho * mg_{t-1} + (1-rho) * grad ms <- rho * ms_{t-1} + (1-rho) * grad * grad mama <- pęd * mama_{t-1 } + lr * grad / sqrt(ms - mg * mg + epsilon) var <- var - mama

Argumenty:

  • zakres: Obiekt Scope
  • var: Powinien pochodzić ze zmiennej ().
  • mg: powinno pochodzić ze zmiennej ().
  • ms: Powinno pochodzić ze zmiennej ().
  • mama: Powinno pochodzić ze zmiennej ().
  • lr: Współczynnik skalowania. Musi być skalarem.
  • rho: Szybkość zaniku. Musi być skalarem.
  • epsilon: termin grzbietowy. Musi być skalarem.
  • grad: gradient.

Opcjonalne atrybuty (patrz Attrs ):

  • use_locking: Jeśli True , aktualizacja tensorów var, mg, ms i mama jest chroniona blokadą; w przeciwnym razie zachowanie jest niezdefiniowane, ale może wykazywać mniejszą rywalizację.

Zwroty:

  • Output : takie same jak „var”.

Konstruktory i destruktory

ApplyCenteredRMSProp (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input mg, :: tensorflow::Input ms, :: tensorflow::Input mom, :: tensorflow::Input lr, :: tensorflow::Input rho, :: tensorflow::Input momentum, :: tensorflow::Input epsilon, :: tensorflow::Input grad)
ApplyCenteredRMSProp (const :: tensorflow::Scope & scope, :: tensorflow::Input var, :: tensorflow::Input mg, :: tensorflow::Input ms, :: tensorflow::Input mom, :: tensorflow::Input lr, :: tensorflow::Input rho, :: tensorflow::Input momentum, :: tensorflow::Input epsilon, :: tensorflow::Input grad, const ApplyCenteredRMSProp::Attrs & attrs)

Atrybuty publiczne

operation
out

Funkcje publiczne

node () const
::tensorflow::Node *
operator::tensorflow::Input () const
operator::tensorflow::Output () const

Publiczne funkcje statyczne

UseLocking (bool x)

Struktury

tensorflow:: ops:: ApplyCenteredRMSProp:: Attrs

Opcjonalne moduły ustawiające atrybuty dla ApplyCenteredRMSProp .

Atrybuty publiczne

działanie

Operation operation

na zewnątrz

::tensorflow::Output out

Funkcje publiczne

ZastosujWyśrodkowanyRMSPProp

 ApplyCenteredRMSProp(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input var,
  ::tensorflow::Input mg,
  ::tensorflow::Input ms,
  ::tensorflow::Input mom,
  ::tensorflow::Input lr,
  ::tensorflow::Input rho,
  ::tensorflow::Input momentum,
  ::tensorflow::Input epsilon,
  ::tensorflow::Input grad
)

ZastosujWyśrodkowanyRMSPProp

 ApplyCenteredRMSProp(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input var,
  ::tensorflow::Input mg,
  ::tensorflow::Input ms,
  ::tensorflow::Input mom,
  ::tensorflow::Input lr,
  ::tensorflow::Input rho,
  ::tensorflow::Input momentum,
  ::tensorflow::Input epsilon,
  ::tensorflow::Input grad,
  const ApplyCenteredRMSProp::Attrs & attrs
)

węzeł

::tensorflow::Node * node() const 

operator::tensorflow::Wejście

 operator::tensorflow::Input() const 

operator::tensorflow::Wyjście

 operator::tensorflow::Output() const 

Publiczne funkcje statyczne

Użyj Blokowania

Attrs UseLocking(
  bool x
)