public class AMSGrad<Model: Differentiable & KeyPathIterable>: Optimizer
where
Model.TangentVector: VectorProtocol & PointwiseMultiplicative & ElementaryFunctions
& KeyPathIterable,
Model.TangentVector.VectorSpaceScalar == Float
Optymalizator AMSGrad.
Algorytm ten jest modyfikacją Adama o lepszych właściwościach zbieżności, gdy jest blisko lokalnych optimów.
Odniesienie: „O zbieżności Adama i później”
Deklaracja
public typealias Model = Model
Szybkość uczenia się.
Deklaracja
public var learningRate: Float
Współczynnik używany do obliczania pierwszego i drugiego momentu gradientów.
Deklaracja
public var beta1: Float
Współczynnik używany do obliczania pierwszego i drugiego momentu gradientów.
Deklaracja
public var beta2: Float
Mały skalar dodany do mianownika w celu poprawy stabilności liczbowej.
Deklaracja
public var epsilon: Float
Spadek szybkości uczenia się.
Deklaracja
public var decay: Float
Bieżący krok.
Deklaracja
public var step: Int
Pierwsze chwile z ciężarami.
Deklaracja
public var firstMoments: Model.TangentVector
Drugi moment ciężarów.
Deklaracja
public var secondMoments: Model.TangentVector
Maksimum drugich momentów odważników.
Deklaracja
public var secondMomentsMax: Model.TangentVector
Deklaracja
public init( for model: __shared Model, learningRate: Float = 1e-3, beta1: Float = 0.9, beta2: Float = 0.999, epsilon: Float = 1e-8, decay: Float = 0 )
Deklaracja
public required init(copying other: AMSGrad, to device: Device)