public class AMSGrad<Model: Differentiable & KeyPathIterable>: Optimizer
where
Model.TangentVector: VectorProtocol & PointwiseMultiplicative & ElementaryFunctions
& KeyPathIterable,
Model.TangentVector.VectorSpaceScalar == Float
Pengoptimal AMSGrad.
Algoritma ini merupakan modifikasi dari Adam dengan sifat konvergensi yang lebih baik bila mendekati local optima.
Referensi: “Tentang Konvergensi Adam dan Sesudahnya”
Pernyataan
public typealias Model = Model
Kecepatan pembelajaran.
Pernyataan
public var learningRate: Float
Koefisien yang digunakan untuk menghitung momen gradien pertama dan kedua.
Pernyataan
public var beta1: Float
Koefisien yang digunakan untuk menghitung momen gradien pertama dan kedua.
Pernyataan
public var beta2: Float
Skalar kecil ditambahkan ke penyebut untuk meningkatkan stabilitas numerik.
Pernyataan
public var epsilon: Float
Penurunan kecepatan pembelajaran.
Pernyataan
public var decay: Float
Langkah saat ini.
Pernyataan
public var step: Int
Momen pertama Libra.
Pernyataan
public var firstMoments: Model.TangentVector
Momen kedua dari bobot.
Pernyataan
public var secondMoments: Model.TangentVector
Momen maksimum kedua dari bobot.
Pernyataan
public var secondMomentsMax: Model.TangentVector
Pernyataan
public init( for model: __shared Model, learningRate: Float = 1e-3, beta1: Float = 0.9, beta2: Float = 0.999, epsilon: Float = 1e-8, decay: Float = 0 )
Pernyataan
public required init(copying other: AMSGrad, to device: Device)