BatchNorm

@frozen
public struct BatchNorm<Scalar> : Layer where Scalar : TensorFlowFloatingPoint

שכבת נורמליזציה אצווה.

מנרמל את ההפעלה של השכבה הקודמת בכל אצווה, כלומר מחיל טרנספורמציה השומרת על ההפעלה הממוצעת קרובה ל 0 ועל סטיית התקן של ההפעלה קרובה ל 1 .

התייחסות: נורמליזציה של אצווה: האצת אימון רשת עמוק על ידי הפחתת הסטת משתנים פנימית .

  • ממד התכונה.

    הַצהָרָה

    @noDerivative
    public let axis: Int
  • המומנטום עבור ממוצע הריצה ושונות הריצה.

    הַצהָרָה

    @noDerivative
    public let momentum: Scalar
  • ערך ההיסט, המכונה גם בטא.

    הַצהָרָה

    public var offset: Tensor<Scalar>
  • ערך קנה המידה, המכונה גם גמא.

    הַצהָרָה

    public var scale: Tensor<Scalar>
  • ערך אפסילון השונות.

    הַצהָרָה

    @noDerivative
    public let epsilon: Scalar
  • מתכוון הריצה.

    הַצהָרָה

    @noDerivative
    public var runningMean: Parameter<Scalar>
  • שונות הריצה.

    הַצהָרָה

    @noDerivative
    public var runningVariance: Parameter<Scalar>
  • יוצר שכבת נורמליזציה אצווה.

    הַצהָרָה

    public init(
      axis: Int,
      momentum: Scalar,
      offset: Tensor<Scalar>,
      scale: Tensor<Scalar>,
      epsilon: Scalar,
      runningMean: Tensor<Scalar>,
      runningVariance: Tensor<Scalar>
    )

    פרמטרים

    axis

    הציר שאסור לנרמל (בדרך כלל ציר התכונה).

    momentum

    המומנטום של הממוצע הנע.

    offset

    ההיסט שיש להוסיף לטנזור המנורמל.

    scale

    הסולם להכפלת הטנזור המנורמל.

    epsilon

    סקלאר קטן נוסף למכנה כדי לשפר את היציבות המספרית.

    runningMean

    מתכוון הריצה.

    runningVariance

    שונות הריצה.

  • מחזירה את הפלט המתקבל מהחלת השכבה על הקלט הנתון.

    הַצהָרָה

    @differentiable
    public func forward(_ input: Tensor<Scalar>) -> Tensor<Scalar>

    פרמטרים

    input

    הקלט לשכבה.

    ערך החזרה

    הפלט.

  • יוצר שכבת נורמליזציה אצווה.

    הַצהָרָה

    public init(
      featureCount: Int,
      axis: Int = -1,
      momentum: Scalar = 0.99,
      epsilon: Scalar = 0.001
    )

    פרמטרים

    featureCount

    מספר התכונות.

    axis

    הציר שצריך לנרמל (בדרך כלל ציר התכונות).

    momentum

    המומנטום של הממוצע הנע.

    epsilon

    סקלאר קטן נוסף למכנה כדי לשפר את היציבות המספרית.