Étape de backprop de CudnnRNNV3.
Calculez le backprop des données et des poids dans un RNN. Prend une entrée "sequence_lengths" supplémentaire par rapport à CudnnRNNBackprop.
rnn_mode : Indique le type du modèle RNN. input_mode : indique s'il existe une projection linéaire entre l'entrée et le calcul réel avant la première couche. 'skip_input' n'est autorisé que lorsque input_size == num_units ; 'auto_select' implique 'skip_input' lorsque input_size == num_units ; sinon, cela implique 'linear_input'. direction : Indique si un modèle bidirectionnel sera utilisé. Doit être « unidirectionnel » ou « bidirectionnel ». abandon : probabilité d'abandon. Lorsqu'il est défini sur 0, la suppression est désactivée. seed : La 1ère partie d'une graine pour initialiser l'abandon. seed2 : la 2ème partie d'une graine pour initialiser l'abandon. input : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [seq_length, batch_size, input_size]. Si time_major est faux, la forme est [batch_size, seq_length, input_size]. input_h : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [num_layer * dir, batch_size, num_units]. Si time_major est faux, la forme est [batch_size, num_layer * dir, num_units]. input_c : pour LSTM, un tenseur 3D avec la forme de [num_layer * dir, batch, num_units]. Pour les autres modèles, il est ignoré. params : un tenseur 1D qui contient les poids et les biais dans une présentation opaque. La taille doit être créée via CudnnRNNParamsSize et initialisée séparément. Notez qu’ils peuvent ne pas être compatibles entre différentes générations. C'est donc une bonne idée de sauvegarder et de restaurer séquence_lengths : un vecteur de longueurs de chaque séquence d'entrée. sortie : si time_major est vrai, il s'agit d'un tenseur 3D ayant la forme de [seq_length, batch_size, dir * num_units]. Si time_major est faux, la forme est [batch_size, seq_length, dir * num_units]. output_h : la même forme a input_h. output_c : la même forme que input_c pour LSTM. Un tenseur vide pour d'autres modèles. output_backprop : un tenseur 3D avec la même forme que la sortie lors de la passe avant. output_h_backprop : un tenseur 3D avec la même forme que output_h dans la passe avant. output_c_backprop : un tenseur 3D avec la même forme que output_c dans la passe avant. time_major : indique si le format d'entrée/sortie est majeur en temps ou majeur en lot. reserve_space : le même reserve_space produit lors de l'opération forward. input_backprop : Le backprop à saisir dans la passe avant. A la même forme que l'entrée. input_h_backprop : Le backprop à input_h dans la passe avant. A la même forme que input_h. input_c_backprop : Le backprop à input_c dans la passe avant. A la même forme que input_c. params_backprop : le backprop du tampon de paramètres lors de la passe avant. A la même forme que les paramètres.
Classes imbriquées
classe | CudnnRNNBackpropV3.Options | Attributs facultatifs pour CudnnRNNBackpropV3 |
Méthodes publiques
statique <T étend le nombre> CudnnRNNBackpropV3 <T> | créer ( Portée de la portée , Entrée de l' opérande <T>, Entrée de l'opérande <T> H, Entrée de l' opérande <T> C, Paramètres de l'opérande <T>, Longueurs de séquence de l'opérande <Integer>, Sortie de l'opérande <T>, Sortie de l'opérande <T> H, Opérande <T > sortieC, Opérande <T> sortieBackprop, Opérande <T> sortieHBackprop, Opérande <T> sortieCBackprop, Opérande <T> reserveSpace, Opérande <?> hostReserved, Options... options) Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNBackpropV3. |
statique CudnnRNNBackpropV3.Options | direction (direction de la chaîne) |
statique CudnnRNNBackpropV3.Options | abandon (abandon flottant) |
Sortie <T> | |
Sortie <T> | |
Sortie <T> | |
statique CudnnRNNBackpropV3.Options | inputMode (chaîne inputMode) |
statique CudnnRNNBackpropV3.Options | numProj (numProj long) |
Sortie <T> | |
statique CudnnRNNBackpropV3.Options | rnnMode (Chaîne rnnMode) |
statique CudnnRNNBackpropV3.Options | graine (graine longue) |
statique CudnnRNNBackpropV3.Options | graine2 (graine longue2) |
statique CudnnRNNBackpropV3.Options | timeMajor (Booléen timeMajor) |
Méthodes héritées
Méthodes publiques
public static CudnnRNNBackpropV3 <T> créer ( Portée de la portée , Entrée de l'opérande <T>, Entrée de l' opérande <T> H, Entrée de l'opérande <T> C, Paramètres de l'opérande <T>, Longueurs de séquence de l'opérande <Integer>, Sortie de l'opérande <T>, Opérande <T > sortieH, Opérande <T> sortieC, Opérande <T> sortieBackprop, Opérande <T> sortieHBackprop, Opérande <T> sortieCBackprop, Opérande <T> reserveSpace, Opérande <?> hostReserved, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNBackpropV3.
Paramètres
portée | portée actuelle |
---|---|
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de CudnnRNNBackpropV3