Étape de backprop de CudnnRNNV3.
Calculez le backprop des données et des poids dans un RNN. Prend une entrée "sequence_lengths" supplémentaire par rapport à CudnnRNNBackprop.
rnn_mode : Indique le type du modèle RNN. input_mode : indique s'il existe une projection linéaire entre l'entrée et le calcul réel avant la première couche. 'skip_input' n'est autorisé que lorsque input_size == num_units ; 'auto_select' implique 'skip_input' lorsque input_size == num_units ; sinon, cela implique 'linear_input'. direction : Indique si un modèle bidirectionnel sera utilisé. Doit être « unidirectionnel » ou « bidirectionnel ». abandon : probabilité d'abandon. Lorsqu'il est défini sur 0, la suppression est désactivée. seed : La 1ère partie d'une graine pour initialiser l'abandon. seed2 : la 2ème partie d'une graine pour initialiser l'abandon. input : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [seq_length, batch_size, input_size]. Si time_major est faux, la forme est [batch_size, seq_length, input_size]. input_h : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [num_layer * dir, batch_size, num_units]. Si time_major est faux, la forme est [batch_size, num_layer * dir, num_units]. input_c : pour LSTM, un tenseur 3D avec la forme de [num_layer * dir, batch, num_units]. Pour les autres modèles, il est ignoré. params : un tenseur 1D qui contient les poids et les biais dans une présentation opaque. La taille doit être créée via CudnnRNNParamsSize et initialisée séparément. Notez qu’ils peuvent ne pas être compatibles entre différentes générations. C'est donc une bonne idée de sauvegarder et de restaurer séquence_lengths : un vecteur de longueurs de chaque séquence d'entrée. sortie : si time_major est vrai, il s'agit d'un tenseur 3D ayant la forme de [seq_length, batch_size, dir * num_units]. Si time_major est faux, la forme est [batch_size, seq_length, dir * num_units]. output_h : la même forme a input_h. output_c : la même forme que input_c pour LSTM. Un tenseur vide pour d'autres modèles. output_backprop : un tenseur 3D avec la même forme que la sortie lors de la passe avant. output_h_backprop : un tenseur 3D avec la même forme que output_h dans la passe avant. output_c_backprop : un tenseur 3D avec la même forme que output_c dans la passe avant. time_major : indique si le format d'entrée/sortie est majeur en temps ou majeur en lot. reserve_space : le même reserve_space produit lors de l'opération forward. input_backprop : Le backprop à saisir dans la passe avant. A la même forme que l'entrée. input_h_backprop : Le backprop à input_h dans la passe avant. A la même forme que input_h. input_c_backprop : Le backprop à input_c dans la passe avant. A la même forme que input_c. params_backprop : le backprop du tampon de paramètres lors de la passe avant. A la même forme que les paramètres.
Classes imbriquées
classe | CudnnRNNBackprop.Options | Attributs facultatifs pour CudnnRNNBackprop |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
statique <T étend TNumber > CudnnRNNBackprop <T> | créer ( Portée de la portée , Entrée de l'opérande <T>, Entrée de l'opérande <T> H, Entrée de l'opérande <T> C, Paramètres de l'opérande <T>, Opérande < TInt32 > séquenceLengths, Sortie de l'opérande <T>, Sortie de l' opérande <T> H, Opérande <T > sortieC, Opérande <T> sortieBackprop, Opérande <T> sortieHBackprop, Opérande <T> sortieCBackprop, Opérande <T> reserveSpace, Opérande <?> hostReserved, Options... options) Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNBackprop. |
statique CudnnRNNBackprop.Options | direction (direction de la chaîne) |
statique CudnnRNNBackprop.Options | abandon (abandon flottant) |
Sortie <T> | |
Sortie <T> | |
Sortie <T> | |
statique CudnnRNNBackprop.Options | inputMode (chaîne inputMode) |
statique CudnnRNNBackprop.Options | numProj (numProj long) |
Sortie <T> | |
statique CudnnRNNBackprop.Options | rnnMode (Chaîne rnnMode) |
statique CudnnRNNBackprop.Options | graine (graine longue) |
statique CudnnRNNBackprop.Options | graine2 (graine longue2) |
statique CudnnRNNBackprop.Options | timeMajor (Booléen timeMajor) |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
public static CudnnRNNBackprop <T> créer ( Portée de portée , Opérande <T> entrée, Opérande <T> inputH, Opérande <T> inputC, Opérande <T> paramètres, Opérande < TInt32 > séquenceLengths, Opérande <T> sortie, Opérande <T > sortieH, Opérande <T> sortieC, Opérande <T> sortieBackprop, Opérande <T> sortieHBackprop, Opérande <T> sortieCBackprop, Opérande <T> reserveSpace, Opérande <?> hostReserved, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNBackprop.
Paramètres
portée | portée actuelle |
---|---|
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de CudnnRNNBackprop