Etapa de backprop de CudnnRNNV3.
Calcule o backprop de dados e pesos em um RNN. Recebe uma entrada "sequence_lengths" extra do que CudnnRNNBackprop.
rnn_mode: Indica o tipo do modelo RNN. input_mode: Indica se existe uma projeção linear entre a entrada e o cálculo real antes da primeira camada. 'skip_input' só é permitido quando input_size == num_units; 'auto_select' implica 'skip_input' quando input_size == num_units; caso contrário, implica 'linear_input'. direção: Indica se um modelo bidirecional será usado. Deve ser "unidirecional" ou "bidirecional". abandono: probabilidade de abandono. Quando definido como 0, o dropout é desabilitado. seed: A primeira parte de uma semente para inicializar o dropout. seed2: A segunda parte de uma semente para inicializar o dropout. entrada: se time_major for verdadeiro, este é um tensor 3-D com a forma de [seq_length, batch_size, input_size]. Se time_major for falso, a forma será [batch_size, seq_length, input_size]. input_h: Se time_major for verdadeiro, este é um tensor 3-D com a forma de [num_layer * dir, batch_size, num_units]. Se time_major for falso, a forma será [batch_size, num_layer * dir, num_units]. input_c: Para LSTM, um tensor 3-D com a forma de [num_layer * dir, batch, num_units]. Para outros modelos, é ignorado. params: um tensor 1-D que contém os pesos e tendências em um layout opaco. O tamanho deve ser criado através de CudnnRNNParamsSize e inicializado separadamente. Observe que eles podem não ser compatíveis entre gerações diferentes. Portanto, é uma boa ideia salvar e restaurarsequence_lengths: um vetor de comprimentos de cada sequência de entrada. saída: Se time_major for verdadeiro, este é um tensor 3-D com a forma de [seq_length, batch_size, dir * num_units]. Se time_major for falso, a forma será [batch_size, seq_length, dir * num_units]. output_h: A mesma forma possui input_h. output_c: O mesmo formato de input_c para LSTM. Um tensor vazio para outros modelos. output_backprop: Um tensor 3-D com o mesmo formato da saída na passagem direta. output_h_backprop: Um tensor 3-D com o mesmo formato que output_h na passagem direta. output_c_backprop: Um tensor 3-D com o mesmo formato que output_c na passagem direta. time_major: indica se o formato de entrada/saída é maior em tempo ou maior em lote. reserve_space: O mesmo reserve_space produzido na operação de encaminhamento. input_backprop: O backprop para entrada na passagem direta. Tem o mesmo formato da entrada. input_h_backprop: O backprop para input_h na passagem direta. Tem o mesmo formato que input_h. input_c_backprop: O backprop para input_c na passagem direta. Tem o mesmo formato que input_c. params_backprop: O backprop para o buffer de parâmetros na passagem direta. Tem o mesmo formato dos parâmetros.
Classes aninhadas
aula | CudnnRNNBackprop.Options | Atributos opcionais para CudnnRNNBackprop |
Constantes
Corda | OP_NAME | O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow |
Métodos Públicos
estático <T estende TNumber > CudnnRNNBackprop <T> | create ( Escopo do escopo , entrada do operando <T>, entrada do operando <T> H, entrada do operando <T> C, parâmetros do operando <T>, comprimentos da sequência do <TInt32> , saída do operando <T>, saída do operando <T>H, comprimento da sequência <T> do operando > saídaC, Operando <T> outputBackprop, Operando <T> saídaHBackprop, Operando <T> saídaCBackprop, Operando <T> reserveSpace, Operando <?> hostReserved, Opções... opções) Método de fábrica para criar uma classe que envolve uma nova operação CudnnRNNBackprop. |
CudnnRNNBackprop.Options estático | direção (direção da string) |
CudnnRNNBackprop.Options estático | abandono (desistência flutuante) |
Saída <T> | |
Saída <T> | |
Saída <T> | |
CudnnRNNBackprop.Options estático | inputMode (String inputMode) |
CudnnRNNBackprop.Options estático | numProj (numProj longo) |
Saída <T> | |
CudnnRNNBackprop.Options estático | rnnMode (String rnnMode) |
CudnnRNNBackprop.Options estático | semente (semente longa) |
CudnnRNNBackprop.Options estático | seed2 (semente2 longa) |
CudnnRNNBackprop.Options estático | timeMajor (timeMajor booleano) |
Métodos herdados
Constantes
String final estática pública OP_NAME
O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow
Métodos Públicos
public static CudnnRNNBackprop <T> create ( Escopo do escopo , Operando <T> entrada, Operando <T> entradaH, Operando <T> entradaC, Operando <T> params, Operando < TInt32 > seqüênciaLengths, Operando <T> saída, Operando <T > saídaH, Operando <T> saídaC, Operando <T> saídaBackprop, Operando <T> saídaHBackprop, Operando <T> saídaCBackprop, Operando <T> reserveSpace, Operando <?> hostReserved, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação CudnnRNNBackprop.
Parâmetros
escopo | escopo atual |
---|---|
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de CudnnRNNBackprop