Um RNN apoiado por cuDNN.
Calcula o RNN a partir dos estados de entrada e inicial, em relação ao buffer de parâmetros. Aceita uma entrada extra "sequence_lengths" do que CudnnRNN.
rnn_mode: Indica o tipo do modelo RNN. input_mode: Indica se existe uma projeção linear entre a entrada e o cálculo real antes da primeira camada. 'skip_input' só é permitido quando input_size == num_units; 'auto_select' implica 'skip_input' quando input_size == num_units; caso contrário, implica 'linear_input'. direção: Indica se um modelo bidirecional será usado. Deve ser "unidirecional" ou "bidirecional". abandono: probabilidade de abandono. Quando definido como 0, o dropout é desabilitado. seed: A primeira parte de uma semente para inicializar o dropout. seed2: A segunda parte de uma semente para inicializar o dropout. entrada: se time_major for verdadeiro, este é um tensor 3-D com a forma de [seq_length, batch_size, input_size]. Se time_major for falso, a forma será [batch_size, seq_length, input_size]. input_h: Se time_major for verdadeiro, este é um tensor 3-D com a forma de [num_layer * dir, batch_size, num_units]. Se time_major for falso, a forma será [batch_size, num_layer * dir, num_units]. input_c: Para LSTM, um tensor 3-D com a forma de [num_layer * dir, batch, num_units]. Para outros modelos, é ignorado. params: um tensor 1-D que contém os pesos e tendências em um layout opaco. O tamanho deve ser criado através de CudnnRNNParamsSize e inicializado separadamente. Observe que eles podem não ser compatíveis entre gerações diferentes. Portanto, é uma boa ideia salvar e restaurarsequence_lengths: um vetor de comprimentos de cada sequência de entrada. saída: Se time_major for verdadeiro, este é um tensor 3-D com a forma de [seq_length, batch_size, dir * num_units]. Se time_major for falso, a forma será [batch_size, seq_length, dir * num_units]. output_h: A mesma forma possui input_h. output_c: O mesmo formato de input_c para LSTM. Um tensor vazio para outros modelos. is_training: Indica se esta operação é usada para inferência ou treinamento. time_major: indica se o formato de entrada/saída é maior em tempo ou maior em lote. reserve_space: um tensor opaco que pode ser usado no cálculo backprop. Só é produzido se is_training for verdadeiro.
Classes aninhadas
aula | CudnnRNN.Opções | Atributos opcionais para CudnnRNN |
Constantes
Corda | OP_NAME | O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow |
Métodos Públicos
estático <T estende TNumber > CudnnRNN <T> | create ( Escopo do escopo , entrada do operando <T>, entrada do operando <T> H, entrada do operando <T> C, parâmetros do operando <T> , comprimentos da sequência do operando <T>, opções... opções) Método de fábrica para criar uma classe que envolve uma nova operação CudnnRNN. |
CudnnRNN.Options estático | direção (direção da string) |
CudnnRNN.Options estático | abandono (desistência flutuante) |
Saída <?> | |
CudnnRNN.Options estático | inputMode (String inputMode) |
CudnnRNN.Options estático | isTraining (booleano isTraining) |
CudnnRNN.Options estático | numProj (numProj longo) |
Saída <T> | saída () |
Saída <T> | saídaC () |
Saída <T> | saídaH () |
Saída <T> | |
CudnnRNN.Options estático | rnnMode (String rnnMode) |
CudnnRNN.Options estático | semente (semente longa) |
CudnnRNN.Options estático | seed2 (semente2 longa) |
CudnnRNN.Options estático | timeMajor (timeMajor booleano) |
Métodos herdados
Constantes
String final estática pública OP_NAME
O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow
Métodos Públicos
public static CudnnRNN <T> create ( Escopo , Operando <T> entrada, Operando <T> entradaH, Operando <T> entradaC, Operando <T> params, Operando < TInt32 > seqüênciaLengths, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação CudnnRNN.
Parâmetros
escopo | escopo atual |
---|---|
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de CudnnRNN