Converte os parâmetros CudnnRNN da forma canônica para a forma utilizável. Suporta a projeção em LSTM.
Grava um conjunto de pesos no buffer de parâmetros opacos para que possam ser usados em futuros treinamentos ou inferências.
Observe que o buffer de parâmetros pode não ser compatível com diferentes GPUs. Portanto, qualquer salvamento e restauração devem ser convertidos de e para os pesos e vieses canônicos.
num_layers: especifica o número de camadas no modelo RNN. num_units: especifica o tamanho do estado oculto. input_size: especifica o tamanho do estado de entrada. pesos: a forma canônica de pesos que pode ser usada para salvar e restaurar. Eles têm maior probabilidade de serem compatíveis entre gerações diferentes. vieses: a forma canônica de vieses que pode ser usada para salvar e restaurar. Eles têm maior probabilidade de serem compatíveis entre gerações diferentes. num_params_weights: número da matriz de parâmetro de peso para todas as camadas. num_params_biases: número do vetor de parâmetro de polarização para todas as camadas. rnn_mode: indica o tipo do modelo RNN. input_mode: indica se há uma projeção linear entre a entrada e o cálculo real antes da primeira camada. 'skip_input' só é permitido quando input_size == num_units; 'auto_select' implica 'skip_input' quando input_size == num_units; caso contrário, implica em 'entrada_linear'. direção: indica se um modelo bidirecional será usado. dir = (direção == bidirecional)? 2: 1 abandono: probabilidade de abandono. Quando definido como 0., o dropout é desabilitado. semente: a 1ª parte de uma semente para inicializar o dropout. seed2: a 2ª parte de um seed para inicializar o dropout. num_proj: a dimensionalidade de saída para as matrizes de projeção. Se Nenhum ou 0, nenhuma projeção é executada.
Classes aninhadas
classe | CudnnRNNCanonicalToParams.Options | Atributos opcionais para CudnnRNNCanonicalToParams |
Constantes
Fragmento | OP_NAME | O nome desta operação, conforme conhecido pelo motor principal TensorFlow |
Métodos Públicos
Output <T> | asOutput () Retorna o identificador simbólico do tensor. |
estática <T estende TNumber > CudnnRNNCanonicalToParams <T> | criar ( Scope escopo, Operando < TInt32 > numLayers, Operando < TInt32 > numUnits, Operando < TInt32 > inputSize, Iterable < Operando <T >> pesos, Iterable < Operando <T >> preconceitos, Options ... Opções) Método de fábrica para criar uma classe que envolve uma nova operação CudnnRNNCanonicalToParams. |
estáticos CudnnRNNCanonicalToParams.Options | direcção (direcção da corda) |
estáticos CudnnRNNCanonicalToParams.Options | abandono (abandono do flutuador) |
estáticos CudnnRNNCanonicalToParams.Options | inputMode (String inputMode) |
estáticos CudnnRNNCanonicalToParams.Options | numProj (Long numProj) |
Output <T> | params () |
estáticos CudnnRNNCanonicalToParams.Options | rnnMode (String rnnMode) |
estáticos CudnnRNNCanonicalToParams.Options | sementes (semente Long) |
estáticos CudnnRNNCanonicalToParams.Options | seed2 (seed2 Long) |
Métodos herdados
Constantes
nome_op final String public static
O nome desta operação, conforme conhecido pelo motor principal TensorFlow
Métodos Públicos
pública Output <T> asOutput ()
Retorna o identificador simbólico do tensor.
As entradas para as operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.
public static CudnnRNNCanonicalToParams <T> create ( Scope escopo, Operando < TInt32 > numLayers, Operando < TInt32 > numUnits, Operando < TInt32 > inputSize, Iterable < Operando <T >> pesos, Iterable < Operando <T >> preconceitos, Opções .. . opções)
Método de fábrica para criar uma classe que envolve uma nova operação CudnnRNNCanonicalToParams.
Parâmetros
alcance | escopo atual |
---|---|
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de CudnnRNNCanonicalToParams