LSTMBlockCell

clase final pública LSTMBlockCell

Calcula la propagación directa de la celda LSTM durante 1 paso de tiempo.

Esta implementación utiliza 1 matriz de peso y 1 vector de polarización, y hay una conexión de mirilla opcional.

Esta operación del núcleo implementa las siguientes ecuaciones matemáticas:

xh = [x, h_prev]
 [i, f, ci, o] = xh * w + b
 f = f + forget_bias
 
 if not use_peephole:
   wci = wcf = wco = 0
 
 i = sigmoid(cs_prev * wci + i)
 f = sigmoid(cs_prev * wcf + f)
 ci = tanh(ci)
 
 cs = ci .* i + cs_prev .* f
 cs = clip(cs, cell_clip)
 
 o = sigmoid(cs * wco + o)
 co = tanh(cs)
 h = co .* o
 

Clases anidadas

clase LSTMBlockCell.Opciones Atributos opcionales para LSTMBlockCell

Constantes

Cadena OP_NOMBRE El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Métodos públicos

LSTMBlockCell.Options estático
cellClip (Clip de celda flotante)
Salida <T>
ci ()
La entrada de la celda.
Salida <T>
co ()
La celda después del tanh.
estático <T extiende TNumber > LSTMBlockCell <T>
crear ( Alcance alcance, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T> wcf, Operando <T> wco, Operando <T > b, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación LSTMBlockCell.
Salida <T>
cs ()
El estado de la celda antes del tanh.
Salida <T>
f ()
La puerta del olvido.
LSTMBlockCell.Options estático
olvidarBias (Flotar olvidarBias)
Salida <T>
h ()
El vector h de salida.
Salida <T>
i ()
La puerta de entrada.
Salida <T>
o ()
La puerta de salida.
LSTMBlockCell.Options estático
usePeephole (uso booleanoPeephole)

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Valor constante: "LSTMBlockCell"

Métodos públicos

LSTMBlockCell.Options estático público cellClip (Clip de celda flotante)

Parámetros
clip de celda Valor al que recortar el valor 'cs'.

Salida pública <T> ci ()

La entrada de la celda.

Salida pública <T> co ()

La celda después del tanh.

public static LSTMBlockCell <T> create ( Alcance alcance, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T> wcf, Operando <T > wco, Operando <T> b, Opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación LSTMBlockCell.

Parámetros
alcance alcance actual
incógnita La entrada a la celda LSTM, forma (batch_size, num_inputs).
csAnterior Valor del estado de la celda en el paso de tiempo anterior.
hAnterior Salida de la celda anterior en el paso de tiempo anterior.
w La matriz de peso.
wci La matriz de peso para la conexión de mirilla de puerta de entrada.
wcf La matriz de peso para olvidar la conexión de mirilla de puerta.
OMA La matriz de peso para la conexión de mirilla de puerta de salida.
b El vector de sesgo.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de LSTMBlockCell

Salida pública <T> cs ()

El estado de la celda antes del tanh.

Salida pública <T> f ()

La puerta del olvido.

público estático LSTMBlockCell.Options olvidarBias (Flotador olvidarBias)

Parámetros
olvidarSesgo El sesgo de la puerta del olvido.

Salida pública <T> h ()

El vector h de salida.

Salida pública <T> i ()

La puerta de entrada.

Salida pública <T> o ()

La puerta de salida.

público estático LSTMBlockCell.Options usePeephole (uso booleanoPeephole)

Parámetros
utilizar mirilla Si se deben utilizar pesas para mirillas.