Realiza la decodificación de búsqueda de haz en los logits dados en la entrada.
Una nota sobre el atributo merge_repeated: para el decodificador de búsqueda de haz, esto significa que si las entradas consecutivas en un haz son iguales, solo se emite la primera de ellas. Es decir, cuando la ruta superior es "ABBBB", se devuelve "AB" si merge_repeated = True, pero se devuelve "ABBBB" si merge_repeated = False.
Clases anidadas
clase | CtcBeamSearchDecoder.Options | Los atributos opcionales para CtcBeamSearchDecoder |
Constantes
Cuerda | OP_NAME | El nombre de esta operación, como lo conoce el motor central de TensorFlow |
Métodos públicos
estática <T se extiende TNumber > CtcBeamSearchDecoder <T> | |
Lista < salida < TInt64 >> | decodedIndices () Una lista (longitud: top_paths) de matrices de índices. |
Lista < salida < TInt64 >> | decodedShape () Una lista (longitud: top_paths) del vector de forma. |
Lista < salida < TInt64 >> | decodedValues () Una lista (longitud: top_paths) de vectores de valores. |
Salida <T> | logProbability () Una matriz, con forma: `(batch_size x top_paths)`. |
estáticas CtcBeamSearchDecoder.Options | mergeRepeated (Boolean mergeRepeated) |
Métodos heredados
Constantes
OP_NAME pública final static String
El nombre de esta operación, como lo conoce el motor central de TensorFlow
Métodos públicos
public static CtcBeamSearchDecoder <T> crear ( Alcance alcance, operando <T> entradas, operando < TInt32 > sequenceLength, Long beamWidth, largas topPaths, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación CtcBeamSearchDecoder.
Parámetros
alcance | alcance actual |
---|---|
entradas | 3-D, forma: `(max_time x batch_size x num_classes)`, los logits. |
secuenciaLongitud | Un vector que contiene longitudes de secuencia, tamaño `(lote)`. |
amplitud de rayo | Un escalar> = 0 (ancho del haz de búsqueda del haz). |
topPaths | Un escalar> = 0, <= beam_width (controla el tamaño de salida). |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de CtcBeamSearchDecoder
Lista pública < salida < TInt64 >> decodedIndices ()
Una lista (longitud: top_paths) de matrices de índices. La matriz j, tamaño `(total_decoded_outputs [j] x 2)`, tiene índices de un `SparseTensor
Lista pública < salida < TInt64 >> decodedShape ()
Una lista (longitud: top_paths) del vector de forma. El vector j, tamaño `(2)`, almacena la forma del `SparseTensor [j]` decodificado. Sus valores son: `[batch_size, max_decoded_length [j]]`.
Lista pública < salida < TInt64 >> decodedValues ()
Una lista (longitud: top_paths) de vectores de valores. El vector j, tamaño `(longitud total_decoded_outputs [j])`, tiene los valores de un `SparseTensor
pública de salida <T> logProbability ()
Una matriz, con forma: `(batch_size x top_paths)`. La secuencia logarítmica de probabilidades.
public static CtcBeamSearchDecoder.Options mergeRepeated (booleano mergeRepeated)
Parámetros
mergeRepeated | Si es verdadero, combine las clases repetidas en la salida. |
---|