CtcBeamSearchDecoder

classe finale publique CtcBeamSearchDecoder

Effectue le décodage de la recherche de faisceau sur les logits donnés en entrée.

Une note sur l'attribut merge_repeated : Pour le décodeur de recherche de faisceau, cela signifie que si les entrées consécutives dans un faisceau sont les mêmes, seule la première d'entre elles est émise. Autrement dit, lorsque le chemin supérieur est "ABBBB", "AB" est renvoyé si merge_repeated = True mais "ABBBB" est renvoyé si merge_repeated = False.

Classes imbriquées

classe CtcBeamSearchDecoder.Options Attributs facultatifs pour CtcBeamSearchDecoder

Constantes

Chaîne OP_NAME Le nom de cette opération, tel que connu par le moteur principal TensorFlow

Méthodes publiques

statique <T étend TNumber > CtcBeamSearchDecoder <T>
créer ( Portée de portée , Entrées Opérande <T>, Opérande < TInt32 > séquenceLongueur, Long BeamWidth, Long topPaths, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CtcBeamSearchDecoder.
Liste< Sortie < TInt64 >>
Indices décodés ()
Une liste (longueur : top_paths) de matrices d'indices.
Liste< Sortie < TInt64 >>
forme décodée ()
Une liste (longueur : top_paths) de vecteurs de forme.
Liste< Sortie < TInt64 >>
valeurs décodées ()
Une liste (longueur : top_paths) de vecteurs de valeurs.
Sortie <T>
logProbabilité ()
Une matrice, en forme : `(batch_size x top_paths)`.
statique CtcBeamSearchDecoder.Options
mergeRepeated (fusion booléenne répétée)

Méthodes héritées

Constantes

chaîne finale statique publique OP_NAME

Le nom de cette opération, tel que connu par le moteur principal TensorFlow

Valeur constante : "CTCBeamSearchDecoder"

Méthodes publiques

public static CtcBeamSearchDecoder <T> créer (portée de portée , entrées d'opérande <T>, opérande < TInt32 > séquenceLength, Long BeamWidth, Long topPaths, Options... options)

Méthode d'usine pour créer une classe encapsulant une nouvelle opération CtcBeamSearchDecoder.

Paramètres
portée portée actuelle
contributions 3-D, forme : `(max_time x batch_size x num_classes)`, les logits.
séquenceLongueur Un vecteur contenant des longueurs de séquence, taille `(batch)`.
largeur du faisceau Un scalaire >= 0 (largeur du faisceau de recherche du faisceau).
topPaths Un scalaire >= 0, <= Beam_width (contrôle la taille de sortie).
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance de CtcBeamSearchDecoder

liste publique < Sortie < TInt64 >> decodedIndices ()

Une liste (longueur : top_paths) de matrices d'indices. La matrice j, taille `(total_decoded_outputs[j] x 2)`, a des indices d'un `SparseTensor `. Les lignes stockent : [lot, heure].

liste publique < Sortie < TInt64 >> decodedShape ()

Une liste (longueur : top_paths) de vecteurs de forme. Le vecteur j, taille `(2)`, stocke la forme du `SparseTensor[j]` décodé. Ses valeurs sont : `[batch_size, max_decoded_length[j]]`.

liste publique < Sortie < TInt64 >> decodedValues ​​()

Une liste (longueur : top_paths) de vecteurs de valeurs. Le vecteur j, taille `(length total_decoded_outputs[j])`, a les valeurs d'un `SparseTensor `. Le vecteur stocke les classes décodées pour le faisceau j.

sortie publique <T> logProbability ()

Une matrice, en forme : `(batch_size x top_paths)`. Les log-probabilités de séquence.

public statique CtcBeamSearchDecoder.Options mergeRepeated (booléen mergeRepeated)

Paramètres
fusionRépété Si c'est vrai, fusionnez les classes répétées dans la sortie.