Calcule la perte CTC (probabilité logarithmique) pour chaque entrée de lot. Calcule également
le dégradé. Cette classe effectue l'opération softmax pour vous, donc les entrées doivent être par exemple des projections linéaires des sorties par un LSTM.
Classes imbriquées
classe | CtcLoss.Options | Attributs facultatifs pour CtcLoss |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
statique <T étend TNumber > CtcLoss <T> | |
statique CtcLoss.Options | ctcMergeRepeated (booléen ctcMergeRepeated) |
Sortie <T> | pente () Le gradient de « perte ». |
statique CtcLoss.Options | ignoreLongerOutputsThanInputs (booléen ignoreLongerOutputsThanInputs) |
Sortie <T> | perte () Un vecteur (lot) contenant des log-probabilités. |
statique CtcLoss.Options | preprocessCollapseRepeated (préprocessus booléenCollapseRepeated) |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
public static CtcLoss <T> créer (portée de portée , entrées d'opérande <T>, opérande < TInt64 > labelsIndices, opérande < TInt32 > labelsValues, opérande < TInt32 > séquenceLength, options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CtcLoss.
Paramètres
portée | portée actuelle |
---|---|
contributions | 3-D, forme : `(max_time x batch_size x num_classes)`, les logits. |
étiquettesIndices | Les indices d'un `SparseTensor |
étiquettesValeurs | Les valeurs (étiquettes) associées au lot et à l'heure donnés. |
séquenceLongueur | Un vecteur contenant des longueurs de séquence (lot). |
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de CtcLoss
public statique CtcLoss.Options ctcMergeRepeated (booléen ctcMergeRepeated)
Paramètres
ctcMergeRepeated | Scalaire. Si la valeur est false, pendant le calcul CTC, les étiquettes non vides répétées ne seront pas fusionnées et seront interprétées comme des étiquettes individuelles. Il s'agit d'une version simplifiée de CTC. |
---|
public Sortie <T> gradient ()
Le gradient de « perte ». 3D, forme : `(max_time x batch_size x num_classes)`.
public statique CtcLoss.Options ignoreLongerOutputsThanInputs (booléen ignoreLongerOutputsThanInputs)
Paramètres
ignoreLongerOutputsThanInputs | Scalaire. S'il est défini sur true, lors du calcul CTC, les éléments qui ont des séquences de sortie plus longues que les séquences d'entrée sont ignorés : ils ne contribuent pas au terme de perte et ont un gradient nul. |
---|
public statique CtcLoss.Options preprocessCollapseRepeated (booléen preprocessCollapseRepeated)
Paramètres
preprocessCollapseRepeated | Scalaire, si vrai, les étiquettes répétées sont réduites avant le calcul du CTC. |
---|