UnicodeEncode

classe final pública UnicodeEncode

Codifique um tensor de inteiros em strings Unicode.

Retorna um vetor de strings, onde `output[i]` é construído codificando os pontos de código Unicode em `input_values[input_splits[i]:input_splits[i+1]]` usando `output_encoding`.

---

Exemplo:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Classes aninhadas

aula UnicodeEncode.Opções Atributos opcionais para UnicodeEncode

Constantes

Corda OP_NAME O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow

Métodos Públicos

Saída <TString>
asOutput ()
Retorna o identificador simbólico do tensor.
UnicodeEncode estático
create ( Escopo do escopo, Operando < TInt32 > inputValues, Operando <? estende TNumber > inputSplits, String outputEncoding, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.
UnicodeEncode.Options estático
erros (erros de string)
Saída <TString>
saída ()
O tensor 1-D de strings codificadas a partir dos pontos de código unicode fornecidos.
UnicodeEncode.Options estático
replacementChar (substituição longaChar)

Métodos herdados

Constantes

String final estática pública OP_NAME

O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow

Valor constante: "UnicodeEncode"

Métodos Públicos

Saída pública < TString > asOutput ()

Retorna o identificador simbólico do tensor.

As entradas para operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.

public static UnicodeEncode create ( Escopo do escopo, Operando < TInt32 > inputValues, Operando <? estende TNumber > inputSplits, String outputEncoding, Opções... opções)

Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.

Parâmetros
escopo escopo atual
valores de entrada Um tensor 1D contendo os pontos de código Unicode que devem ser codificados.
inputSplits Um tensor 1D que especifica como os pontos de código Unicode devem ser divididos em strings. Em particular, `output[i]` é construído codificando os pontos de código na fatia `input_values[input_splits[i]:input_splits[i+1]]`.
codificação de saída Codificação Unicode das strings de saída. As codificações válidas são: `"UTF-8", "UTF-16-BE" e "UTF-32-BE"`.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de UnicodeEncode

Erros públicos estáticos de UnicodeEncode.Options (erros de string)

Parâmetros
erros Política de tratamento de erros quando há formatação inválida encontrada na entrada. O valor de 'strict' fará com que a operação produza um erro InvalidArgument em qualquer formatação de entrada inválida. Um valor 'replace' (o padrão) fará com que a operação substitua qualquer formatação inválida na entrada pelo codepoint `replacement_char`. Um valor 'ignorar' fará com que a operação ignore qualquer formatação inválida na entrada e não produza nenhum caractere de saída correspondente.

saída pública < TString > saída ()

O tensor 1-D de strings codificadas a partir dos pontos de código unicode fornecidos.

public static UnicodeEncode.Options replacementChar (Long replacementChar)

Parâmetros
substituiçãoChar O ponto de código do caractere de substituição a ser usado no lugar de qualquer formatação inválida na entrada quando `errors='replace'`. Qualquer ponto de código Unicode válido pode ser usado. O valor padrão é que o caractere de substituição Unicode padrão é 0xFFFD (U+65533).