aliran tensor:: operasi:: UnicodeTranskode:: Attr
#include <string_ops.h>
Penyetel atribut opsional untuk UnicodeTranscode .
Ringkasan
Atribut publik | |
---|---|
errors_ = "replace" | StringPiece |
replace_control_characters_ = false | bool |
replacement_char_ = 65533 | int64 |
Fungsi publik | |
---|---|
Errors (StringPiece x) | TF_MUST_USE_RESULT Attrs Kebijakan penanganan kesalahan ketika ditemukan format yang tidak valid pada input. |
ReplaceControlCharacters (bool x) | TF_MUST_USE_RESULT Attrs Apakah akan mengganti karakter kontrol C0 (00-1F) dengan replacement_char . |
ReplacementChar (int64 x) | TF_MUST_USE_RESULT Attrs Titik kode karakter pengganti yang akan digunakan sebagai pengganti format yang tidak valid pada input ketika errors='replace' . |
Atribut publik
kesalahan_
StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"
ganti_kontrol_karakter_
bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false
pengganti_char_
int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533
Fungsi publik
Kesalahan
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors( StringPiece x )
Kebijakan penanganan kesalahan ketika ditemukan format yang tidak valid pada input.
Nilai 'strict' akan menyebabkan operasi menghasilkan kesalahan InvalidArgument pada format input apa pun yang tidak valid. Nilai 'ganti' (default) akan menyebabkan operasi mengganti format yang tidak valid pada input dengan titik kode replacement_char
. Nilai 'abaikan' akan menyebabkan operasi melewatkan format apa pun yang tidak valid pada masukan dan tidak menghasilkan karakter keluaran yang sesuai.
Defaultnya adalah "ganti"
GantiControlCharacters
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters( bool x )
Apakah akan mengganti karakter kontrol C0 (00-1F) dengan replacement_char
.
Standarnya salah.
Defaultnya salah
PenggantianChar
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar( int64 x )
Titik kode karakter pengganti yang akan digunakan sebagai pengganti format yang tidak valid pada input ketika errors='replace'
.
Titik kode unicode apa pun yang valid dapat digunakan. Nilai default karakter pengganti unicode default adalah 0xFFFD atau U+65533.)
Perhatikan bahwa untuk UTF-8, meneruskan karakter pengganti yang dapat diekspresikan dalam 1 byte, seperti ' ', akan mempertahankan penyelarasan string ke sumber karena byte yang tidak valid akan diganti dengan pengganti 1 byte. Untuk UTF-16-BE dan UTF-16-LE, karakter pengganti 1 atau 2 byte apa pun akan mempertahankan penyelarasan byte ke sumbernya.
Defaultnya adalah 65533