เทนเซอร์โฟลว์:: ปฏิบัติการ:: UnicodeTranscode:: คุณสมบัติ

#include <string_ops.h>

ตัวตั้งค่าแอตทริบิวต์เพิ่มเติมสำหรับ UnicodeTranscode

สรุป

คุณลักษณะสาธารณะ

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

งานสาธารณะ

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
นโยบายการจัดการข้อผิดพลาดเมื่อพบการจัดรูปแบบที่ไม่ถูกต้องในอินพุต
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
ว่าจะแทนที่อักขระควบคุม C0 (00-1F) ด้วย replacement_char หรือไม่
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
จุดโค้ดอักขระทดแทนที่จะใช้แทนการจัดรูปแบบที่ไม่ถูกต้องในอินพุตเมื่อ errors='replace'

คุณลักษณะสาธารณะ

ข้อผิดพลาด_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

แทนที่_ควบคุม_อักขระ_

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

เปลี่ยน_ถ่าน_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

งานสาธารณะ

ข้อผิดพลาด

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

นโยบายการจัดการข้อผิดพลาดเมื่อพบการจัดรูปแบบที่ไม่ถูกต้องในอินพุต

ค่า 'เข้มงวด' จะทำให้การดำเนินการสร้างข้อผิดพลาด InvalidArgument ในการจัดรูปแบบอินพุตที่ไม่ถูกต้อง ค่า 'replace' (ค่าเริ่มต้น) จะทำให้การดำเนินการแทนที่การจัดรูปแบบที่ไม่ถูกต้องในอินพุตด้วย codepoint replacement_char ค่า 'ละเว้น' จะทำให้การดำเนินการข้ามการจัดรูปแบบที่ไม่ถูกต้องในอินพุต และไม่มีอักขระเอาต์พุตที่สอดคล้องกัน

ค่าเริ่มต้นคือ "แทนที่"

แทนที่อักขระควบคุม

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

ว่าจะแทนที่อักขระควบคุม C0 (00-1F) ด้วย replacement_char หรือไม่

ค่าเริ่มต้นเป็นเท็จ

ค่าเริ่มต้นเป็นเท็จ

ถ่านทดแทน

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

จุดโค้ดอักขระทดแทนที่จะใช้แทนการจัดรูปแบบที่ไม่ถูกต้องในอินพุตเมื่อ errors='replace'

สามารถใช้จุดโค้ดยูนิโค้ด ที่ ถูกต้องได้ ค่าเริ่มต้นคืออักขระแทนที่ Unicode เริ่มต้นคือ 0xFFFD หรือ U+65533)

โปรดทราบว่าสำหรับ UTF-8 การส่งอักขระแทนที่ที่แสดงเป็น 1 ไบต์ เช่น ' ' จะคงการจัดแนวสตริงไว้ที่ต้นทาง เนื่องจากไบต์ที่ไม่ถูกต้องจะถูกแทนที่ด้วยการแทนที่ 1 ไบต์ สำหรับ UTF-16-BE และ UTF-16-LE อักขระแทนที่ 1 หรือ 2 ไบต์ใดๆ จะรักษาการจัดตำแหน่งของไบต์กับแหล่งที่มา

ค่าเริ่มต้นคือ 65533